【新语丝电子文库(www.xys.org)】 ———————————————— 异议米阿伦“中文空格”论 水银   惊读了米兄的中文空格论,实难苟同,即兴应作。   米兄该文涉及到两个方面:中文文字结构和中文数据处理。在文字结构方面, 谈到中文词界的实际存在和词界混淆而产生歧义的可能;在数据处理方面,谈到 词界在文字排序、词句查询和自动翻译领域的重要性。这些分析,均不难理解; 但由此而推论中文书写须加空格,则未免过急了。   从文字数据处理方面来看,文字是主体,数据处理是为文字服务的一种方式。 为了数据处理的方便而改变文字的形式,显然是本末倒置。可惜这种思维方式, 确是当今的一种时代通病。提高数据处理的质量,永远应从加强对处理对象的分 析,从而改进处理方式着手,决不该走篡改处理对象本身这类“捷径”。正如英 文拼写与发音不一致这一特征,为其数据处理不知带来了多少困难。但几十年的 研究下来,英文语音处理终于基本实现,而其间困难不前的时候,也并没有提出 过英文改写之类的“惊人妙招”。电脑中文分词,目前尚在起步阶段,困难是必 然的。因为这几年的困难,去人为地强求改变国人成百上千年的习惯,实在有些 短见。   从语言文字结构方面来看,中文“词界”与印拉文字“词界”概念不同。以 英文为例,在语言结构上它的词只相当于中文的字,而中文的词则相当于它的词 组。实际上,现代汉语语法中没有词与词组(又称短语)的区分:不可差分的基 本单位是字、少数固定词(如蝴蝶)和外来词(如沙发);所有可差分的结构都 称为词组,词、短句和句是词组的不同形式。中文的方块字,自然分界;词无界; 短句和句以标点为界。英文的词以空格为界;词组同样无界;分句和句也以标点 为界。因而从书写结构上看,中文和印拉文字是一致的。米兄提出的因词界混淆 而偶尔产生的歧义,在印拉文字中同样间有出现:He turns on the fridge. 可 以断成 He (turns on) the fridge. 或 He turns (on the fridge). 无论哪种 语言,都有改变词句顺序、补充标点、增加副词等多种文字技巧,用以避免这类 少数情况的出现:He turns the fridge on. He turns, on the fridge. 他到台 湾国的中学去作报告。他到台湾的国中去学作报告。如果仅为这类少有而又不难 避免的歧义去增加空格,岂非过份小题大作。   由此而见,米兄所提到的几个问题,均不能成为中文增加空格的理由。语言 文字,相约成俗,若非绝有必要,万难强改。这一点,不必查阅各语言文字史, 也显而易见。几次的汉字拼音化运动,皆以失败告终,正该引以为戒。 二○○○年一月二十一日于德国 ———————————————— 【新语丝电子文库(www.xys.org)(www.xys2.org)】