汉语现代化中的词意识问题(一)
详细内容
一、词在语言中的地位
1.1语言和词
语言是人类特有的用来表达和交流思想的信息工具,是语音和语义结合的复杂的符号系统。世界上有几千种语言。这些符号系统各不相同4却都有一个共同的特点:它们的基本单位都是词。
词是语音中最小的自由的声音和意义结合的实体单位,是语言的基本单位。例如汉语的“水”、“学习”,英语的“water”、“study”。它们是能够独立运用的最小单位,如果再分解成更小的语素就不自由了。例如“学习”这个词可以分解成“学”和“习”两个语素。“学”是成词语素,可以独立运用,组成“学知识”、“学雷锋”等词组。但是“习”只能与其他语素共同构成词语,例如“学习”、“练习”等。因此,“学习”这个词是语言运用中的最小单位,是由两个字记录的双音节“词”。
口语以词为基本单位,从平常的说话当中可以感觉到“词”的存在。比如“中华民族是伟大的民族”这句话在口语中的存在形式是“中华民族是伟大的民族”。词与词之间存在明显的语音停顿,词内的语素则结合得相对紧密。人们说话总会自觉地在脑海中进行分词,然后有条不紊地说出来,这样说话才有条理,别人才听得懂。
但是,我们在汉语书面语中却看不到词。由于汉语书面语采用字式书写,只有字距,没有词距,词的形式被淹没,导致人们只知道有字,而不知道有词,误认为汉语是由字组成的。“人们不能清醒地意识到自己口语中的‘词’,就是汉字作用的结果。”[5]这是中华民族几千年来没有形成词意识的主要原因。
尽管很多中国人对“词”说不清楚,但是每个人的语感中又确实存在模糊的词感。对于“现在”、“马上”、“自己”、“自来水”、“巧克力”等这些双音节和多音节的字组,他们不会一个字一个字地拆开辨认,再合起来理解和使用,而是很自然地看成一个整体。这恰好证明“词”这样的语言单位的客观存在性。我们提倡加强词意识,只是使人们能够保持学习书面语以前就存在的词的认识能力。
树立词意识,首先要能够辩别什么是词。现在通用的方法是造句法和插入法。“造句法”是1938年陆志韦在《国语单音词词汇》[4]中提出来的,用来区分词和语素。例如:“人民”可以拆分成为“人”和“民”两个语素,这两个语素不能颠倒次序,也不能在中间插入其他语素。而“人民”可以独立地自由运用。例如“中国人民站起来了。”“党领导人民当家作主。”所以“人民”是一个词,不是不成词语素。1994年王力又在《中国现代语法》[7]中提出“插入法”,区分词和词组。例如:“白菜”不能说成“白色的菜”,而“白纸”可以说“白色的纸”,因此“白菜”是词,“白纸”是词组。
1.2词和字。
“词”是语言的实体单位。“字”是语言的形式单位。字和词是不同平面的性质不同的单位,它们之间是记录与被记录的关系。古代汉语是词文字,基本上一个字记录一个词。随着汉语词的多音节化发展,记录一个词最少用一个字,更多的词用字组[6](P223)记录。
受传统的“字本位”意识的影响,有的人认为“词”是由“字”组成的,“字”是语言系统的基本单位,因此学习汉语只要掌握三千多个字就可以了。事实上不是这样。这三千多个“字”实际上是三千多个单音节语素,是构成词语的原始级语符。它们构成了《现代汉语词典》里5万多个活的词。这些活的词语才是语言使用中的基本构件单位。人们学习语言,运用语言和分析语言都以“词”为单位而不是“字”。
英语的“词”在人的直观感觉上是现成的。相反,汉语的“字”是现成的。有人把英语的词距误认为字距,把英语的“词”和汉语的“字”等同起来,认为英语的“字”(实际上是词)比汉字多得多。这种观念严重地混淆了字词的界限。应该明确,英语的“字”是26个拉丁字母(A.B.C.D……),这些字母组成的成千上万的字组记录的才是英语的“词”。“英语字典”应该叫做“英语词典”。
1.3词和音节
音节是最小的自由的语音单位,也是听觉上最容易分解的语音单位。汉语音节独立性强,音节中的音素结合紧密,音节之间界限明显,每个音节都有声调(轻声音节除外)。在书面形式上,基本上一个字对应一个音节,除了部分儿化音节,如“花儿”读作“huār”,两个汉字对应一个音节。
根据音节数量的多少把现代汉语的词语分为单音节词、双音节词和多音节词。人在说话的时候,是一个词一个词地说,表现在语音上就是许多音节以词的方式连续起来说,形成语流。语流中,音节不是一个个独立的,而是以词的方式组合成音组,具有整体感。因此,说汉语和别的语言一样,语音中总是流动着韵律与节奏。
语音中的音节或者字在语流中的节奏不同或者从属的词不同,具有区别意义的作用。例如“这水果真凉”按照不同的音节划分可读成“这水果真凉”和“这水果真凉”,前后意思完全不同。实际上这是分词不同的结果,在语音形式上就表现为音节节奏的不同了。
二、汉语发展促使词意识觉醒
2.1汉语的词多音节化、多字化
古代汉语中单音节词占绝对优势,因此被叫做词文字。发展到现代汉语,单音节词只有2000多条,数量比较稳定,而多音节词有5万多条,还在不断增加。[12]汉语的词明显地朝着多音节化多字化发展。所以现代汉字只能叫做语素文字。
从外因看,社会发展,新事物层出不穷,中外交流日益密切促进了汉语词汇的发展。一些单音节的基本词在原来的基础上派生出许多新词。例如从“人”这个单音节词派生出的多音节词,古代有“寡人”、“鄙人”等,现在有“人民”、“人格”、“人行道”、“人造革”等等。外来词“托福”、“咖啡”、“迪斯科”、“冰激凌”、“维他命”、“爱滋病”等构成宠大的多音节词家族。
从内因看,汉语语音系统从古代到今天发生了复杂的变化,总的趋势是简化。由于语音简化而形成的同音的单音节词太多,影响语言的交际功能。虽然在书面语中可以靠汉字的形体区分同音词,但是在口语中很难分辨。《施氏食狮史》[10]的故事就是一个很极端的例子:
“石室诗士施氏,嗜狮,誓食十狮。氏时时适市视狮。……”
刚一听,不知所云。用现代汉语的多音节词替换部分词语,改成:
“石头屋子里的诗人姓施,爱好狮子,发誓吃掉十头狮子。姓施的人常常去市场看狮子。……”
这样一听就明白了。古代汉语的语音系统复杂,单音节词的同音现象不多。但是随着音系简化,这些原来不同音的单音节词的读音逐渐相同,因此用现代语音读很难区分它们。势必要求延长词的形式,增加词的音节数量来弥补,以区分词义。因此,词的多音节化是为了适应音系发展的必然趋势。
2.2“词”和“字”的术语分工
古代汉语把“词”叫做“字”,没有词的术语。吕叔湘先生曾经说过:“咱我过去管它叫‘文字学’的却是内容极其广泛的一门学问,……几乎等于语言学了。”[3]“字正腔圆”中的“字”实际上是“音节”。人们常说的“字义”应该是“语素意义”或者“词义”。字只是一种图形,本身没有声音和意义。文字记录口语,所谓的“字的形体、声音、意义三要素”中的“声音和意义”不过是字记录的语言单位具有的声音和意义的“折射”。
直到1907年章士钊在《中等国文典》[9]中第一次在文言文基础上明确区分字和词:“一字可为一词,而一词不必为一字。”可以是一个字记录一个单音节词,也可以几个字记录一个多音节词。
现代语言学进一步明确了两者的分工。“词”属于形式结合内容的语言实体符号层面,同时管声音和意义。“字”属于语言的视觉形式层面,作为语音形式的辅助形式只管形体。“字”和“词”是语言系统两个不同层面上的概念,不能完全重合。例如“漂亮”是两个字,记录口语中的"piaoliang"这一个词,意思是“好看的,美观的”。还有多个字记录一个词语的,例如“单眼皮”、“胆小鬼”、“蛋白质”、“小不点儿”、“歇斯底里”等等。相同的字还可以记录不同的词,比如“花”这个字记录两个不同的词,一个是“花朵”的“花”,另外一个是“花钱”的“花”。类似的还有“长(chang)――长(zh?ng)”,“黑人(黑色人种)――黑人(没有户口的人)”等等。
2.3词式书写的提倡
20世纪以来,现代语言学已经初步建立了词意识,这种意识体现在书面形式上就是词式书写。词式书写又叫做词连写[6](P224)。与字式书写相区别,就是按照词的方式书写,在字距之外还要体现词距,使词与词之间有明显的距离。英语就采用词式书写,例如“Tomorrowisanotherday.”可是要汉字也实行词式书写,有些人不能理解。好好的搞什么词式书写?没见过,也不想多此一举,按平常那么写不也挺好的吗?事实上词式书写的要求已经迫切地摆在我们面前了,势在必行。
第一,词式书写是汉语书面语进一步改革的重要过程。汉语书面语经过了历次改革才逐渐形成今天的格局。从右起竖排到左起横排。标点符号从没有到有,而且越来越完善。这些变革使书面语不断完善、科学化,以适应社会发展的要求。词式书写是书面语改革的进一步发展,是经过科学研究的适合汉语现代化的一种新形式。
第二,从语言本身的规律来看,词是所有语言表达意思的基本单位。虽然汉语书面语不分词,但是人们在阅读的时候必须在心中默默分词,叫做“分词连读”。词式书写是尊重口语实际的做法,把“分词”这种语言行为直接体现在书面形式上,以便人们在视觉上有效地获得语言信息。尤其是现代汉语双音节词占优势,多音节词大量增长,词式书写可以提高阅读效率,并且排除歧义。
第三,词式书写是信息时代对书面语的新要求。当今时代信息技术高度发达,电脑网络以惊人的速度发展着,磁盘和光盘成了纸张以外最重要的语言载体,并且在不久的将来很可能取代纸的地位。在经济发达的北京、上海、广州等城市,有很多人几乎完全依赖于电脑而不习惯动手写字了。词是计算机进行检索和分析等中文信息处理工作的基本单位。电脑不比人脑,不具备人的经验,也没有语感,它不会自己分词。人们必须给它设计一种程序,使它能自动分词。这个工作十分复杂,要耗费大量的人力物力,而且效果也不如意。实行词式书写能绕过这个技术难题,大大提高计算机中文信息处理的速度和准确性。目前大多数人采用拼音输入法打字,以词为单位输入没有同音词的选择问题,能大大提高打字速度。