双字组合与词典收条,本文主要内容关键词为:收条论文,组合论文,词典论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
语言词汇中由两个字组合而成的单位,我们称之为双字组合。(注:字和语素、词有着质的不同,这一点早已成为汉语语言学界的共识。然而,现代汉语中的语素不但未必就是单音节的构词成分,而且还可能是非构词成分,词更不以单音节为常,因此,字在现代汉语词的构成中仍不失为一个有用的概念。)双字组合在现代汉语中很常见,根据我们的统计,《现代汉语词典(修订本)》(商务印书馆,1996,北京;以下简称《现汉》)收条目凡58481个, (注:这个统计数字是在排除了异体性的单位(如“飘渺”和“缥缈”,“耿直”“梗直”和“鲠直”)和纯由拉丁字母构成的单位(如“CD”“KTV”)之后得出的。 )其中单字有8795个,约占总数的15.039%,如“捋”“神”“秃”“也”;三字组合有4910个,约占总数的8.396%, 如“图书馆”“小气候”“羊肠线”“运动量”;四字组合有4798个,约占总数的8.204%, 如“所向披靡”“默默无闻”“康庄大道”“高等动物”; 五字组合有218个,约占总数的0.373%, 如“国家所有制”“无后坐力炮”“脚踩两只船”“小巫见大巫”;六字组合有104个,约占总数的0.178%,如“有过之无不及”“真金不怕火炼”“政治协商会议”“自由落体运动”;七字组合有48个,约占总数的0.082%, 如“按下葫芦浮起瓢”“不见棺材不落泪”“打开天窗说亮话”“国际日期变更线”;八字组合有50个,约占总数的0.086%,如“巧妇难为无米之炊”“百尺竿头, 更进一步”“兵来将挡,水来土掩”“成也萧何,败也萧何”;九字组合有7个,约占总数的0.012%,如“搬起石头打自己的脚”“第二次国内革命战争”“冰冻三尺,非一日之寒”“司马昭之心,路人皆知”;十字组合只有2个,约占总数的0.003%,是“留得青山在,不怕没柴烧”“只要功夫深,铁杵磨成针”;十二字组合只有1个,约占总数的0.002%,是“只许州官放火,不许百姓点灯”。将以上统计数字加合起来,双字组合之外的单位共计18933个,约占该词典收条总数的32.375%。 而双字组合有39548个,约占该词典收条总数的67.625%。 由上述统计数字不难看出双字组合在现代汉语中占有绝对的优势。
二
双字组合占绝对优势,是汉语词汇由古代发展到现代的一个显著的变化,也是现代汉语词汇的一个重要特征。汉语词汇的古代形式与今天是不大一样的,根据对赵诚先生编著的《甲骨文简明词典——卜辞分类读本》(中华书局1988, 北京)的统计, 我们发现该词典收条总数为2050个,其中多字组合单位只有461个,仅约占总数的22.49%,单字有1589个,约占总数的77.51%。 如果我们把历史的时针再上推到史前文明时期,更可推断当时的汉语的多字组合单位是无法与单字单位相匹敌的。
汉语词汇由单字单位发展成为多字组合单位,主要有如下两种方式:一,将无意义的字组合拼接起来成为一个有单纯意义的组合体;二,将有意义的字组合拼接起来成为一个有合成意义的组合体。语言中以无意义的字组合拼接而成的有单纯意义的组合体,可称为字组。以两个无意义的字组合而成的双字组分两种情况:一是音译外来词,二是连绵词。音译双字组在现代汉语中并不占很大的比例,《现汉》只收有227个, 仅约占双字组合单位的0.574%, 如“舍利”“安培”“分贝”“弥撒”;(注:《现汉》中收入的音译字组当然不仅限于双字的,还有三字的82个,如“马拉松”“荷尔蒙”“华尔兹”“开司米”,四字的12个,如“布尔乔亚”“阿弥陀佛”“法西斯蒂”“罗曼蒂克”,五字的1个,是“布尔什维克”,六字的2个,是“英特纳雄耐尔”“普罗列塔利亚”。)连绵双字组在现代汉语中也很有限,《现汉》收有293个, 仅约占双字组合单位的0.741%,如“斑斓”“彪炳”“轱辘”“孑孓”。 (注:这里把叠音单语素词(如“饽饽”“猩猩”“狒狒”“蝈蝈”)也计入连绵双字组。)语言中最具优势的是以有意义的字组合拼接而成的有合成意义的组合体。有意义的字被叫做语素,因此以有意义的字组合拼接而成的有合成意义的组合体,可称为语素组。以两个语素拼合而成的双语素组,即通常所谓的由两个语素构成的合成词。双语素合成词,《现汉》收有39028个,约占98.685%, 如“阿斗”“蔼然”“爱恋”“案牍”。(注:双语素合成词,既包括上面所举派生词和复合词,也包括一些待嵌格式,如“半…半…”“不…而…”“千…万…”“一…二…”“大…特…”“连…带…”“一…就…”“道…不…”。这样的待嵌格式《现汉》收有33个。)这说明,汉语双字组合词汇单位由古而今的发展不主要取一语素双音节的形式而主要取双语素双音节的形式。(注:一些人所认定的双字组合有些未必就是单语素单位,如近人符定一编撰的《联绵字典》所收的条目,大多数并不是连绵词而是合成词,如“徭役”“伯仲”“劳神”“大人”“参与”“凡庸”“大寒”“今昔”。)
三
一语素双音节的词汇单位被视作词而为词典收入,应该无人会持异议。这样的例子有很多,如连绵词“窈窕”“忸怩”“嶙峋”“踉跄”,外来词“逻辑”“坦克”“拷贝”“杯葛”。再进一步看,无论是三个、四个,甚至更多个音节形式,只要它们所代表的是一个语素,就都可没有争议地被划归词的行列,刘正埮、高名凯、麦永乾、史有为四位先生合作编纂的《汉语外来词词典》(上海辞书出版社1984)就收有三音节一语素的“萨其马”(满:sacima)、四音节一语素的“普鲁卡因”(英:procaine)、 五音节一语素的“额勒玛第加”(拉丁:grammatica)、六音节一语素的“摩诃质帝萨埵”(梵:mah ācittasattva)、七音节一语素的“海图鲁代讷密斯”(英:hydrodynamics )和八音节一语素的“克拉维辰巴达牟尔”(英:clavicembal d'amour)。
双语素双音节的单位被看作是词而为词典收入,似乎也无太大争议,如果构成该单位的某一个音节形式所代表的语素是不自足的。像“酒吧”“啤酒”“沙皇”“按蚊”,就都属于此类。再进一步看,无论是三个、四个,甚至更多个音节形式代表两个语素,只要其中的某一个语素是不自足的,由这两个语素所构成的单位也就可以被视为词。这样的例子在《汉语外来词词典》中也可以看到很多,如三音节双语素的“登革热”(英:dengue fever ), 四音节双语素的“喀萨克车”(蒙:xasagtereg),五音节双语素的“客斯客斯油”(英:cuscus oil), 六音节双语素的“沙托-马尔高酒”(法:Chateau Margaux), 七音节双语素的“马赛尔·考比伦杯”(英:Marcel Corbillon Cup)和九音节双语素的“波罗尼密婆舍跋提天”(梵:paranirmi tavasavartin)。
上文所列举的语素有的并非典型的汉语语素;典型的汉语语素的语音表现是一个音节、书面表现是一个汉字。倘若一个单位由两个典型的汉语语素构成,那么这所构成的单位是词还是非词就成了问题。词典对收与不收双字组合为条目,似乎存在着三种可供选择的方案:一是都不收,即仍像古代的字典那样以单字为收取对象,而把任何双字组合都看作是两个词;二是都收,举凡语言中连用在一起的单位都视为词;三是酌收,即不认为凡连用在一起的单位都是词,而认为只其中的一部分才有词的资格。凡连用在一起的单位都不视为词的做法,与发展至今的汉语的实际不合。不光在古代汉语中连用的双字组合有不少已不可拆开来使每个成分独立使用(如“疆场”“奖挹”“排奡”“朔望”),或者一旦拆开来各个成分的意义已未必能与组合后单位的整体的意义相吻合(如“露布”“清婉”“锁钥”“司南”),(注:王宁先生在谈到现代汉语合成词的确定时指出:“现代汉语双音词与词组的区别,应严格按其是否能依据现代语法结构并按其词素的字面意义分开解释为标准。拆开后确实已经无法用两个词素的意义简单相加来解释的双音词,可确定为已结合成熟的词。”王宁先生还具体提出了现代汉语合成词确定的四条标准。详见彭聃龄1997。)现代汉语中新造的一些单位也是一开始就以双字组合的身份出现的(如“套汇”“党组”“心态”“板寸”)。凡连用在一起的单位都视为词的做法,既不符合实际,所收的条目也难为任何一部词典所容纳。正确的做法只能是根据语言的实际情况对连用在一起的单位进行甄别,符合某些条件的可视为词而收入,不符合某些条件的不视为词而不予收入。但是,究竟符合哪些条件的双字组合单位算是词,不符合那些条件的双字组合不算是词,就成了问题。
随着历史的发展,单字词在现代汉语中已不占主导地位;在现代汉语中占主导地位的已是双字词。这一点,从上面的统计数字上不难看出。应该说,把双语素双音节组合视为词的单位,我们先人的认识是伴随着词汇的发展而有一个渐进的过程的。这从汉语史上可以看得很清楚,如先秦典籍中出现了“夫人”“后生”“谗言”“京师”,《世说新语》中出现了“遇害”“起事”“罗列”“凋敝”,敦煌文献中出现了“破除”“非分”“北斗”“借问”,宋元时代的作品中出现了“包子”“阵脚”“护膝”“卖嘴”;清人纂辑成的工具书中更有大量此类单位,如翟灏的《通俗编》收有“事件”“师兄”“医生”“干笑”“齿冷”“谈柄”“心肝”“毒手”等单位,梁同书的《直语补证》收有“手段”“破钞”“纣棍”“大虫”“路祭”“月牙”“白酒”“院子”等单位,钱大昕的《恒言录》收有“年纪”“少年”“花甲”“气节”“夸张”“明白”“清高”“稳当”等单位,陈鳣的《恒言广证》收有“自在”“长久”“快乐”“平安”“骨气”“面貌”“血气”“情态”等单位。这些单位之被收入书中,说明它们在著作者、纂辑者眼里是与“风花雪月”“因祸得福”“非驴非马”“安步当车”等单位具有同样的词汇单位的身份的。到近代,符定一之所以在《联绵字典》中把大量的非连绵词收入其中,怕也与他开始把双语素双音节单位视为一个凝定的词而不再视为两个词的认识有关。而一个双语素双音节单位究竟是词还是非词或者是过渡状态中的准词,判断起来有时是一个非常棘手的问题。先秦典籍中有“公田”“人臣”“新声”“强毅”“温其”“载路”“假哉”“斯频”等,《世说新语》中有“色养”“骄汰”“开美”“君章”“贵游”“衿契”“目精”“觉损”等,敦煌文献中有“厥错”“觅曲”“升常”“退故”“招交”“拥搭”“阳焰”“忆逼”等,宋元时代的作品中有“上茅”“分定”“动劳”“私休”“同产”“刚捱”“阵马”“坡撇”等,它们都不被今人视为词。清人作品中收入的一些单位如今看来也未必就是词,如《通俗编》中收入的“手滑”“蒜发”“了鸟”“后溲”“游谈”“眼语”“沫饽”“砚瓦”,《直语补证》中收入的“笨人”“火囤”“发酒”“乡风”“一积”“累重”“市买”“解交”,《恒言录》中收入的“寒温”“奔竞”“招权”“不好”“令兄”“家叔”“尊府”“忝眷”,《恒言广证》中收入的“小妻”“表弟”“客作”“贵郡”“监临”“干证”“混堂”“米囤”。即使《联绵字典》中所收的单位也不敢说都是词,如“偶语”“两端”“凶札”“剿绝”“厚善”“古也”“同异”“嚣顽”。当然,上面所举例中有的单位是古代的词而不用于现代汉语,因而给我们的感觉它们不具词的单位的资格;但是更多的则在古代汉语中也未必是词,那些著作把它们视作词,仅仅是根据著作者、纂辑者自己对词的认识而已,不一定得到所有的人的首肯的,否则能为某部书收入的词就会也为其他所有的书收入了。到现代,权威的《现代汉语词典》所收的单位是否都能得到所有的人的认可,也是需要研究的。如该词典收入了以虚语素“着”缀附而成的词“向着”,却没有收入同类的单位如“背着”等。也许会有人说“向着”除有“朝着、对着”义外,还有“偏袒”义,因而是词;而“背着”等没有“向着”的“偏袒”那样的转义,因而不是词。但是,该词典却并不总是以有转义则收无转义则不收为原则的,一些似乎本该收入的词而没有被收入。如该词典收入了“洋车”“洋铁”等而未收“洋火”,收了“船长”等而未收“机长”,收了“适当”“恰当”等而未收“适切”“恰切”,收了“瓶装”等而未收“罐装”,收了“预知”“预卜”等而未收“卜知”,收了“艳福”“外遇”等而未收“艳遇”,收了“斧正”“哂纳”等而未收“哂正”,收了“聚齐”“集合”等而未收“集齐”,收了“雏鸡”等而未收“雏燕”,都使人感到该词典的编者在编纂词典时所据标准似乎并不十分严格和一律。
四
其实,一部词典收了哪一个单位作条目而没有收另外的单位作条目,自有该词典的编者的理论考虑。任何一部词典的编纂者之所以在所编纂的词典中收了某个单位作条目,是因为在他们看来该单位已具有了词汇单位的资格;之所以没有把某个单位作为条目收进其所编纂的词典中,是由于他们不认为该单位已具有了词汇单位的资格。在此问题上,旁人似乎不宜随意评头论足,妄加臧否;更何况理论本身也未必已十分完善,准此作出的条目取舍的安排也自然而然的会有这样或那样的不尽如人意之处。然而,汉语词汇学对词的确定的研讨已历多年,应该拿出一个令多数人可以接受的方案来了。即使所拿出的方案尚不能说服所有的人,至少在使理论深化这一点上还是有益的,有助于启发人们进一步的思考。
汉语词汇学在词的确定上所取的理论最早是深受苏联语言学影响的,五六十年代影响最大的一点就是看词的同一性和分离性。以同一性和分离性来进行词的确定,确能使词以词位的身份确定下来,使词组与词分别开。对汉语这样多以字为语素而充作词的构件的语言,究竟哪些字的组合算是词哪些字的组合不算是词,词的同一性和分离性理论也确实有一定的理论指导意义。但是,汉语毕竟不同于创造出词的同一性和分离性理论的西方语言,字与字的组合未必能从句法的组合规律上得出多少解释性;(注:参考刘叔新1990a。 )汉语词的构成更多的依赖的是字与字意合的融合性。(注:参考徐通锵1997。)由于汉语词汇历史上单音节的性质,汉语的一个字在现代只要它是能够独立自由地使用的,就都仍旧是词;如果它是不能够独立自由地使用的,就认为它代表一个语素(如“民”“皿”“睫”“惘”),或者代表一个音节(如“玻”“璃”“琵”“琶”)。这一点无论谁都不会怀疑。汉语字的典型形式是单音节的,这导致人们在看待字时容易把注意力集中在它的意义内容上而不大去关注它的语音形式。一个词汇单位只要它所表达的是一个意义,无论它有多少个音节来表现,就都会被认为是一个词。(注:从理论上说,一个词可由无数个无意义的汉字组合而成,实际上人的大脑对无意义的汉字组合的记忆是有一定限度的,因此而造出的无意义的汉字组合体的长度也是有一定限度的。叶绚、曹日昌、陈光山、叶顺和1980认为:“无意义联系汉字的视、听同时记忆广度(瞬时记忆最大值)约为5 个字。”)因此,单纯性质单位中的连绵性的单位也好,外来性的单位也好,都毫无疑义地被看作是词——连绵词和外来词。两个或两个以上的字的组合能否算作是词,成了汉语词汇学上颇有争议的一个问题。争议主要集中在两点上:词与自由词组的关系,词与固定词组的关系。词与固定词组的分野似乎很难只根据意义的标准来进行,(注:有人以有所谓表义的比喻性来确定惯用语,如高歌东1986;有人以有所谓表义的比喻性来确定成语,如刘叔新1982。但是词也有不少是有表义的比喻性的,如“风尘”“黑锅”“焦炙”“浪潮”“参商”“挑刺”“兔脱”“碰壁”。这说明表义的比喻性并非某一类词汇单位专有的性质特点,不能据以将词与他类词汇单位分别开。)因为表义的比喻性并不专属于固定语,也不专属于词。可以考虑结合使用形式的标准,比如可以一个字一个音节的形式为一个计量单位,一定限量内的字的组合体可以算作词,超过一定限量的字的组合体可以看作是固定词组。(注:我们认为,双语素双音节的结构是汉语的词的典型结构,此外就是三语素三音节的结构;而四语素四音节的结构和四语素四音节以上的结构则宜看作是语的结构。参考周荐1998b。)从我们的统计看, 双字组合在现代汉语中比单字和其他多字组合所占比重都大,是一种强势组合,最具成词的能力。词与自由词组的分野,可以考虑组合成分间的融合性。所谓融合性主要是看如下两点:一,组合体中的成分是否具有较为自由的游离性;二,组合体是否具有较为完整的整体意义。组合体中的成分具有较为自由的游离性的,我们就认为该组合体融合性较弱,反之就认为较强;组合体中的成分虽具一定的游离性,但所构成的组合体具有完整的整体意义,我们也认为该组合体融合性强,反之就认为较弱。根据融合性强弱的不同而可以将字所构成的单位分别为三种情况:成分间融合性强的,可以视为词,如《现汉》收入的“猪鬃”“羊绒”;成分间融合性弱的,可以视为自由词组,如《现汉》未予收入的“猪肉”“羊腿”;成分间的融合性不强不弱的,说明该单位还不是词或尚处于词化的过程中,从发展的角度看可以视之为准词,如《现汉》未收而引入质疑的“适切”“哂正”等。当然,根据融合性强弱分析出来的单位未必就适应于一切词典:有的融合性强的单位,因其属于方言就只能被收列于方言词典而不能也收列于共同语词典;有的只在某个方言显现出融合性,就只是属于该方言的词典,不在另外的方言中显现出融合性,就不属于另外方言的词。同理,所以会出现古人眼中是词而在今人眼里不是词的双字组合的情况,是因为古人认为该双字组合具融合性而今人认为它不具有融合性;反过来也一样,所以会有今人眼里是词而古人眼中不是词的情况,是由于今人认为该双字组合具有融合性而古人不认为它具融合性。