异形词规范的三个基本性原则——评《第一批异形词整理表(草案)》,本文主要内容关键词为:异形论文,整理表论文,草案论文,原则论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:H042 文献标识码:A 文章编号:0438-0460 (2002)02-0025-08
对异形词的处理是汉语词汇规范的一个重要内容,不少学者就此作过讨论。(注:据《现代汉语词汇规范论文索引》(“全国词汇规范问题学术研讨会”会议材料,2001·厦门,苏新春、余桂林编)初步收集,1980年以来学术界共发表异形词与异体词方面的论文30多篇。)国家语委2001年7月31 日在《中国教育报》上公布了第一批异形词整理表(草案)。这是到目前为止,异形词规范工作作得最深入、最正规的初步成果。笔者结合正在从事的词汇计量工作,对《草案》所入选的429组异形词进行了词次和词频的调查,发现其中存在一些很值得进一步思考的问题。本文以认同词表中所有的异形词为前提,探讨什么样性质的异形词需要规范?如何确定正体与异形的身份?异形词规范的松紧度如何把握?对处在语言动态变化中的异形词应采取怎样的策略?用于调查与验证的语料是2.5亿字正式发表的现代汉语材料。 (注:本文所用语料库由清华大学孙茂松先生提供,特此表示感谢。2.5亿字的语料分布:5000万字为20世纪30至90年代的文学作品语言;2亿字为20世纪90 年代的新闻语言;270万字为科普作品语言。)
一、对《草案》的词频统计与分析
《草案》中异形词的几组统计数据。
1.429组异形词的构成情况
两词一组的有429组,三词一组的有31组,四词一组的有4组,共有词语893词。一组中的第1个词为正体词,对后面的几个词本文分别以异形词A、异形词B、异形词C称之。
2.893个异形词在2.2亿字语料中的词次调查
一个词的词次数在5000次以上的有22个词,在总数893 个异形词中占2.5%,“计划”一词最高,达60809次。未见词例的词语有132个, 在所有异形词中占14.8%。这些词语已显“废用”词语的性质。这里反映的是一个词的“绝对词次数”,它反映了一个词在实际语言中的流通程度。
3.429组异形词中的首词(即正体词)的相对词频
我们把893个词语出现的词次按组排列, 由此来看每个词在本组所有语例中所占的比例,即“相对词频”。相对词频是本文的一个重要观察点,因为正体词与异形词关系的确立都是相互以对方为参照点的。绝对词次数能清楚反映一个个词语的常用度,却不能清楚地反映出同组词相互之间的关系。如“人材”是异形词A,有220个词次,但正体词“人才”却有34982个词次,二者之间的比例是0.6%比99.4%,因此,确立后者为正体词是确凿无疑的。如果单看绝对词次,“人材”并不低,因为在429组中,词次数在220以下的正体词达189个。
正体词在本组内所占比例愈高说明优势愈明显。在99%-100 %的有154个词,占总数的1/3,其中为100%的达101个。 这里把正体词按相对词频的高低分出11级,具体资料见表1。
表1 正体词的相对词频
分级正体词正体词的该级别的正体词在
的数量相对词频429组中所占比例
11 154
99-100%35.9%
10 120
90-98% 28.0%
955
80-89% 12.8%
838
70-79% 8.9%
721
60-69% 4.9%
611
50-59% 2.6%
5940-49% 2.1%
4830-39% 1.9%
3620-29% 1.4%
2110-19% 0.2%
160-9%
1.4%
429组←总数→ 100%
从“11”到“1”显示正体词的相对词频由高到低的排列。按百分比应是10级,这里分的第“11”级是99%-100%之间的数字元,目的是显示其特殊性。
4.429组异形词中的第二词(即异形词A)的相对词频
相对词频愈低,说明这些异形词的使用频率愈低,规范的可行性愈大。但两头的数字可能会显示出一些问题。太低,才1%或2%-3%, 甚至为零,说明这部分词语的规范价值值得考虑;太高, 超过70 %-80%,说明它们仍有很大的使用面,规范起来难度相当大。异形词A 的相对词频在50%以上的为27例,低于1%的有159例,占429组的37.1%。其中为零的是101个词。异形词A的相对词频为零,与正体词的相对词频为100%的数字相对应。
5.429组异形词中的第三词(异形词B)的相对词频
异形词B有31个,其中25个没有一个例句,说明其无流通量; 有一个词却高达70%多。
6.429组异形词中的第四词(异形词C)的相对词频
异形词C有4个,其中1个的绝对词次数为2,另3个词语为零。
以上统计数据显示,429组异形词的规范意见基本上是正确的, 大多数正体词与异形词的关系都能得到词次与词频的支持。一组异形词中的首词(即正体词)的相对词频在50%以上的达93.1%,这就保证了《草案》的合理性、科学性。《草案》“说明”中提出了异形词整理的三条原则,即“文字规范原则”、“通用性原则”、“统筹兼顾原则”。词表中不少异形词的处理体现了优先执行通用性原则的特点。如曾有人主张以文字简省的为正体,而这里却立“轱辘[,129]”为正体词,以“轱轳[,6]”为异形词。(注:词语后面的数字反映的是本文在2.5亿字的封闭语料库中的统计结果。小写数字即该词的绝对词次数,小写百分数为相对词频数。下同。)也曾有人认为异形词的整理当实施偏旁类推的作法,即具有相当偏旁的词都作统一的处理,而《草案》却在“保姆[,1660]”“保母[,6]”“褓母[,0]”“褓姆[,2]”中,以偏旁未统一的“保姆”为正体。
下面就统计资料反映出来的值得进一步思考、推敲的问题谈些意见。
1.正体词与异形词之间“一有一无”的现象
正体词的相对词频在99%以上的有154个,其中100%的为102个。 异形词A的相对词频在1%以下的有159个词,其中为零的有105个。(注:异形词A为零的是105个,比正体词为100%的102个多出3个, 这是因为还有三组词包括正体词在内的词次都是为零的。对正体词为零的现象将在后面再作论述。)这里的计算是相当严格的,已缩小到了一个很小的百分数。在一组异形词中,一个99%以上,一个1%以下, 强者极强,弱者极弱,表示社会的选择性倾向非常清楚,可以说其正异关系已经完全稳定,对这样的词语需不需要规范是值得思考的。词汇规范要解决的首先应该是那些需要规范的词语,而不是对已经稳定下来的词语进行追加式的“盖棺论定”。像这样完全稳定的词语占到429组的1/3 略多,部分选词明显滞后于现实。当然,把它看作是政府制订的第一个异形词规范词表,把俗成的东西经过正式处理,使之成为有法有依的理据,也还是可以的。
2.正体词与异形词的相对词频大致相当的现象
正体词与异形词之间的词频相差愈明显,规范起来就愈容易,但当正体词占有优势,可优势并不大,异形词处于劣势,却仍有相当使用范围的时候,如何处理二者的规范关系,就需要认真考虑了。作为行政部门的语言标准化文件,除了必要性以外,另一个需要考虑的就是规范标准实施起来的可行性。当正体词与异形词的关系处在大体相当的时候,譬如40%-60%之间,这就是规范困难的范围。这时的异形词还有着很好的“社会基础”,对它们实施规范,也就意味着会使社会上近一半的人要改变自己的语言使用习惯。在429组词中,正体词在40%-60 %之间的有20例。对这样的异形词该采取怎样的策略,所探讨的就是异形词规范的最佳对象、最佳范围是什么。
3.正体词相对词频低、异形词相对词频高的现象
词频统计中,正体词低于40%,异体词A、B、C高于60%的词语。 也就是说,作为规范标准的正体词相对词频低,而作为规范对象的异形词相对词频却偏高。低于40%的正体词有21个,高于60%的异形词A 有17个,异形词B有1个。之所以会出现这样的情况,有这样几种可能,或确定正异词中客观性的考察不够,主观语感的因素偏多,或照顾语言自身规律的因素多于语言使用习惯的考虑,或语言本身变化较快,或是本文用来验证的语料偏颇等。由于本文语料库容量较大,且综合性语料多,问题出在后者的可能性小些。
4.正体词的绝对词次数少的现象
正体词的绝对词次低,在10词次以内的达18个词,在1-3词次以内的有8个词,它们是“规诫[,1]”、“溃脓[,1]”、“丫枝[,1]”、“丫杈[,2]”、“绵连[,2]”、“五劳七伤[,2]”、“趟浑水[,2]”、“逗趣儿[,3]”;有三组词连正体词在内没有一个词例:“弥蒙——濛”、“跖骨——蹠骨”、“红果儿——红菓儿”。正体词绝对词次低,而相对词频高,显示这一组词语是僻用、罕用词语;如果它的相对词频又偏低的话,则显示可能是正体与异形之间出现了位置偏误。
这些僻用的正体词还可以通过《现代汉语词典》来作一番验证。《现代汉语词典》收复音词达5万余条,收词规模不小, 而正体词“跖骨”、“溃脓”、“趟浑水”不见于其中;“红果儿”注明是方言词;“弥蒙”“规诫”不见于1983年版,为1996年版新增僻用词。
二、异形词规范应遵循的三条原则
在分析过上面所述较为典型的词次、词频资料后,现在可以就其中所反映出来的一些深层次的问题作些讨论了,这就是异形词的整理与规范的基本原则是什么。
1.俗成性原则
俗成性原则是指根据语言使用的现状来进行规范。它强调语言的使用频度,强调遵从社会成员大多数的使用习惯。在有条件进行科学的词频统计的情况下,首先得重视词频的调查。在一组词内,一个词的相对词频具有特殊价值,高词频者优先,低词频者排后。俗成性与学理性是相对的。强调俗成性原则,则意味着学理性应居其次。在语言发展中,“积非成是”,老百姓“战胜”专家的语言现象比比皆是。应该说《草案》是注意到了这一点的,它就是把“通用性原则”放在“统筹兼顾”原则之前。为什么本文还要强调这一点呢?这是因为《草案》中的不少异形词表明俗成性原则尚未得到完全的遵循,如“号啕[,26.1%] ——号啕[,0.9%]——嚎啕[,72.9%]”,用“号啕”来代替“嚎啕”,其难度可想而知。“号啕”之所以被选为正体,其原因或是因字形简省而被选录,或是受已有辞书的影响。要使异形词的整理与规范成为卓有成效的工作,就必须对俗成性原则予以充分的贯彻,“学理”只能是在二者相持不下的情况下才能起到参考作用。对社会语言使用习惯不是去“强扭”,而是去适应,这应成为异形词规范中一条最根本的原则。
查检已经公布的有关词汇规范文件中,“强扭”的例子并不少见。刘晓梅曾对“树阴——树荫”作过一些辨析:1985年修订的《普通话异读词审音表》作了规定:“荫yìn(统读)——‘树~’、‘林~道’应作‘树阴’、‘林阴道’”。这里不仅规定了“荫”的读音,而且也规范了“树阴”的词形不应写作“树荫”。后来的词典都遵从了这一规定,可这一规定却与广泛流行的计算机汉字输入法有违:五笔型输入法4.5版收“林荫道”,未收“树荫”、“树阴”;微软拼音输入法2.0版收“林荫道”,收“树阴”;智能ABC输入法4.0版收“林荫道”,收“树阴”;拼音加加2.0版收“林荫道”,收“树阴”。 (注:刘晓梅:《林荫道与林阴道》,撰于2001年暑期,曾与笔者作过讨论。本文所引为未刊稿。)
现在我们把“树阴——树荫”放到语料库中进行词次调查,结果是“树阴[,18]”、“树荫[,288]”。为了使检测更集中, 又把“树阴”与“树荫”放到1993、1994、1995、1996四年的《人民日报》中进行调查,结果是“树阴[,4]”、“树荫[,50]”。这个结果不能不让人感到,当初把“树阴”立为正体,把“树荫”立为异形,是一败笔之举。
又如现在把“惟一”定为正体,“唯一”为异形,而它们的实际词次是“唯一[,10214]”,“惟一[,734]”,在1993、1994、1995、1996四年中的《人民日报》,是“唯一[,3736]”、“惟一[,1]”。 语言事实与规范方案出现如此的反差,真叫人大惑不解。
俗成性原则的重要性,就在于它应是异形词规范的指导思想。在异形词规范的诸多方面,如根据绝对词数来选择规范词语的对象,根据相对词频来确定正体与异形词的身份,在推出规范对象的先后顺序上,在规范意见的轻重上,都必须充分考虑到俗成性原则。
为了把俗成性原则落到实处,还需要认真对待测量语料的数量与质量,重视根据语言的动态变化来揭示“俗成”的现状与规律。
2.实用性原则
实用性原则是指异形词规范要根据现实语言的实际与需要,根据现实语言的动态变化来进行。具体说来有两方面的含义:
其一,规范的对象是现实语言仍在使用的异形词。
对那些已经没有正体与异形差异的词语,对那些已经很少用或不用的词语,不应成为词汇规范的主要对象。对前者,要求可以松些,也就是说为了达到全面整理的目的,把曾经有正体与异形差别的词语列入规范词表也无大碍;而对后者,把极少使用的“僻用”、“罕用”或“陈旧”的词语拿来规范,似乎就无甚必要。异形词的规范应该以现在仍在使用的异形词为对象,以常用词语、比较常用的词语为主要对象。由此来衡量,《草案》中不少词显得过旧,而有许多习见的异形词并未收进来。据初步统计,《现代汉语词典》1996年版有六百多组异形词(注:1996版《现代汉语词典》数据库刚刚建成,尚未精校,故这个资料只为大体估测。),为《草案》所收的有160余组,未收的2/3 中有不少就属较为常用的异形词。如《草案》中的正体词在语料库中检得的绝对词次最高的是18177,最低的为0,平均为581,可《现代汉语词典》有,而词次又在1000以上却未收入《草案》的异形词就有“给予[,18177]——给与[,231]”、“身份[,7853]——身分[,743]”、“造型[,2972]——造形[,137]”、“合适[,2965]——合式[,172]”、“冷战[,1983]——冷颤[,19]”、“真相[,1660]——真象[,181]”、“汇集[,1590]——会集[,777]”、“曝光[,1391]——暴光[,10]”、“莫名其妙[,1119]——莫明其妙[,54]”等。以上的正体词不仅常用,而且与异形词在使用频次上也拉开了明显的距离。
超出《现代汉语词典》的范围,常见的异形词也有许多,如“屈服——屈伏”、“直截——直捷”、“呱呱叫——刮刮叫”、“风采——丰采”、“背时——悖时”、“虎踞龙盘——虎踞龙蟠”、“刹车——煞车”、“黑压压——黑鸦鸦”等,这些词语比起那些《草案》中绝对词次为零或廖廖可数的“僻用、罕用”词语,规范的迫切性应该是大得多。
其二,要有动态的词汇规范观。
动态的词汇规范观就是要求根据语言变化的事实来对语言提出规范要求。
首先,要求对历史上的异形词整理与规范的结论结合当代的语料进行考察。异形词的整理与规范工作在现代汉语学界有着比较长的历史。半个世纪前开始编撰的《现代汉语词典》就曾作过大规模的异形词整理,它使用过多种方式来处理异形词。[2]经过几十年后, 当代语言发生了相当大的变化,不少正体词与异形词之间也出现了位置的调换,作为当代异形词整理与规范的意见,对曾有定论的异形词就要有所取舍。虽然《现代汉语词典》1996年出了修订版,有的涉及到异形词的更改,但《现代汉语词典》修订的沿革性非常强,它看重对传统的恪守,因此,原封不动地沿用《现代汉语词典》的异形词材料也就未必合适。上文曾指出过要重视对《现代汉语词典》的利用,要吸收它对异形词整理的成果,但这种吸收必须经过当代语言的验证,看它是不是反映了当代语言的事实。在《草案》所保留、吸收的《现代汉语词典》异形词中有的就有可商榷之处。与其说是《现代汉语词典》当初规范不当,不如说是后来的语言事实发生了变化。上文所议论到的一些例子有的就来自于《现代汉语词典》。
其次,还要对当代新出现,流传面相当广泛的异形词予以足够的关注,如“艾滋病[,2780]——爱滋病[,263]”。这个词开始出现时, 人们认为是由性关系的紊乱造成的,故以“爱滋病”称之。后来人们发现,它不仅通过性传播,还能通过血液制品、母婴遗传、及人体破损伤口、不洁毒品注射针头等多种途径,“爱滋病”的说法并不能准确地反映这种疾病的特点,甚至有可能会出现误导,应以“艾滋病”为规范译名。在专家的呼吁下,这个建议被我国的卫生权威部门接受,“艾滋病”的说法已渐渐为人们所接受。从调查的词次数可以清楚看到它们之间已凸现出主次关系。但并未完全统一,“爱滋病”的说法仍时有可见。像当前生活中这样活生生的异形词应成为规范工作的重点之一。
再次,还要注意解决老词语的新生异形词。厦门晚报2001 年10 月12日在头版头条,以《果蔬世界,美轮美奂》为题报道了世界果蔬博览会的盛况。“美轮美奂”一词引起了读者强烈的反响,人们纷纷认为“美轮美奂”应该写成“美仑美奂”。写作《果蔬世界,美轮美奂》一文的记者辗转寻到厦门市语委,再到笔者处。笔者找出手头所有的大大小小的词典,收的都是“美轮美奂”。它就是正体词,但人们却对“美仑美奂”表示出强烈的认同。语料库的词次调查显示,在实际语言中,二者的使用频率非常接近:“美轮美奂[,22]”对“美仑美奂[,26]”。这就是老词语的新生异形词。人们的这种语感与使用习惯其实也挺有“学理”的。“美轮美奂”与“车”无甚关系;“奂”没有偏旁,“仑”也没有,很对称,正好匹配。至于“美轮美奂”最初是来自于“美哉轮焉,美哉奂焉”,指建筑物的高大众多,人们不了解也不想去了解得那样深入。
语言演变中的正与异的结果其实都蕴藏着学理,只是学理并非单一,也没有造出统一的结果,最终起作用的仍是人们的使用惯力。对老词语的新生异形词要予以特别的关注,对它们要引导,不要忽略,不要简单地排斥,不妨先放一段时间,观其流变,再作规范裁决。
3.指导性原则
规范词表的制订与实行,一旦实施就带有某种程度的“强制性”,可这里仍要强调指导性,因为它是比强制性在更深层次上起作用的因素。不仅是因为强制性只是规范词表在公布后表现出来,而要达到规范的目的,重要的还在于它应具有良好的指导性,更重要的是指导性会在规范对象的选择、规范标准的拟定、规范标准的推出、规范过程的实施等全过程中发挥作用。
语言交际中存在异形词固然不是一件好事,但对异形词的处理如何讲究实效,保证规范标准的落实是应放在非常重要的地位来加以认真考虑的。规范词表一旦作为政府文件公布,就应该具有很好的指导性,甚至说是强制性,而有力的强制性首先来源于它本身的可接受性。严格地说,最需要也最适宜规范的是那些正体词与异形词之间有了较明显的差异,而又尚未完全统一,未完全稳定下来的词语。
从规范的轻重缓急来说,正体词的相对词频在60%以上时较易收到好的规范效果;而在40%-60%之间的则应属于“考察期”,应该缓期执行、以观后效;低于40%以下的正体词则需要重新斟酌,硬性推行,势必增加规范的难度。
对那些主次不清,规范难度大的异形词,不妨先放一放。这里用得上一句时语,“成熟一个,改革一个”。这是因为受到语言约定俗成规律的强力制约。上个世纪50年代汉字简化字搞得那样轰轰烈烈,也还注意了一个稳字,让简化字分批推出。后来“二简”的失败,就在于急于求成。如果“一简”更稳些的话,肯定会更加完善。
如下面的四组异形词(表2)两词的相对词频都差不多, 只有“纽扣”低一些,对这样的词急着下结论,可能很难产生理想的效果。
表2 四组正体词、异形词词频对比
正体词 绝对词次 相对词次异形词
绝对词次
相对词次
可望不可即72 53.3%
可望不可及63
46.7%
折中
157 50.3%折衷 155 49.7%
指手画脚
119 47.79%
指手划脚 130 52.21%
纽扣
253 41.3%钮扣 359 58.7%
产生以上数据的语料库包括的内容比较多,时间跨度与语料类型都丰富多样,里面包括的《人民日报》是1993、1994、1995、1996四年的。现在我们再把这四组词放到统一、连贯、单一的语料,就是90年代中8年间的《人民日报》来分年度加以考察, 结果发现一些很有趣的现象。先看总的数据情况(表3)。
表3 四组词8年间的使用频率
939495969798992000
可望不可即
4 3 4 1 3 3 1 0
可望不可及
1 0 1 0 1 2 2 3
折中
7 131918213 9 7
折衷
27181617222410 2
指手画脚
10101938251929 33
指手划脚
9 3 5 5 1 0 0 2
纽扣
179 128 182417 7
钮扣
24134 6 1 0 0 3
表3显示出在8年时间的磨砺中,“指手画脚(指手划脚)”与“纽扣(钮扣)”两组词分出了比较明确的主次差异,另两组“可望不可即”与“可望不可及”、“折中”与“折衷”都仍保持着相当的活力,特别是“折衷”,表现出比“折中”更强的活力。像对使用频率如此接近的异形词进行规范,最好“缓行”。
三、余论
上面对《草案》中的异形词作了一些分析,并对异形词整理中应该遵循的一些基本原则谈了笔者的认识。下面再谈谈几点建议:
1.高度认识到异形词整理与规范工作的艰巨性与重要性。语言急剧变化的时代,正是这一工作大有可为的时代。做好这项工作,对提高社会语言使用与中文信息处理的准确性、有效性有很大意义。要高度重视异形词整理与规范的实用意义,不要长期停留在学者的研究阶段。使之尽早进入指导人民大众的语言运用阶段,通过报刊、字词典、教材等加以推广。
2.对整理与规范工作不要寄希望于毕其功于一役,而要建立有组织的“监控”机制,要长期观察,加强对权威出版物的监测,使之成为持续性的工作。不搞“一锤定音”的事。要有动态的词汇规范观,不以传统约束现实,及时跟踪语言,使规范工作反映现实的语言生活状况。
3.异形词的整理、规范工作要科学化,研究手段要计算机化。要有充足的依据,做好大规模语料的调查、统计、分析工作。
4.对整理出来的的异形词不要急于求成,分期推出,成熟一批,推出一批,把注重规范效果放在首位。如根据正体词的相对词频,可作出这样的处理:100%对0%的(或99%对1%、98%对2%、97%对3%,一般不应低于95%对5%),可作为第一批,作一种清算式的处理,并要扩大对异形词的调查面,不限于《草案》中的这些;对正体词的相对词频有明显优势(60%-95%),可作为第二批,规定使用;对正异形之间相对词频相当的(40%-60%)暂缓作出决定;对正体词的相对词频低的(〉40%)予以排除。
5.在信息处理现代化的时代,规范异形词有着新的良好的条件,应充分利用。规范异形词不仅要作好人的教育、指导工作,更要作好“机器”的工作,即从计算机字库、词库做起,真正使之起到“强制”的作用。
标签:异形论文;