关于修订《(汉语水平)词汇等级大纲》的若干意见,本文主要内容关键词为:汉语论文,大纲论文,若干意见论文,词汇论文,等级论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1992年6月,国家汉浯水平考试委员会办公室考试中心制定的《汉浯水平词汇与汉字等级大纲》正式颁布。10年来,它为我国汉语水平考试的开发和教材编写提供了明确的依据和规范,在对外汉语教学领域发挥了巨大的作用。为使之更臻完善,最近有关部门正组织力量对其进行补充修订。我们认为,这是一项意义十分重大的工程,同时也是一件非常艰苦复杂的工作,应当得到对外汉浯教学界的广泛关注与支持。为此,我们谨就《(汉语水平)词汇等级大纲》(以下简称《大纲》的修订谈一些不成熟的思考,希望能对这项工作有点滴帮助。
一 《大纲》的修订目标与先决条件
要在哪些方面对现行《大纲》加以改进?修订《大纲》的预期目标是什么?我们应当从《大纲》的性质、编制依据和用途出发来考虑这些问题。
《(汉语水平)词汇等级大纲》“不同于一般的教学大纲.而是一种规范性的水平大纲。”(刘英林、宋绍周,1992)其性质决定了《大纲》的编制必须以词语的使用频度为原则,用使用频度来衡量词语的常用程度,以进行词语筛选和确定词语的等级。因此,《大纲》编制者主要选取北京语言学院的《现代汉语频率词典》(以下简称《频率词典》)和刘源等编《现代汉语常用词词频词典》(以下简称《词频词典》等7种词(字)频统计成果作为定量分析的依据,获取词语频度的基本数据。这些词频统计在当时水平较高、影响较大,可是作为编制《大纲》的依据,却远不够理想,主要有以下几点缺欠:
第一,用于词频统计的语料在数量、范围和语体等方面都多有局限,这影响了一些词语频率指数的可靠性。比如,《词频词典》选用语料2500万字,其中“米饭”和“主义”的词次之比是25∶4161;《频率词典》选用语料180万字,其中“米饭”一词未出现,而“主义”的词次高达3782次,在使用度最高的词中排在第54位。这些数据显然与两词在汉语社团现实生活中真实的使用频率相去甚远。
第二,未能划清字词界限,多把同形词作为一个单位进行词频统计。《词频词典》这方面的问题最为严重,不仅未能区分同音同形词,还把读音不同的同形词合在一起进行统计,例如:
背(bēi,bèi) 笼(lóng,lǒng) 华(huá,huà)
白干(báigàn,báigānr) 拆散(chāisǎn,chāisàn) 废物(fèiwù,fèiwu)
结果(jēiguǒ,jiéguǒ) 门道(méndào,méndao) 下水(xiàshuǐ,xàishui)
《频率词典》在这方面做得较好,将异音同形词全部分立,但仍未能完全区分同音同形词,例如:杜鹃(a.鸟名;b.植物名)、豁(a.~了一个口子;b.~出三天工夫)、搀(a.~着奶奶;b.~点水)等,都是把两个词合在一起统计。由于词频词典在一定程度上是以形为准进行统计,就使得用字相同的词的使用频率未能得到清晰的反映。
第三,未能细致地统计多义词在不同义项、兼类词在不同词性上的使用频率。只有《频率词典》对部分兼类词是分词性统计词频的,但这一原则并未用于所有的词,例如“孤立”、“冷落”未区分形容词和动词词性,“组织”、“注释”未区分动词和名词词性,“还是”未区分副词词性和连词词性。
现有词频统计的这些缺欠,都在不同程度上给《大纲》的编制和修订带来了困难。
表中的A类词是政论性文体中的高频词,B类词是生活性语体中的高频词,如果真按它们的等级序列编写教材,势必会使学习者硬学一些用不着或极少用到的词,而交际需要的词又一时学不到,从而影响学习效率和积极性。
第二点缺欠导致同形词各方的词频都没有确定的数据。比如《词频词典》“结果(jiēguǒ,jiéguǒ)”的频度(词次)为4635,然而这一种写法、两种读音实际上代表了4个词语(注:在《现代汉语词典》中,“【结果】1”和“【结果】2”属同一个词。此据《大纲》分立。):
【结果】jiē∥guǒ:长出果实。
【结果】1jiéguǒ:(名词)成就,成果。
【结果】2jiéguǒ:(连词)用在表过程或原因的分句后,引出事物发展的最后状态。
【结果】3jiéguǒ:将人杀死。
把这4个词合在一起进行统汁所得出的数据,对于《大纲》编制来说毫无意义。因为无法从4个词的词频之和中获知每一个词的词频状况。
相比较而言,第三点缺欠对《大纲》编制的不利影响更大、更深刻。《大纲》所列8000余词是汉浯常用词,其多义现象十分突出,因为词的常用性与多义性是成正比的;加之汉浯由于缺乏词形标记,词的兼类现象又很普遍,因此词的多个义项往往又与其不同的词性相关。对于多义词和兼类词来说,其在不同义项和不同词性上的使用频率(以下分别简称“义频”和“类频”)往往是有差异的。现有的词频统计都是以词为单位进行统计,对一个词在何种意义上使用不予考虑,只有个别词频统计有限地区分了兼类词在不同词性上的使用频率。依据这类粗疏的词频统计结果,《大纲》只能以词为单位进行等级排列,而不能细致地定出多义词不同义项的等级和兼类词不同词性的等级。这样,就在很大程度上影响了《大纲》对命题和教材编写的规范效用,可能导致非常用义、次要词性先于常用义和主要词性出现的情况。例如,在某种初级教材中,“偷”、“就”二词首次出现的语境是:
偷着抽烟。
他怎么就会说“不知道”?
按照《大纲》规定,“偷(动)”为乙级词,“就(副、连)”为甲级词。作为词来说,这两个词出现于初级教材没有问题,可从义频高低来分析,表示行动不使人觉察的“偷”显然应出现于表偷窃义的“偷”之后,表“仅仅”义的“就”也应当出现于“拿起书包就走”、“只要用功,就能学好”等“就”之后。
根据以上分析,我们认为,若要使《词汇等级大纲》真正成为一部等级序列合理、规范细致明确的水平大纲,应当确立两个主要的修订目标,一是重新进行词语筛选和分级,二是要附注多义词的主要义项和兼类词的不同词性的等级。实现这两个目标的先决条件是,除了利用现有大型语料库进行词频统计(或核查分析)外,还要认真进行义频的统计分析。
从《词汇等级大纲》的性质和用途来说,第二个目标的实现是至关重要的,北京语言大学汉语水平考试中心编《汉语8000词词典》已在这方面做了有益的尝试。编者“在征求有关专家的意见的基础上,经过认真分析归纳,将8000词中多义词的众多义项亦均划分等级。”(注:见该词典《前言》。)这次修订《大纲》可借鉴参考该词典的义项等级划分,在一个词诸义项或(和)词性的频度差异较大的情况下,用括注的形式加以标示。例如:
这个条目意味着,“随”是乙级词,但限于乙级出现的是介词用法和动词义“跟”,动词义“任凭”属丙级,动词义“像”属丁级。不过,若要保证多义词不同义项和兼类词不同词性的等级划分合理,一定要对义频进行艰苦细致的统计分析。《大纲》中的主要问题,大多可归因于缺乏义频统计,下面将对此进一步分析。
二 缺乏义频分析对《大纲》编制的不利影响
现有的词频统计都未精细到统汁多义词(包括兼类问)在不同义项上的使用频率,这使修订《大纲》没有现成的义频统计数据可资利用。那么,能不能略去义频统计分析这道工序?我们认为,做好义频统计分析这项工作,是大幅度提高《大纲》完善程度的关键。为了充分认识此项基础工作的重要性,有必要认真审视因缺乏义频分析而使《大纲》编制难以避免的一些问题。
(一)多义词的义项筛选及等级不明
原《大纲》中,每一条目包含5项内容,即序号、等级、词目、词性和拼音。对于多义词来说,这种体例显得过于粗疏。例如,《大纲》将形容词“老”列为甲级词,然据《现代汉浯词典》(1996年修订版,下同),形容词性的“老”有以下义项:
①年岁大。②对某些方面富有经验;老练:~手|~于世故。③很久以前就存在的(跟“新”相对):~厂|~朋友。④陈旧:~脑筋|~机器。⑤原来的:~脾气|~地方。⑥(蔬菜)长得过了适口的时期(跟“嫩”相对):油莱太~了。⑦(食物)火候大(跟“嫩”相对):鸡蛋煮~了。⑧(某些颜色)深:~绿|~红。⑨长久:~主顾|老张近来很忙吧,~没见他了。⑩排行在末的:~儿子|~闺女|~妹子。
上列义项是否都能进入《大纲》?或哪些义项能进入《大纲》?进入《大纲》的多个义项是否都能列于甲级?如果不能,怎样排序?对于这些问题,《大纲》没有明确标示。《汉语8000词词典》对“老”的多个义项进行了筛选相等级划分,选择《现汉》义项①定为甲级,义项③定为乙级,合并义项⑥⑦定为丙级。这佯标出筛选的义项及其等级,有利于严格规约水平考试和教材编写,避免非常用义先于常用义出现的问题。但是,若要使多义词义项筛选和等级划分都准确适宜,需要从多义词词义系统内部和不同的词语之间两个角度进行频度比较。比如,未筛选的义项不仅要比筛选上的义项频度低,还应比其他丙级词、丁级词的频度低。这样的比较必须建立在精细的义频分析的基础之上。
(二)兼类词的其一词性失注或多注
《大纲》在标注兼类词的词性时确立了一个原则,即“一个词偶尔具有另一功能,且这一功能使用频度又不算太高,我们只标注常用词性,不算兼类”(刘英林,宋绍周,1992)。提出这个原则是非常必要的,完全符合作为等级大纲的特点。但是,如果缺乏义频统计,可能无法很好地贯彻这个原则。例如,《大纲》甲级词“特别”只注出“(形)”,未注出副词词性。而“特别”作为副词,有3种意思:①非常,格外;②尤其;③特地。其中义项①可能比形容词性的“特别”还常用,不应当不予标注:另如:
上列各词失注的词性,应当都不算是“偶尔”具有的功能,当初编制《大纲》时,如果做过细致的义频统计与分析,估计就不会出现这类失注。还有个别兼类词的某种功能确实频度“不算太高”,《大纲》反将其注出。例如普通话罕见“合算”用为表考虑、算计义的动词,可《大纲》注出形容词和动词两种词性。又如丁级词“屑”注为“名、动”,而在现代汉语中,“屑”作动词只限于与“不”组合构成”不屑”,因此,没有必要注出其动词词性,而应当把“不屑”处理为一个词。《大纲》对有些能单用的动词都另立与“不”组合的形式,如“不够”、“不顾”、“不容”等,把“不屑”视为一个词应该更没有问题。《大纲》甚至还有极个别多注的词性根本就不存在,如中的动词词性,这属于因疏忽导致的多注。
(三)兼类词的词性排序失当
“‘兼类词’指的是在一定的词类体系中兼属两个或两个以上不同的词类的词。”(胡明扬,1996)对于兼类词两种或两种以上的词性如何排序?如果是普通词典,一般要遵循历史原则,把本类排在前面,把转类排在后面。比如,一个词本是动词,同时兼作名词,词典就先列动词义,后列名词义。但是,作为水平等级大纲,其基本原则是频度原则而不是历史原则。频度原则不仅制约词语的等级排序,还应当制约义项排序和词性排序。也就是说,对于多义词的多个义项,一般不按“本义——直接引申义——间接引申义”的词义发展序列排序,而应按其常用程度的高低排序;同理,对于兼类词的不同词性,也应当遵循频度原则排序,除非是在类频差别不大的情况下,才可考虑本类优先。由于缺乏义频统计,《大纲》对兼类词类频的高低难以把握,因此,有时拘泥于普通词典的释义与义项顺序来排列词性,使一些兼类词的词性排序与频度原则下的水平等级相抵牾。例如,《现代汉语词典》“顾虑”一词的释义为:“恐怕对自己、对人或对事物不利而不敢照自己本意说话或行动。”大概由于释语的中心词为动词,因此《大纲》将“”的词性注为“动、名”。而在现代汉语中,该词只在“你顾虑什么”、“不必顾虑”等有限的表达中用为动词,更多的情况下则用作名词,比如“有~、消。
(四)同形词误合为一
同形词指用字相同的词。根据同形词语音关系可将其分为异音同形词(如“发fā”和“发fà,)和同音同形词(如燕子衔泥的“衔”和头衔的“衔”)两类,二者的共同之处在于都没有意义联系。受以往词频统计字词不分的影响,《大纲》把某些同形词误合为一个词。例如丁级词有“卡(动、量)”,而量词“卡”读kǎ,动词“卡”读qiǎ,它们是两个异音同形词。又如“(动、叹)”也应分为两个词,哼小曲的“哼”音hēng,叹词“哼”音hng。同音同形词误合为一词的情况相对更多一些,例如(只列出主要义项):
同形词误合为一的主要原因是以往词频统计的不科学性,但也与缺乏义频分析有一定的关系。如果能注意到词语在不同意义上的使用频率,自然就会注意到不同意义之间的差距,从而可把毫无意义联系的同形词加以离析。
(五)同形词失收
由于词频统计字词不分和缺乏义频分析,《大纲》中还有个别同形词失收的情况,即只收录一个宇代表的甲词,而未收录这个字代表的乙词(和丙词)。例如,“背(bèi)”这个字代表两个词,一是名词,表“后背”或“反面”义;另一个主要用作动词,意义比较复杂。《大纲》中只有“背(名)”,而常说的“背课文”、“背着人”中的动词“背”却未被收录。又如“麻”代表了3个词:。
三 《大纲》修订需要注意的其他问题
《大纲》出版以来的十余年间,词汇学研究已有了长足的进展。此次修订《大纲》,还应在以下几方面注意借鉴吸收词汇学研究的新成果,以使《大纲》在体例上更统一,细节上更严谨。
(一)兼类词与同形同音词的划界
兼类词属于两个或两个以上不同的词类,同形同音词也可以分属两个或两个以上不同的词类,二者的差别就在于有没有意义上的联系。意义上有联系的是兼类词,无联系的是同形同音词。例如:“有毒”的毒是名词,“毒死老鼠”的毒是动词,“毒蛇”的毒是形容词,它们在意义上有联系,属兼类词;“大米”的“米”是名词,“身高一米八”的“米”是量词,它们没有意义联系,属同形同音词。怎样确定意义上有无联系?可以采用义素分析和引申义列分析等方法。在没有把握的情况下,可以参考《现代汉语词典》,这部词典首创同形同音词分立条目的体例,尽管存在个别分合欠妥的情况,但总体上看,兼类词和同形同音词的界限还是比较清楚的(张博,2003a)。
《大纲》在处理兼类词和同形同音词的关系上,表现出一种明显的偏向,即把兼类词拆分为同音词,例如“毒”就被分为“(形、动)”和“(名)”两个词。另如,以下这些词在《现代汉语词典》中皆属同一词目,而在《大纲》中却被分成两个或两个以上的词:
以上所分同形同音词有少数是合理的,例如,介词“将”由表“拿、取”义的动词虚化而来,副词“将”由表“行进”义的动词虚化而来(张博,2003b),意义毫无联系,应当分立。但大部分应考虑合并。因为,将兼类词处理为同音词,既不利于显示词义之间的联系,也不利于体现汉语词汇的类型特征,同时又使《大纲》的词语数目有失准确。《大纲》为什么多把兼类词拆分为同音词?我们推测,可能是由于大部分兼类词在不同词性上的使用频率有差异,不便把不同词性并列于同一等级,只好据词性拆分兼类词,以便将其置于不同等级。如果在修订《大纲》时能附注频度差异较大的义项、词性的等级,兼类词类频的不平衡性就有了适宜的标示,而不必据类分词分等了。
(二)轻声词与儿化词的注音
轻声与儿化是对外汉语教学中的难点之一,关系到能否克服洋腔洋调,使语音纯正自然。因此,在修订的《大纲》中,对轻声与儿化的标示应更为细致和准确。
现行《大纲》对大部分轻声词都能正确标注,但还不够精细,主要表现在:
第一,对于是否轻声采取一刀切的方法注音,即或者轻声,或者非轻声。这种处理过于简单,因为,有些词因语体、语境的不同而可以有重读和轻读两种渎音,比如“意见jiàn箱”和“提意见jian”中的“意见”。因此,《现代汉语词典》对一般轻读、间或重读的字用特别的方式加以标注。与《现汉》相对照,那些一般轻读、间或重读的字在《大纲》中注音不一。少部分注为轻声,如“本钱、玻璃、聪明、得罪、点缀、逻辑、摸索、徒弟、应付、志气”等;大部分则仍按重读形式注音,如“报复、惦记、吩咐、父亲、固执、喉咙、机会、机器、娇气、口气、老鼠、啰唆、母亲、佩服、碰见、起来、情绪、神气、神仙、手巾、听见、小心、新鲜、心事、妖怪、摇晃、意见、意识、遇见、愿意、糟蹋、照顾、嘱咐”等。这样把可重可轻的字划然分开,一方面造成体例上的不统一,另一方面也不利于准确地反映这些词语实际的音读状况。
第二,个别轻声词语仍注为重读。例如“别人、长处、打交道、道理、短处、福气、后边、祸害、教训、口袋、里边、玫瑰(注:《大纲》“玫瑰”注音为méiguì,然“瑰”只读guī,无guì音。)、南边、前边、晌午、上边、书记、妥当、委屈、西边、下边、想法(名)、右边、指望、左边”等。
《现代汉语词典》对儿化也是有所区别的,一种是书面上有时儿化有时不儿化,口语里必须儿化;另一种是书面上一般不儿化,但口语里一般儿化的。前者自成条目,后者则在释义前加“(~儿)”予以标示。与《现汉》相对照,《大纲》增加了几个自成条目的儿化词,其中“面条儿”、“墨水儿”、“纳闷儿”、“沿儿(名)”等没有问题,但以下几个似欠妥:(1)“带儿(名)”,“带”作名词时有两个常用义,一是带子或条状物,用此义的“彩~|飘~|安全~|录像~”中的“带”不能儿化;一是地带、区域,如“这一~|黄河一~”,这个意义上的“带”都不能儿化。(2)“画儿(名)”,“画报|画外音|画中有诗|江山如画”中的“画”不能儿化。(3)“空儿(名)”,“填空”的“空”一般不儿化。我们以为,对自成条目的儿化词应严格把握。如果不是在各种义项、搭配和语体中都能儿化,就最好不要自成条目,以免造成不恰当的儿化。在儿化的标注方面,《大纲》的主要问题是对口语中一般要儿化的词未加标注,例如“茶馆、出门、串(量)、从头、从小、带劲、袋、灯泡、电影、对联、多半、发火、饭馆、干劲、跟前、拐弯、花纹、花样、花园、加油、胶卷、劲头、开头、露面、路口、冒牌、名牌、模样、南面、闹笑话、旁边、起劲、缺口、使劲、手绢、手套、谈天、土豆、香肠、眼镜、药方、药水、滋味”等。这些词常见于口语语体的语料,多表现为儿化形式,《大纲》对此应设法标注,以与自成条目的儿化词和绝对不儿化的词相区别。
在轻声与儿化的标注方面,我们建议,应当注意汲取《现代汉语词典》的注音方式,参考其所注音读,因为,这部词典反映了普通话词汇规范的最新成果,词语音读的审订和标注都比较精细。如果《大纲》的注音与《现汉》多有不合,将会导致教材与试题的注音依违难决。
(三)等义词的括注
《大纲》从节省性原则出发,采用括注的形式包容某些等义词。但括注实际涉及的情况有5种:(1)等义词:如“报道(报导)”,“薪金(薪水)”;(2)缩略词:如“电风扇(电扇)”,“照相机(相机)”;(3)缩略成分:如“手电(筒)”,“有(一)点儿”;(4)异形词,即同一个词的不同写法:如“吩咐(分付)”,“订购(定购)”;(5)近义词:如“老大妈(大妈)”,“伯父(伯伯)”,“阿拉伯语(阿拉伯文)”。
其中第5种情况最好另立条目,因为括号内外的词意义不完全相同,在某些语境中不能彼此替换。比如“大妈”有伯母义,“老大妈”无;说“农民伯伯”,不能说“农民伯父”;在“他会讲阿拉伯语,不会写阿拉伯文”中,“阿拉伯语”与“阿拉伯文”显然不能互换。另外,前4种括注内容不同,最好有所区别,并应在细节上更加注意。比如等义词应以高频者为词目;缩略形式与原式也应根据常用度来确立词目。异形词要分清正体和或体,以正体立目,将个别用或体包容正体的括注予以订正,例如“身分(身份)”,“压韵(押韵)”,应改为“身份(身分)”、“押韵(压韵)”。
(四)词缀的名称及处理
在《大纲》的“序言”部分,将“第”、“者”、“感”这类附加于词根语素之前或之后的构词成分称为前缀、后缀和类词缀,而在词表中却将其标注为“头”、“尾”。“头”、“尾”之名虽比“前缀”、“后缀”节省用字,但易与其他术语混淆。因为,在普通语言学中,“词尾”特指那些表示词与词在词组或句于中的句法联系的后缀,例如英语works,worked中的-s,-ed。这类后缀只有句法作用,不参与词的构成,与汉语中的构词后缀性质不同。为避免术语所指的含混,建议将“头”、“尾”改为“前缀”、“后缀”。
对词缀的处理,我们考虑,是否可在以下两方面加以改进:(1)尽量控制附缀词的数量。由于词缀的重要特点是可用仿造的方法产生新词,具有极强的能产性,学习者到一定的学习阶段即可通过类推的方式理解其他附缀词的意义。因此,对附缀词不必一一列出,只需列出少量高频附缀词和词缀。例如,《大纲》注为“尾”的“长”,是一个类后缀,有“领导人”的意思。原《大纲》收录的含“长”后缀的词过多,其中有不少连《现代汉语词典》都未收录,例如“班长、队长、局长、科长、排长、部长、团长、省长、市长、县长、院长、组长、厂长”等。这类附缀词的词根和词缀《大纲》已分别收录,由它们构成的附缀词实属冗余词目,在修订时应考虑删除。(2)尽量将词缀或类词缀的等级提前。现行《大纲》中个别词缀或类词缀的等级偏后。例如,收录的“品”缀词有等,而丁级词中才有“品(动、尾)”。这样的等级序列不利于学习者用类推的方法批量地学得附缀词,也不利于控制附缀词的数量。假如将“品”缀的等级提前,可以考虑略去某些构词成分有重合的“品”缀词,如因有“产品、日用品”,可略去“农产品”和“用品”,还可考虑略去个别词根语素自由度较高并处于《大纲》高等级的附缀词,如“药品、废品”等:
(五)非词成分的处理
作为《词汇等级大纲》,应进一步明确词本位的原则,尽量不收录非词成分。除了酌情保留“一……就……”之类常见的语法结构外,对以下几种非词成分建议不单列:
(1)数字的大写。数字的小写和大写代表的是同一个词,属于文字范畴,故大小写数字不应各列条目。可参照处理异形词的方法,用小写包容大写,即用括注方式将大写列于小写之后。
(2)叠音形式。意义与单音词相同或差别不大的叠音形式,可用单音词包容,不必单列,例如。
(3)大于词的成分。《大纲》中大于词的成分可分为两种,一种是实词与虚词的组合,例如等,假如《大纲》对这些成分不加限制,那么,与之相仿的“看到”、“行了”、“好的”、“或早或晚”、“从……开始”等形式不都有资格进入《大纲》了吗?还有一种大于词的成分是实词与实词组合的词组,例如等,这些词组的构成成分已收录于低等级词表中,再收录其组合形式,不仅使《大纲》的收录范围不清,还造成了不必要的冗余条目。
(4)特殊语词。《词汇等级大纲》作为语文性词表,应以收录普通词语为主,对于高频的百科词汇,可酌情收录一些,但有些专名术语是否可以考虑不予收录,例如“马克思主义”、“毛泽东思想”、“茅台酒”、“形而上学”、“辩证法”等,因为这类专名术语主要与学习者的知识结构相关,一般不反映其语言能力;况且,对文化背景和专业背景不同的学习者来说,有些专名术语的确切所指是不容易解释清楚的。
标签:现代汉语词性论文;