现代汉语词缀的定量与定性研究_现代汉语论文

现代汉语类词缀的定量与定性研究,本文主要内容关键词为:词缀论文,现代汉语论文,定量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

随着越来越多的新词语的出现,如“先导型、瑜伽热、舒适度、上班族、里程碑式”等,引导我们思索现代汉语构词的规律。像“型、热、度、族、式”这一类的语素构词很有规律,构成的词数量也多,构成的词语不可能都收入词典,比如1998年和2000年《人民日报》语料中有340个“XX型”的词语出现,如“技能型、搬运型、板块型、闭合型、便捷型、标准型、参与型、成年型、城郊型”等等。为了解释现代汉语构词法中的这一类现象,我们有必要引入语言学中的“类词缀”的概念。

关于“类词缀”的定义、性质、范围和分类的探讨,语言学界主要有赵元任(1968)、吕叔湘(1979)、汤廷池(1992)、陈光磊(1994)、马庆株(1995)、朱亚军(2001)、富丽(2001)、王洪君、富丽(2005)、冯敏萱等(2006)等。在汉语构词法著作和论文中,对于词缀或类词缀,一般只是列举性的说明,少有穷尽性的研究,本文基于北京大学计算语言学研究所的《现代汉语语法信息词典》8万词的词库,对每一个词的构成进行分析,穷尽性地考察类词缀。

中文信息处理学界对于“词缀”和“类词缀”,主要是从应用的角度去制订分词规则和词表,如刘源等(1994)、中央研究院的中文词知识库小组(1996)、吴赣(1998)、孙茂松等(2001)都谈到了对“词缀”“接头词”“接尾词”的处理,但是各家所列的类词缀的范围都不一致,需要进一步探讨类词缀的确立标准,以期更加深入地了解其构词规律。

二、类词缀的定量研究

关于类词缀的范围,各家确立的内容都不一样。如吕叔湘(1979)针对“汉语里地道的语缀不很多”的现象,提出了“类语缀”一说,并列举了“可—、好—、难—、准—、类—、亚—、次—、超—”等18个类前缀和“—员、—家、—人、—民、—界、—物、—品、—度”等23个类后缀。汤廷池(1992)则列出了“阿、老、小、打、见、可、难、好、而、以、第、初、不、非、反”等15个词首以及“人、师、员、士、生、手、派、性、度”等48个词尾。朱亚军(2001)所列的词缀,包括前缀22个,指“阿、半、本、不、超、初、打、单、第、多、反、泛、非、分、副、该、可、见、老、所、总、准”;后缀39个,指“巴、处、达、得、度、儿、法、分子、鬼、汉、化、件、家、匠、角、界、具、率、论、迷、派、品、气、然、热、师、士、式、手、坛、腾、头、性、学、员、者、子、族、主义”。

刘源等(1994)有“完全虚化的前后加成分”“部分虚化的前后加成分”以及“接头词和接尾词、不虚化或基本不虚化”之别,采取了一种分层处理的方式,共列了15个前加成分和22个接头词、32个后加成分和98个接尾词。台湾中研院则列举出了9个前缀和41个接头词、20个后缀和441个接尾词。《现代汉语语法信息词典》(以下简称《语法信息词典》)收录了前接成分11个,后接成分43个,前缀包括“阿、超、非、过、老、微、伪、小、以、之、准”等11个,后缀包括“赛、办、式、边、长(zhǎng)、场、单、度、堆、儿、方、感、观、乎、化、机、计、家A、家B、界、老、狂、率、论、们、面、品、器、然、生、手、体、头、型、性、学、炎、业、仪、员、者、制、子”等43个。

本文对于类词缀的研究是建立在定量研究的基础上,定量研究选取的词库是北京大学计算语言学研究所开发的《现代汉语语法信息词典》数据库。《语法信息词典》1998年第1版收录了现代汉语词语5万多条,2003年第2版增加至7.3万余条(参见俞士汶等,2003),到目前增加至8万条。该词典采用关系数据库的文件格式。本文就是基于这个丰富的词库,并结合1998年全年《人民日报》语料库,对类词缀首先进行定量研究;所以本文对类词缀的研究不是凭经验、凭语感的选取,而是基于对语料库的统计和分析而得出的。

按照王洪君、富丽(2005),在体词性的范围内,词缀的核心搭配范围在单音字,延展到了一部分双音词;类词缀与单音字的搭配已不太自由,其核心搭配已转移到了双音词,并延展到了多音节词和类词。于是我们选取了词库中的三字词来穷尽性的调查类词缀。本文首先对《语法信息词典》80685个词进行切分分析,切分过程中有一条原则就是对二字词不切分,发现有很多三字词可以切分,我们于是在80685词中抽取出13778个三字词,并抽取出《人民日报》1998年上半年语料库中的17848个三字词作为参照。

我们考察三字词中的类后缀的工作流程如下:对8万词库中的13778个三字词的位于词末的语素进行再抽取,共有1539个字,把这1539个单字在数据库中按照构词频率排列,词频高的前50位分别是:子、性、机、器、学、人、员、化、会、品、者、儿、率、法、费、家、病、部、表、剂、线、权、车、力、量、站、队、式、室、花、片、物、纸、生、业、体、石、头、词、面、期、书、场、油、图、素、炎、点、虫、院,这前50个字的构词频率都在53次以上。词频低的后50位分别是:妻、浅、签、千、传、汽、喘、棋、脐、喷、凄、抢、谱、浦、泼、坪、频、篇、屁、春、皖、戚、卿、染、犬、醛、丑、趣、渠、黢、屈、出、欠、囚、川、沁、勤、储、怯、俏、瞧、黜、蟆、跑、除、曼、朦、氓、闷、搭。词频低的后50位根本没有可能成为类词缀,词频高的前50位有潜能成为类词缀,最后的定性还要结合别的因素加以考虑,后文将加以论述。

我们按照上一段同样的方法抽取类前缀,得到词频由高到低的前10个汉字是:大、电、小、老、水、打、中、地、白、保。这些语素是否以“类前缀”的方式构词,都有待于后面有关类词缀的定性的验证。

三、类词缀构词的特征

关于类词缀构词特征的探讨,前贤已经讨论得很多,如对类词缀虚化、定位性、构词的能产性、结构的粘附性、语音的弱化性等多有探讨。这里要强调的是我们讨论类词缀的特征是采取一种实证式的考察,比如考察类词缀的能产性,不是举几个构词能力强的类词缀的例子;而是在数据库中全面系统地考察单音节语素,列出每个类词缀在词库中的构词词频;考察类词缀的定位性,就对每个类词缀在词中的位置加以统计说明;考察类词缀的虚化义,就对每个类词缀是在哪个义项上虚化加以说明。因此,本研究是一种实证式研究,有统计的方法,也有定性的逐一考察。考察的类词缀的构词特征拟从能产性、定位性、意义虚化与否及成词与否等四个方面加以说明。

3.1能产性

类词缀的构词能力强,它在现代汉语构词和中文信息处理的分词中起着重要作用,是现代汉语词汇中的构词部件,所以我们需要把类词缀从语素库中提取出来。

《语法信息词典》收词规模属于中型,目前收录了8万多词,收词是很精炼的,对于有一些能用规则控制的词,8万词是不会穷尽性地收录的。即便如此,有些语素在词库中构词频度非常高,我们采取统计的方法排查出了一些能产性非常强的语素。

前面提到我们对《语法信息词典》三字词中的位于词末的语素进行过抽取,按构词频率由高到低排列的前11位语素分别是:子、性、机、器、学、人、员、化、会、品、者。这前11个语素中,“子”为真词缀,“性、学、员、化、品、者”这几个语素我们列为类词缀,是基于它们的能产性、定位性和虚化义来考虑的。我们把“机、器”列为类词缀的原因是基于“机、器”的构词频度高,这两个不成词语素在8万词库中的13778个三字词中的构词词频高达238次和215次,形成了各种各样的“XX机”和“XX器”结构,如“电报机、锁边机、观测器、搅拌器、缓冲器、激光器”等等。我们还检验了“XX机”在1998年和2000年《人民日报》语料中的出现情况,共有444次“XX机”(注:其中也包括少量的以“机”为词尾的四字词或五字词。)。如:

饮水~|板轧拌和~|包装~|报到~|报话~|壁挂~|编织~|变位~|变稳~

标签~|表演~|并条~|并行~|播放~|播种~|补报~|步话~|彩电~

操舟~|操作~|插件~|查询~|柴油~|铲运~|唱盘~|抄纸~|超滤~

称量~|成塑~|成像~|成型~|程控~|充气~|抽水~|抽油~|出票~

出生~|锄草~|处理~|触摸~|穿梭~|传呼~|传真~|窗式~|吹风~

磁带~|磁电~|粗纱~|打包~|打谷~|打火~|打浆~|打麦~|打药~

打印~|打桩~|打字~|大型~|单板~|单放~|单片~|滴丸~|点钞~

电报~|电铲~|电唱~|电传~|电动~|电话~|电排~|电视~|电影~

定型~|动力~|豆浆~|豆奶~|读卡~|赌博~|堆积~|对讲~

值得注意的是上述以“机”为词尾组配出来的词,有些词频并不高,如“打药机、电排机”等,这些词也没有必要收入词典,处理成以“机”为类词缀构词比较妥当。尽管“机、器”的意义在构词中并没有虚化,表示“机器”或“器具”义,都是表示“人造物”,但是鉴于“机”和“器”的高能产性,我们把“机”和“器”看成类词缀,也可以说是把能产性这一衡量标准“加权”的结果。比如列入后面类后缀表的“~赛、~园、~症”等,意义也不一定特别虚化,但是由于它们的能产性和构词的规则性,我们把它们列为类词缀,也是基于语言的应用来考虑的。虽然很多学者没有把“赛”作为类词缀来考虑,《语法信息词典》把“~赛”标为类词缀,这样对在语料中识别“滑雪赛、亚洲杯赛、挑战赛、友谊赛”等词还很有帮助,此时的“赛”作“比赛活动”解释(注:“XX赛”中的“赛”应作“比赛活动”解释,《现代汉语词典》(以下简称《现汉》)忽略了这一名语素的用法,《现代汉语规范词典》(以下简称《规范》)注意解释了这一用法。),在1998年《人民日报》语料库中,“XX赛”达158个之多。

类词缀构成的词的意义一般可以通过成分义和类词缀义相加得到,所以类词缀构成的词的意义具有透明性,因而词典不会全部收录这种构词方式构成的词。这种意义的透明性、构词的规则性决定了构词的能产性。比如这些类词缀,“~迷、~狂(注:“狂”在构词中改变了自己的词性,《规范》和《现汉》只列了它的副词和形容词词性,实际上,我们认为“狂”和“迷”一样,也有“沉醉于某一事物的人”的含义,如“工作狂、色情狂”等,转变了词性,这种派生属于Beard(1995)所说的“换类派生”。)、~记、~群、~件、~族”等,虽然在《语法信息词典》8万词中所抽取出的三字词库中频率很低,都不超过10次,但这些类词缀在1998年全年的语料中出现的频率比较高,分别为17、9、29、34、29次,在词典中出现次数不是很高,但在语料中出现次数比较多,具有造新词的能力。

3.2 定位性

所谓定位性是指词缀、类词缀在某个义项上出现在组合的固定位置上,前缀和类前缀只出现在组合的最前,后缀和类后缀大多出现在组合的最后。如“半~、大~、总~、代~、单~、反~、非~、副~”等是类前缀,“~度、~方、~感、~观”等是类后缀。

关于类词缀定位性的探讨,前贤讨论得很多,马庆株(1995)谈到:“词缀分布特征是定位性,不定位的不是词缀。”不管是真词缀还是类词缀,都具有定位性;所以,我们确立类词缀,首先要对这些语素进行定位,是位于词首,还是位于词末,位于词首的才有可能成为类前缀,位于词末的才有可能成为类后缀。但我们认为类词缀的定位性,不能简单理解为定位于词中的位置,我们认为类词缀的定位性体现在三方面,一是定词性,二是定义项,三是定词中的位置。类词缀的定位是在某一个词性、某一个或几个义项上定位,而不是说充当类词缀的这个语素在任何情况下都是定位的。

充当类词缀的语素一般不只一个词性,而是兼属好几个词性,比如“~观”有“动语素(Vg)、名语素(Ng)”两种词性,只有在做名语素,表示“对事物的认识或看法”时,“观”才是类词缀。再如“鬼”兼属“n、a、Ng”几种词性,而它做类词缀时,如“烟鬼、讨厌鬼、吝啬鬼、冒失鬼”中的“鬼”,就只位于词尾,表示“对具有某种特点的人的蔑称”。在这一固定义项上该语素的位置是固定的,否则并不是固定构词。如在指“迷信的人所说的人死后的灵魂”时,“鬼”就不是定位构词,如“鬼魂、鬼神、魔鬼、孤鬼”等词,“鬼”的位置可以位于词首,也可以位于词末,这个义项上的“鬼”就不是类词缀构词。我们所列的类词缀表中,每个语素都有自己的义项,为什么要给每个语素一个义项的解释,因为有的语素不只一个义项,究竟是在哪一个或哪一些义项上这个语素能成为类词缀,这就要考虑语素的义项的选取问题。

我们讨论类词缀的定位性,定位于词首还是词末,主要是用词库中的数据来加以说明,从分析数据中我们看出,如“度(dù)”,这个语素兼属名语素(Ng)、动词(v)、量词(q)等几类,《现汉》列出其有15个义项,但“度”做类词缀时,只是在做名语素时,表“程度”这个义项时,才能充当类词缀,如“舒适度、回旋度、信誉度”等。比较显著的是“度”在8万词的数据库中,位于词末时构成的词有167例,其中指“程度”这一义项的“X度”结构有93例;而构词时位于词首形成“度X”的情况只有10例,如“度过、度假、度量”等。

我们调查了“非”在《语法信息词典》和《人民日报》1998年上半年语料库中的情况,包含有“非”的词语一共是229个,“非”位于词首时构成的词有157个,位于词末时构成的词有48个,位于词中的“非”有24个。位于词首的“非”才有可能成为类词缀,如“非”位于词首时,以类词缀方式构成的词有很多(注:“非”位于词首时,也有不是以类词缀方式构成的词,如“非同一般、非此即彼、非国大、非得、非常、非法、非洲队”等。),如:

非蛋白、非伙伴、非样本、非结盟、非船舶、非生产人员、非正常、非市场、非工程、非

主导方面、非试点、非法定标志牌、非机动、非官方、非西方、非政府、非骨干、非常规、非

正规就业、非饱和脂肪酸、非工会、非互惠、非科技、非经济、非关键、非现金、非结晶硅

董秀芳(2004:105)提到左向替换率和右向替换率。所谓左向替换率,即保持右边的成分不变,替换左边的成分所能造出的同类词的数量;所谓右向替换率,即保持左边的成分不变,替换右边的成分所能造出的同类词的数量。上述“非”做类词缀时构词157例,可看成右向替换率为157。“非~”的构词能力很强,产生了很多新词,有很多新词都是用“非X”结构创造的。再如英语中的-non作为前缀派生出了很多词语,如《牛津高阶英汉双解词典》将non-violence译为“非暴力政策”,non-combatant译为“非战斗人员”,non-conductor译为“非导体”,non-white译为“非白种的(人)”,除了这些词典收词以外,还有像non-system disk,non-profit corporation,non-member,金山词霸将它们分别译为“非系统盘、非营利公司、非会员”。这些译词,反映了语言中大量产生的新概念,很容易用类词缀的形式来表达。

“非”位于词末时构成的词一般不是类词缀构词。有时是指“非洲”这一义项,如“北非、中东非”等;或者构成成语或习用语,如“似是而非、是是非非、惹是生非”等;或者构成二字词,如“决非、莫非”等;或者构成简称,如“国转非、农转非”等。

“非”做类词缀时的义项,《现汉》和《规范》的解释大致相同,指“用在一些名词性成分的前面,表示不属于某种范围”时,产生类词缀用法。如果是指“非洲”这个意义时,“非”是不可能产生类词缀用法的。

需指出的是“率(lǜ)、器”类词缀构词时位置很固定,一般位于词末,如“率”在词库中就没有出现“前字构词”的情况。它做类词缀时,在读音上定位,在词性上定位,在义项上定位,表示“两个相关数量间的比例关系”。“器”在8万词中的三字词库中位于词末的占215例,“器”位于词首的三字词为0;在1998年《人民日报》和8万的三字词库共52209个词中,“器”位于词末的多达343例,“器”位于词首的三字词为11例。可见,“器”词末构词和词首构词的比例相差很大。

再如“单”,位于词首的“单”和词尾的“单”我们都列为类词缀,一个是类前缀,一个是类后缀。类前缀的“单”构成的词如“单比例、单航次、单功能、单精度”等词,在8万词中的三字词库中多达12例,在1998年《人民日报》和8万的三字词合库中有18例,表示的义项是“独自一个;不跟别的合在一起的”;类后缀的“单”构成的词比较多,在8万词中的三字词库中多达44例,在1998年《人民日报》和8万的三字词合库中占96例,如“化验单、工资单、汇款单、承包单、检查单”等,表示的义项是“分项记载事物的纸片”。《语法信息词典》把“~单”列为类后缀,在语料分析中有不错的效果,我们也把“单”列为类后缀。

3.3 意义半虚化

语素意义虚化与否,作为衡量类词缀的一个标准,前贤很多人都探讨过,比如朱德熙(1982)、马庆株(1995)、朱亚军(2001)、王洪君、富丽(2005)、董秀芳(2005)等。虽然语义虚化很难作为判定词缀的必要条件,但是考虑类词缀又不能回避类词缀的语义问题,为此我们提出类词缀的语义半虚化的特点。

朱德熙(1982:29)认为“真正的词缀只能粘附在词根成分上头,它跟词根成分只有位置上的关系,没有意义上的关系。”朱先生只列举出了“初、第、老”3个前缀,“子、儿、头、们、着、了、过、的、得”等8个后缀,还认为“性、式、自”都不是词缀。

我们也认为汉语中真正的词缀并不多,真正的词缀意义必须是虚化的,并没有实际的意义。(注:我们部分赞同朱先生所列的真正的词缀,如“子、儿”等,“子”的意义极其虚化,只能解释为“名词后缀”,从共时角度看,有时是羡余成分,如“刀子、马鞍子、脚脖子”中的“子”就可以去掉;“儿”的解释也就是“后缀,充当名词和少数动词的后缀”,但是像“着、了、过、的、得”等我们认为还是助词。)如“老”是真前缀,在“老好人、老鹰、老王”中“老”并不承担什么实际意义,“好人”在《现汉》的解释中义项就是“老好人”的意义。“老好人”也并不意味着年纪大,年轻的人也可以称之为“老好人”,但是在“老朋友、老交情”中的“老”有实际意义,不是词缀。那么,“老”在什么义项上是词缀身份呢?我们归纳了一下,“老”在做前缀时是没有实际意义的,表现在:1)加在某些动植物名称前面;2)加在姓氏前面。“老”在做类词缀时,表现在:1)表示排行,如加在“大、二、三……十”前面;2)表示排行在末了的,如“老儿子”;3)表示尊称,如“老佛爷、老好人”;4)表示对某种人的蔑称,如“老东西、老家伙、老糊涂”等。

“性”就不是真词缀,是类词缀。“性”的意义部分虚化,表示“抽象物或属性”,如“思想性、对比性、艺术性”中的“性”若去掉,词义就改变了。再如“手”本义是指“人体上肢前端能拿东西的部分”,但若是“攻击手、拳击手”中的“手”就是指“擅长某种技能的人或做某种事情的人”,意义部分虚化。又如“风”在“晚会风、迷信风、打折风”中的“风”是指“风潮;风俗;风气”的意义,意义比“跟地面大致平行的空气流动的现象”这个含义要虚灵。

而“石”也有一定的构词能力,如构成“火山石、磨刀石、打火石”等,其中的“石”是指“岩石,矿物的集合体,是构成地壳的主要成分”,意义很实在,没有虚化,就是“试金石、绊脚石”中的“石”有“转义”的情形发生,但是这里的“石”还是指“岩石”,所以尽管“石”是不成词语素,但由于意义没有虚化,不能算作是类词缀。

类词缀的意义是半虚化的,类词缀不是可有可无的,半虚化的意义体现在类词缀不像真词缀那样去掉之后不影响整个词义的表达。类词缀在词语的构成中充当的意义通常不是该语素的本义,而是该语素的比喻义或引申义。如“星”的本义是“天文学上泛指宇宙间能发光或反射光的天体”,由此造成的词有“织女星、启明星”等,比喻有“某种突出的、有特殊作用或才能的人”,如“致富星、文教星、法纪星、勤俭星”等。

类词缀常表示某个“范畴”义,表示人物的某个类型或者动作行为的某个类型,如类词缀构成的词常形成一个词群,如以“师”构成的词有“厨师、面包师、魔法师、美发师、会计师、音乐师”等等,其中的“师”就是表示“掌握专门学术或技艺的人”,表示某一类型的人,表示共同的语义类属,但是具体是哪一类型的人,得由前面的词语来决定。

据Beard(1995),派生构词可分为四个类型:特征值转换派生(feature value switches)、表达性派生(expressive derivation)、功能性派生(functional derivation)和换类派生(transposition)。表达性派生有指小、增量、轻蔑、喜爱、表敬等五个功能类别。(转引自董秀芳,2005)董秀芳(2005)认为,汉语派生结构的类型以表达性派生为主,如用在单音姓氏前的“老”“小”“阿”,表示亲近喜爱之情。我们认为可以补充一下董秀芳(2005)的观点。首先我们承认汉语派生结构具有表达性派生,除了“老、小、阿”外,还有“大”,也可以用在单音节姓氏之前,表达一种喜爱之情,如“大李”;还有一个很有意思的类后缀“鬼”,既可以表示蔑称,意义为“称有不良嗜好或行为的人”,如“小气鬼、吝啬鬼”,又可以表示爱称,如“小鬼、机灵鬼、调皮鬼”,意义为“对人的昵称(多用于未成年人)”。表达性派生除了有Beard所说的“指小、增量、轻蔑、喜爱、表敬”这5个类别外,还有一些表示评价的“类词缀”,如“多~、反~、泛~、可~、零~”等,还有对真假值的判断,如“不~、非~、伪~、无~”等。其次,我们认为汉语派生结构还可以考虑有功能性派生;Beard(1995)所谓的功能性派生,指改变词的语义方面,所表达的意义相当于一些格(case),如表示施事、受事、地点、来源等。

通过对类词缀几乎穷尽性的调查,我们发现类词缀常概括性地表示某类人、事物、性质、时间或处所等。表示某一类型的人的类词缀比较多,如“犯、鬼、佬、家、户、狂、迷、群、商、生、手、星、员、者、族、分子”等,这些表示人的不成词语素,总是描写的社会生活中的某一类人,人群的划分和描写在语言中常被应用,人常作为对象或主体在语言中被描绘,这类语素能产性比较强,所以我们建议把表示某一类型的人的不成词语素列为类词缀,这样把类词缀中表示人的类型又聚成了一小类。表示“物”的意义的类词缀是比较笼统的,如“品、体、物、件”都有表示“物品、事物”义。例如“品”的含义是“物品”,词频很高,有107次,如“收藏品、滋补品、洗涤品”等;“体”的意义是“物体”,如“棱柱体、立方体、结晶体”等;“物”的意义是“东西;事物”,如“图腾物、吉祥物”等;“件”的含义是“指总体中可以分开一一计算的事物”,如“焊接件、加工件”等。表示事物的性质的类词缀,有“化、度、气”等;表示观点、态度的类词缀,有“论、观、感”等;表示“部位或方面”的类词缀,有“方、面”等;表示方法的类词缀,有“术”等;表示样式、形状的类词缀有“式、型、形、状”等;表示“时间”的类词缀,有“期”;表示“处所”的类词缀,有“园、带”等(注:有意思的是“X带”,位于词尾时,“带”有两个义项,有虚化和不虚化之别:一个是“带子或像带子的长条物”,如“彩带、传动带”等;一个是“地带;区域”,如“开发带、交错带、贫困带”等等,后一个“带”表示处所,意义较前一个“带”的意义要虚化,是类词缀。)。

通过实证性考察得出的上述关于类词缀的结论,还是比较符合Beard(1995)所说的功能性派生的,我们总结出来的这些表示某类人、事物、处所的类词缀大致相当于Beard(1995)的施事格、受事格、地点格等。另外,我们还增加了一些格,如时间格、方式格等。

比如“式”,很多学者,如汤廷池(1992)、吴赣(1998)、王洪君、富丽(2005)都认为是词尾或类词缀,但也要看“式”的义项的虚实,如“式”在《规范》中有5个义项的解释,对照这些义项,表1列举了词库中的词以及语料中的词:

表1 “式”的义项对比

词尾

类后缀义项 举例

频率

式3 规格;标准 法式、格式、程式

式41 样式

中国式、里程碑式、卢梭式、人民主权

论式、教条式、交互式、酒囊饭袋式

式9 举行典礼的程序、形式、典礼 入场式、颁奖式、开幕式、首映式

式21 自然科学中表明某种规律的一组符号不等式、方程式

式2 一种语法范畴,通过一定的语法形式叙述式、命令式

表示说话人对所说事情的主观态度

通过“式”这5个义项的对比,我们认为“式”的类词缀构词是以义项为基础的,主要指“样式”,虽然这个义项是《现汉》的第一条解释,但在这个义项上生成的词能产性比较强,前面可搭配的成分多,形成了“X式”这样一个“造词模子”,所以我们认为“式”还是可以看作类后缀的。

类似于“~式”的类后缀,还有“状”。“状”也是一个多义语素,它在指“形状;样子”时,才是类词缀,如“蜂巢状、放射状、贝壳状、迎人状、漏斗状、非结晶状、不规则状、扫把状、吞水吐射状、饼状、胶状、保护状、蝙蝠状、膏状、透明状、自然破裂状、目不斜视状、疼痛钻心状”等词,都是这个义项构成的词,而在“起诉状、上诉状、申诉状、责任状、军令状”中的“状”,是指“诉状”义,意义没有虚化,所以表示“诉状”的这个义位构成的词,不是类词缀构词。“~式、~状、~型”等处理成类词缀,是因为我们认为这些语素都是表示“样式”,而且这些语素搭配的成分多,构造新词的能力强。

3.4 不成词语素

这里所说的“不成词语素”只是“相对不成词语素”。按照马庆株(1995:60)的解释,相对不成词语素有两个或更多的义项,有的义项使它有时定位,另外的义项又使它不定位。尽管在词缀义上定位并可能不成词,在其他义项上还是不定位的并且是可能成为词的,这就是相对不成词。比如“狂、迷”可以充当形容词或动词,但是在指某类人时,这些语素就不成词了,再如“热”,在“资产经营热、书画热、养鸡热”中是指“某种热潮”,是不成词的。

我们在确立类后缀时,发现很多成词的能产性很强的语素,如“法、病、权、量、站、队、室”等语素。这些语素构成的词有很多,如“广告法、票据法、佝偻病、肠胃病、稻热病、主办权、决定权、埋藏量、生长量、发生量、雷达站、辅导站、四川队、汽车队、总裁室、监察室”等,但由于这些语素是成词语素,所以不把它们列入类词缀的行列。需要指出的是,成词语素和不成词语素在现代汉语中也不是能截然分开的,也有一些“灰色”地带,不好区分成词与否,这里基本依据的是《语法信息词典》对于词性的标注。

通过对前面类词缀性质的探讨,我们把具有定位性、语义上比较虚化的能产性强的不成词语素称为类词缀。

3.5 类词缀与部件词的区分

通过对8万词数据库的统计分析的全盘考虑,我们认为现代汉语“词内成分”(董秀芳,2004:165)中,有必要强调能产性强、意义没有虚化的部件词。比如以“人”为词末构成的三字词在8万词库中有161次,其中有155次是“2+1”式的“XX人”结构,如“证婚人、年青人、老年人、纳税人”等,但这些词可以用“什么人”来提问,“人”是一个成词语素和自由语素,我们不把“人”之类的名词看作是类词缀,只是把它看作是部件词。像“人”之类的部件词还有很多,如“队、店、山、鱼、油”等等,譬如以“鱼”为词末构成的三字词也很多,如“养殖鱼、乌贼鱼、虹鳟鱼”等。这些语素是成词语素,意义没有虚化,不能算作类词缀,但这些语素构词能力强,构词也很有规则,是构词部件,属于“部件词”。因为这些语素是常用词,属于认知语言学中的基本层次(basic-level)范畴,所以以这些语素构成的词很多。

类词缀和部件词有很多相似的地方,构词的能产性都很强,差别主要有两点:一是部件词意义比较实在,而类词缀意义比较虚化;二是类词缀有定位性,部件词没有定位性。我们之所以把部件词和类词缀区分开,还因为部件词可以前加“什么”来提问,如可以用“什么人”、“什么鱼”来提问;而类词缀前面一般不能加“什么”来提问,如不能说“*什么界、*什么化”等。

如“X族”方式构成的词,在三字词词库中一共29个,有26个“X族”中的“族”是指“种族;民族”,如“土家族、哈尼族、布依族”等;有3个“x族”中的“族”是指“事物有某种共同属性的一大类”,如“追星族、工薪族、保安族”等。这两个义项的“族”,我们认为表“种族;民族”义的“族”是部件词,表示“事物有某种共同属性的一大类”的“族”是类词缀,前者可以用“什么族”来提问,后者不能,说明后者的意义在虚化。如语料中有这样的例句:

(1)最后一部小说《鹿鼎记》主人公韦小宝到底是什么族就不知道了,他妈妈交往的男人很多,汉、满、蒙、藏等民族的人都有,所以说不清韦小宝是哪一族人。

(2)究竟算什么人,或叫什么族,这是民族工作者去识别和鉴定的问题,我是没有发言权的。

虽然在《语法信息词典》三字词词库中,收录的“XX族”词只有3个,但在1998年《人民日报》语料库中“XX族”三字词有15个,如“上班族、开车族、打工族、下岗族、私车族、长衫族”等等。“族”前的成分可以是动词性的,如“上班、开车、打工、下岗”;也可以是名词性的,如“私车、长衫”。作为类词缀的“族”前面可搭配的成分有动词性成分和名词性成分,搭配的词类序列可以概括为“vp+族”或者“np+族”。

有些名词性语素可以充当高频的部件词,如“剂、籍、工、服、石、夹、间、片、史、委、系”等,比如以“剂”为部件构成的词在8万词中有85个,如“杀虫剂、漂白剂、强心剂”等。再如“籍”,在1998年上半年《人民日报》的语料库中,就出现了“XX籍”的三字词达37词之多,有“国名+籍”的,如“法国籍”;有“省名+籍”的,如“贵州籍”;还有“城市名+籍”的,如“本溪籍”等。部件词构词频度高,像这样的词在构词上相当于刘源等(1994)所说的接尾词,刘源等(1994)列了“班、表、兵、波、部、厂、剂”等98个接尾词,中央研究院的中文词知识库小组(1996)则收集了如“坝、波、簿、杯、碑、籍、剂”等180个接尾词。

我们通过对词库的调查,发现现代汉语词汇中有很多能产性强的构词部件,这些构词部件并不能都称之为类词缀,它们有词缀、类词缀和部件词之分。

四、基于词库所确立的类词缀的范围

我们所列举的类词缀是在现代汉语的词库及语料库中,通过实际的调查,并结合类词缀的性质而确立下来的。

本文首先调查语素在三字词中位于词首的频率,按照频率的高低和前面所确立的类词缀标准,逐一筛选类前缀,共有23个类前缀;然后抽取三字词中位于词末的语素,按照频率的高低和前面所确立的类词缀标准,逐一筛选类后缀。我们就是按照这种定量研究和定性研究相结合的思路,来考察现代汉语的类词缀的。计量分析是研究的基点,定性研究是类词缀的确立标准。

我们调查出的类前缀有23个,分别是:

半、不、超、大、代、单、第、多、反、泛、非、负、副、可、老、类、零、软、伪、无、相、小、总

这23个类前缀中,“可、相”2个语素只能充当二字词的类前缀。(注:充当二字词的类前缀“可、相”等在新词的构造中能产性有限,派生的词大多可以收入词库中。)

我们没有把“阿”列入类前缀,因为“阿+姓氏”这一规则可生成很多的词,如“阿唐、阿王”等等,这一规则具有周遍性。

通过定量研究和定性研究相结合,我们共整理出了53个单音节的类后缀,分别是:

带、单、度、额、犯、方、费、风、感、观、鬼、户、化、机、计、记、家、件、界、狂、力、率、论、

迷、面、品、期、气、器、群、热、赛、商、生、式、手、术、体、物、星、形、型、性、学、业、仪、

员、园、者、症、制、状、族

除单音节词缀外,还有两个音节以上的词缀,如“~巴巴、~沉沉、~冲冲、~主义、~不溜溜”等,这些词缀没有在表中列出来。需要注意的是,类前缀和类后缀常结合在一起用,如“泛”常和“化”“论”“主义”等类后缀一起组合成词,如“泛道德论、泛日耳曼主义”等词。

我们把每个类前缀和类后缀的频率、拼音、义项、举例列出,指明在哪个义项上这个语素可以类词缀构词,另外还参考中央研究院的中文词知识库小组(1996)的报告(简称“中研院”)和刘源等的《信息处理用现代汉语分词规范》(简称“《分词规范》”)的内容,根据“中研院”和“《分词规范》”有无这个类词缀而设立“中研院情况”和“《分词规范》情况”(注:我们把中央研究院的511个词缀、接头词和接尾词等录入数据库中以便对照,并把刘源等的《信息处理用现代汉语分词规范》168个词缀、接头词和接尾词也录入其中。中研院和刘源等只是列举出词,而没有考察义项、所构成词的切分和结构关系等。),填“有”或“无”两个字段。我们对每一个类词缀从读音、词性、义项、同形、词频、构词等方面进行多维考察,建立了类词缀知识库,力求全面而系统地考虑类词缀在什么条件下构词,比如有些语素有几个词性,有多个义项,把这个语素所有的词性都列举出来,并把这个语素构成的所有的三字词的词性列举出来,并把这个语素构成的三字词的结构切分出来,看看这个语素是否在以类词缀的方式构词,以此来确定类词缀。

下面以“机、费、力、期、感、热”等语素为例来说明它们的类词缀构词情况:

通过对类后缀构词结构的考察,我们发现类后缀构成的词大部分是定中结构,充当类后缀的语素如果兼属几种词性,做类后缀时一般是“名语素(Ng)”,如上表中的“书画热”中的“热”词性标注为Ng比较合适。还有“保安费”这一词切分之后,“费”计算机有自动标注成v的情况,这是应该避免的。

在附录1和附录2中我们只摘取类词缀知识库中的主要信息加以说明。附录包括有类前缀词目和类后缀词目,每一条记录的编排顺序如下:词目、出现频率、义项,义项用《现汉》的标注条目。和“中研院”“分词规范”的比较信息,将“中研院”没有收录的加下划直线,“分词规范”没有收录的加下划曲线,二者皆无的加*号,上标“1、2”之类引用《现汉》的标注,如果某语素只有一条义项,《现汉》没有标出其序号,我们也不标序号。另外,如果有不同意《现汉》解释的地方,我们就在注释中标出,或加括注说明。

五、结语

本文所确定的类词缀是基于词库的定量研究和定性研究的相结合,和前人所确立的类词缀相比,有不少继承,但也有一些发展。本文在确立类词缀时,是基于词库来研究的,对于《语法信息词典》中统计出来的高频语素,有些是学界已经大都承认的类词缀,如“性、学、员、化、品、者、率(lǜ)、家、式”等;但还有些是我们和少数学者收录的类词缀,如“机、器、品、费、力”等,也因其高能产性而收入。另外,在类词缀确立的标准上,我们对“类词缀的定位性”强调得更加具体,强调类词缀定词性、定义项、定词中的位置,在对类词缀的描写上更加具体。由于对类词缀的特征——虚化程度的理解不大一致,我们理解“虚化”除了有表达性派生之外,还有功能性派生,另外还扩展到语义上的“格”,综合考虑类词缀的统计数据和性质,确定了类词缀的范围,一方面为适应对外汉语教学的需要,另一方面也是为了中文信息处理的需要。

我们确定的类词缀的范围和前人的研究有所不同,一个是标准的差异,另一个是语言的发展。近年来,汉语新词语的构词过程正兴起“词缀化”倾向,类词缀的数量正出现扩充的趋势,数量增多有两个原因,一个是从外语翻译的词多,另一个是本土用类推的方式构造的词也很多,这就使派生法构词具有越来越重要的意义,有关类词缀的研究也更有价值。

注释:

⑨我们在调查语料基础上把义项增改为“用于某些名词、动词、形容词或名词性语素前,构成具有否定意义的形容词”。

⑩义项增改为“在体积、面积、数量、力量、程度、强度、幅度等方面超过一般或超过所比较的对象”。

(11)我们增加一义项为“用在事物名前,表示分类”。

(12)该义项词典没有,我们确定为“指生产、经营、科研等部门中的非设备性因素”。

(13)义项增改为“在体积、面积、数量、规模、力量、程度、地位、年龄等方面不及一般或不及比较的对象(跟‘大’相对)”。

(14)我们增加一义项为“用在事物名前,表示分类”。

(15)我们归纳“小”的其中一个义项为“表示爱称、小称”。

(16)我们增加一义项为“指某种狂热的人”。

(17)在《现代汉语规范词典》义项基础上解释为“游览娱乐的场所或集中发展某事业的区域”。

(18)“症”读音为zhèng,意思为“疾病”。

标签:;  

现代汉语词缀的定量与定性研究_现代汉语论文
下载Doc文档

猜你喜欢