“气恼”一词的词类标注问题研究-基于语料库的个案分析论文

“气恼”一词的词类标注问题研究
——基于语料库的个案分析

王正奎

(四川外国语大学 研究生院,重庆 400031)

[摘 要] 关于“气恼”一词的词类标注,在13部标注词类的词典中有较大分歧。文章基于国家语委语料库和北京大学中国语言学研究中心语料库,以双层词类范畴化等理论为指导,对“气恼”一词的词类进行全面的鉴定,将“气恼”一词尝试性标注为名形兼类词,并对其进行解释和配例,以期对未来汉英词典编纂有一定的启示。

[关键词] “气恼”;语料库;双层词类范畴化;词类标注

词类标注在汉语词典和汉英词典编纂中是牵一发而动全身的大事。《现代汉语词典》(第五版)首次尝试全面标注词类,此后其他汉语词典和汉英词典也开始标注词类,其中语料库的兴起和发展起到至关重要的作用。[1]大多数汉语词典和汉英词典的编纂都是基于对语料库使用模式的调查,但对语料库的使用还不够系统和高效。王仁强认为,汉英词典词类标注理论不够成熟,研究手段不够新,主要以理论思辨和举例为主,少有实证研究,而一些重大原则性问题上的分歧都需要实证研究支持。[2](P8)所以,现有汉语词典和汉英词典词类标注的准确性都存在一定问题。诚然,汉语的词类划分一直是一个老大难问题,汉语言学界对于汉语词类划分也没有达成共识,其中对兼类词的标注尤甚。而不少词典的编纂都遵循“简略原则”,存在人为减少兼类词数量的现象。[3](P12)下文中,笔者将利用双层词类范畴化理论模型和相关语言学理论,结合对国家语委语料库和北京大学中国语言学研究中心语料库使用模式的调查,对“气恼”一词的词类作出判别。

一、研究问题

笔者发现,“气恼”一词无论是在汉语词典还是在汉英词典中的词类标注都存在较大分歧。那么,“气恼”一词到底应该归属什么词类,是形容词、动词、动形兼类抑或其他词类?本文对13部标注词类的词典中的“气恼”一词的标注(见表1)进行对比后发现,“气恼”一词,6部汉语词典中有4部将其处理为形容词,2部将其处理为动词。7部汉英词典中有3部将其处理为动词,4部将其处理为形容词。

值得一提的是,“词类对译”是双语词典编纂的重要原则,是指在双语词典的词目翻译中“应尽可能使用与源语词词类相同的译语词”。[4]即“词类对译”要求双语词典词目翻译中对应词与源语词目不仅词义相等而且词类相同。完善的汉英词典理应做到这一点。但除了《外研社·柯林斯:英汉汉英词典》(2007)遵循“词类对译”原则将“气恼”一词处理为形容词“sulky”外,其他6部汉英词典,均没有严格遵守“词类对译”原则,并且配例也存在和原词目词性的不对称。本文基于“气恼”一词在语料库中检索结果的分析,对其作出尝试性词类标注,以期能够给汉英词典编纂带来启示。

结合相关的调查报告显示,外国的商业银行业务线基本都是全球一体化纵向趋势,为了尽快适应这种体系,他们的审贷官序列是采取纵向方式进行,根据产品以及客户的需求为基本导向的银行治理体系也是当代的商业银行发展的主要趋势。与之配套形成的就是所有的银行都具有一个独立存在的风险审贷官,主要负责独立进行审贷工作,因此,为了进一步保证审查人员的独立存在,就要摒弃分行业务考查,将分行审查人员从分行考查中独立出去。他们直接接受银行总部的统一考查管制,可以构建信审高水准人员序列以及与之配套的考查办法,银行分别根据这个方法为基础标准进行薪资的发放以及管理审批人员等。

表 1 6部汉语词典和 7部汉英词典对“气恼”的词类标注和释义处理

二、研究设计

1.语料库的选取

笔者选取两个大型权威平衡汉语语料库进行检索,首先是国家语委语料库,该库语料选材类别广泛,时间跨度大。在线提供检索的语料经过分词和词性标注,可以进行按词检索和分词类的检索。笔者在国家语委语料库中对“气恼”一词进行了关键词检索,共得到38条索引,经过筛选,其中36条为有效索引。基于国家语委语料库检索索引行总条数较少的考虑,笔者又选取了北京大学中国语言学研究中心语料库(简称CCL语料库),该库由现代汉语、古代汉语、英汉双语、专项语料库等子语料库组成。通过在CCL语料库中的现代汉语语料库对“气恼”一词的检索,得到546条索引,通过筛选,得到531条有效索引。通过对上述数据的综合分析,笔者对“气恼”一词的词类归属进行了全面考察和判断。

2.研究方法

3.语言使用理论

2.常规与拓展理论

三、理论基础

1.双层词类范畴化理论模型

王仁强指出,词类的范畴化在词的两个层面发生,即个体词例的词类范畴化和概括词的词类范畴化;前者是说话者对包括指称、陈述、修饰、辅助等表述功能的表达过程,后者是语言社群集体自组织的一个过程,其核心为规约化/相变。[6]即:在言语层面句法中的词类和在社群系统语言层面词库中的词类不能混为一谈,需要通过对语料库使用模式的调查,抽样分析个体词例在句法层面的表述功能,并根据其规约化程度来确定社群系统语言层面词库中词类归属,典型的就如汉语词典的词类标注。

由于词类标注是汉英词典准确译义的关键,[2](P139)所以词类划分的标准和依据是一个极其关键的问题。郭锐指出,“词类的本质是表述功能”,[5](P83)表述功能是指词语表达语义的模式,相当于词语的语法意义;王仁强指出,词的本质功能是语法功能,判断词类的最主要依据是语法功能标准。只有基于语料库使用模式的调查,才能更加准确发现个体词项的无标记语法功能,也就是个体词项的规约化用法。[2](P18)可见,对于词类的判断不能仅仅依靠理论思辨和直觉内省,而应该是基于对语料库使用模式系统而全面的调查。本文将基于两个语料库的数据,并根据个体词项的语法功能对“气恼”一词词类进行判断。

曹操对何晏特别宠爱,问他愿意不愿意给自己做儿子,如果愿意,就改个姓氏,当亲儿子养。要知道,曹操的父亲曹嵩就是养子出身,曹家对血缘关系这件事看得比较淡。

(3)如果容量为1MW及其以上的发电机定子绕组和引出线出现短路,需要装设纵联差动保护。其保护配置作为发电机内部短路的主要保护,能及时、灵敏地切除内部所发生的故障,确保动作的选择性与工作的安全性。

综上所述,从初始模型,经过3次修正,得到与实际收集数据契合的较优模型:修正模型3,从而检验了“高职院校数学教师核心素养量表”建构效度的适切性和真实性.4个模型的拟合度检验数值对比见表5,修正后量表的题项分布与计分如表6,“高职院校数学教师核心素养量表”项目修编情况一览表见附录3.

通过对“气恼”一词在国家语委语料库检索得到的36条有效索引行进行分类后,发现国家语委语料库将“气恼”一词无一例外地标注为动词。根据个体词项在句法层面的语法功能,即它们到底属于指称、称述、修饰,还是辅助这四大表述功能中的哪一类,笔者对其进行重新标注,得出表2数据。从表2可以看出,形容词、副词、名词、动词均占一定比例,其中形容词占比最高,达41.67%,动词占比最低,只有8.33%,这与国家语委语料库对“气恼”一词标注大相径庭。由于国家语委语料库索引行总量有限,在统计学上,越大的数据统计结果才越可靠,所以,笔者对“气恼”一词在CCL语料库中的531条有效索引进行人工标注,得出表3数据,更大的数据展示的结果与表2大体相符,形容词、副词、名词、动词的占比均遵循从高到低的排列顺序,只是在具体占比上有一些差异。对表2、表3综合分析发现:(1)国家语委语料库对词类标注存在一些问题。(2)通过对类型频率的分析,初步得出结论:“气恼”一词在言语层面句法中不仅具有动词和形容词的词性,也具有名词和副词的词性,但名词和动词个例频率较低,单就个例频率来看还无法判断名词和动词的用法是否规约化。

四、调查结果和讨论

语言使用理论认为,语言从本质上来讲是一个复杂适应系统,语言结构始终处于动态变化之中,语言结构是在使用中涌现出来的,而使用频率在语言结构的固化和规约化过程中扮演着重要角色。也就是说,语言结构或者语言知识和语言使用处于一个相互作用、相互影响的过程中。那么,调查个体词项使用频率对于判断个体词在社群语言层面的词类就显得至关重要。王仁强和陈和敏指出,词语词类规约化有四项标准,分别是超高的个例频率、较高的类型频率、久远的时间跨度以及广泛的使用语域,[8]其中,前两者更为直接和重要。

常规与拓展理论是一种基于词库的语料库驱动的自下而上的理论方法。它能帮助人们更好的了解词是怎样结合在一起生成意义,改变人们头脑中基于传统的句法结构。常规与拓展理论强调语言与言语的辩证关系,指出语言演变呈现的是一种双螺旋结构,双螺旋的两个部分——常规与拓展不是截然区分的,而是螺旋结构的两个极点。[7](P411)该理论区分了常规与拓展两个部分,即意义事件和意义潜势。它指出,在自然语言中,主系统控制着一个词常规的或者是规约化的用法,并与次系统的控制拓展式相互交织。主次系统在使用词语的过程中激发出自然语言的能量和灵活性。用法是否规约化则取决于对多个语料库的统计和文本语料的分析。

表 2“气恼”一词在国家语委语料库中的 词类分布

表 3“气恼”一词在 CCL中的词类分布

由于国家语委语料库中“气恼”做名词和动词索引行数较少,都不足十条,我们进一步考察了其在CCL语料库中的三种情况:(1)其做动词宾语和动词的搭配情况(见表6);(2)其做主语时和谓语的搭配情况(见表7);(3)其做介词宾语的搭配情况(见表8)。

从表4、表5可以看出,形容词可以做谓语、定语、补语,以及加“地”做状语,且占比都比较高,可见“气恼”一词做形容词已经规约化。另外,“气恼”一词在表4中除了一个名词短语加“地”做状语以外,其他都是“气恼”加“地”做状语。表5中“气恼”加“得”和加“地”做状语分别占比0.94%和19.21%,而“气恼”单独做状语则只有0.75%。由此可见,“气恼”一词几乎不能独立做副词,充当状语功能,而要和“地”等词连用做副词。根据词类划分的标准应该是无标记的句法功能,笔者认为,不宜将“气恼”一词单独划分出副词的义项,可以添加一个附加义项:气恼地,<副词>。接下来需要思考的是,“气恼”是否应该标注名词和动词的词性。在表2和表3中,名词的个例频率分别是19.44%和15.63%,这个占比略微低于20%,不足以判定其名词词性是否规约化。在表4中,名词作主语、动词宾语、介词宾语,以及做名词短语的类型频率分别是2.78%、2.78%、11.11%、2.78%。在表5中,名词作主语、动词宾语、介词宾语的类型频率分别是3.58%、9.60%、2.45%。

表 4“气恼”一词在国家语委语料库中的类型频率

表 5“气恼”一词在 CCL中的类型频率

如前面提到的,个例频率和类型频率对于判断个体词类在言语层面句法中的词性是否规约化到社群系统语言层面词库中具有至关重要的作用,也就是说,没有较高的个例频率或类型频率,个体词类在句法层面的词性只能算词类活用,还没有规约化或者固化到社群语言层面词库中。在表2、表3中展示了形容词和副词较高的个例频率,均超过20%,那么个例频率不到20%的名词和动词是否规约化了,还需要继续考察类型频率,笔者分别整理了“气恼”一词在两个语料库中的类型频率,得出了表4和表5数据。

表 6“气恼”在 CCL语料库中做动词宾语时和动词的搭配情况

表 7“气恼”在 CCL语料库中做主语时和谓语的搭配情况

表 8“气恼”在 CCL语料库中做介词 宾语时的搭配情况

表6、表7、表8的数据进一步展现了“气恼”一词做名词较高的类型频率,尽管其个例频率较低,但仍然可以根据“气恼”较高的类型频率判断其名词词性已经规约化。最后,“气恼”一词的动词个例频率最低,在表2和表3中分别占比8.33%和5.08%,都不足10%,一般来说,我们可以判断“气恼”一词的动词用法还没有规约化。出于更严谨的考虑,笔者进一步考察了其类型频率,在表4中,“气恼”一词只充当及物型谓语成分,类型频率也只有8.33%,在表5中,“气恼”一词充当及物型谓语成分和不及物型谓语成分,其类型频率也只有3.95%和0.94%,还有一个充当补语的用法,类型频率还不足1%。再深入调查其在CCL语料库中搭配情况,发现“气恼”一词做及物动词时,只有加入做宾语和加宾语从句两种有限的搭配模式,做不及物动词搭配更加有限,只有主语加不及物动词这一种搭配情况,且其中“气恼了”出现了11次之高,也就是说超过40%的“气恼”动词用法均添加了助词“了”,都有了标记,词类判断的标准是其无标记语法功能,所以,无论从个例频率和类型频率还是语法功能来看,“气恼”的动词词性都没有达到规约化,属于词类活用,不能标注到词典中。所以,笔者建议将“气恼”一词的词类标注为名形兼类,并将其在汉语词典里的词类、释义、配例处理为:【气恼】qìnǎo 生气;气愤;愤怒;恼怒。(1)形容词 流言使他很~/如果我考试不及格,妈妈会~的。(2)名词 他的~烟消云散了/~积压在心头,即将要爆发。(3)~地 副词 他~地说出了这番话。

新农村建设关系着农村人民的基本生活,土地是农民生存发展的基础,涉及到土地的问题都可能损害农民利益。为了真正实现社会主义新农村建设,国家应重视与土地有关的问题,对已经出现的问题实施具体可行的解决措施。

五、结论和启示

1.结论。传统兼类词目义项排列方式一般分为三种:历史顺序、逻辑顺序和使用频率顺序。[9](P71)本文基于使用频率顺序对其义项进行排列,释义和配例将遵循以上提到的“词类对译”原则,使得释义和配例中的词类和相应词类高度一致。所以,对于“气恼”一词在汉英词典里的词类、释义、配例,笔者尝试性将其处理为如表9所述。

表 9“气恼”一词在汉英词典里的词类、释义和配例处理

2.启示。通过对“气恼”一词分析发现,目前的汉英词典在词类标注和词类对译上有一定问题。笔者认为,其原因主要有四点:(1)汉英词典的词类标注没有基于对大型权威平衡语料库使用模式系统全面的调查。(2)汉英词典的编纂可能是依托于权威汉语词典,而权威汉语词典依然在对大型权威语料库使用模式的调查不够系统和全面,词类标注依然存在不足。(3)不少汉语语法和词典学方面的研究恪守了“词义不变,词类不变”和“兼类尽可能少”的简略原则。[10](4)国家语委语料库的词类标注也存在一定问题。这些都在一定程度上影响了汉英词典词类标注的准确性,特别是在对兼类词的处理上。另外,在词典编纂过程中,没有严格遵循“词类对译”原则,造成汉英词典的词类、释义和配例显得牛头不对马嘴,这些都给词典使用者造成一定的困扰。

总之,在词典编纂过程中,一要基于对大型权威语料库使用模式系统、全面、自下而上的调查,不能完全凭借理论思辨和直觉内省;二要以语言事实为依据,提升语料库词类标注的准确性,而不是一成不变地尊崇“简略原则”;三要完善汉英词典中的“词类对译”,提高词典使用者对于汉英词典的使用效率,一方面帮助对外汉语学习者生成语法正确的汉语,另一方面加深汉语母语学习者对母语词汇及其英语对应词的认识和理解。

本节课的小结没有采用传统的问题式方式,而采用描述“中国馆”的外形这一活动,学生能自觉的将它抽象成图形,并分为两个部分,一个部分是熟悉的长方体,可以通过名称描述它的形状,另一个部分是不熟悉的棱台,可以通过表面的平面图形或者通过熟悉的立体图形描述它的形状,其实质就是学生在这节课里获得的知识和积累的经验的最美诠释.

[参 考 文 献]

[1]王馥芳,罗敏莉.语料库词典学的兴起与发展[J].辞书研究,2004,(5).

[2]王仁强.认知视角的汉英词典词类标注实证研究[M].上海:上海译文出版社,2006.

[3]王仁强.现代汉语兼类问题研究——兼评索绪尔语言学思想的重要价值[J].外国语文,2013,(1).

[4]黄建华.改进双语词典的翻译[J].辞书研究,1998,(2).

[5]郭锐.现代汉语词类研究[M].北京:商务印书馆,2002.

[6]Wang R Q.Two-Level Word Class Categorization in Analytic Languages[M]//Proceedings of the 36th Annual Conference of the German Linguistic Society. Germany:University of Marburg,2014.

[7]Hanks P.Lexical analysis:Norms and exploitations[M].Cambridge:The MIT Press,2013.

[8]王仁强,陈和敏.基于语料库的动词与构式关系研究——以sneeze及物动词用法的规约化为例[J].外语教学与研究,2014,(1).

[9]黄建华,陈楚祥.双语词典学导论[M].北京:商务印书馆,1997.

[10]王仁强.语法隐喻与汉语词典自指义项的设立——一项基于语料库的研究[J].外国语文,2009,(1).

The Study of Word Class Labeling for “qi -nao ” ——A Corpus-based Case Study

WANG Zheng-kui

(Sichuan International Studies University,Chongqing 400031 China)

Abstract :It is found that the word class membership of “qi-nao” in 13 dictionaries with overt word class labeling are at variance. Thus,on the basis of the corpus of CCL (Center of Chinese Linguistic PKU) and the corpus of national language committee of China,this paper takes an empirical study of the Chinese word “qi-nao” to comprehensively investigate its word classes under the guidance of the Two-level Word Class Categorization Theory,consequently labeling “qi-nao” as a noun-adjective multi-category word. Henceforth,this paper brings implications for the future Chinese-English dictionary compiling.

Key words :“qi-nao”;corpus;two-level word class categorization;word class labelling

[收稿日期] 2018-10-16

[基金项目] 2017年重庆市研究生科研创新项目重点项目,项目编号:CYS17256;2018年四川外国语大学研究生科研创新项目,项目编号:SISU2018YY16。

[作者简介] 王正奎(1993-),男,四川阆中人,硕士研究生,主要从事词典学、对比语言学、语料库语言学研究。

[文章编号] 1004— 5856( 2019) 10— 0110— 05

[中图分类号] H314.2

[文献标识码] A

doi: 10.3969/j.issn.1004-5856.2019.10.027

责任编辑:谷晓红

标签:;  ;  ;  ;  ;  

“气恼”一词的词类标注问题研究-基于语料库的个案分析论文
下载Doc文档

猜你喜欢