基于平衡语料库的现代汉语“喊”字义项分布研究*
文马虹, 艾红娟
(西南大学 文学院 , 重庆 400715)
[摘 要 ]文章首先从7.83亿字的CCL语料库中分类下载34031条共计298万字的“喊”字语料,接着再按比例从中抽取10034条共计82万字建立“喊”字平衡语料库。通过穷尽性分析,发现“喊”除了《现汉》已有的3个义项外,还有3个新义项,即“提出、呼吁”,“报价、叫价”,“抱怨”。
[关键词 ]喊;平衡语料库;新义项;框架语义学
李仕春(2013)[1](2016)[2]等系列论文指出,与传统凭借语感或卡片编纂的词典相比,依靠语料库技术对词典释义会更加精细完善,义项收录会更加全面,目前用语料库技术研究常用词义项分布情况在欧美已得到普遍运用,而我国汉语类语文性词典的编纂者或研究汉语词汇的学者对语料库技术的使用才刚刚起步,语料库技术并未得到广泛认可和大规模运用。本文以个案研究的形式运用语料库技术方法对现代汉语常用单音词“喊”的义项分布情况进行了研究,在已有释义的基础上又发现了3个新义项。这既证实了李仕春的观点也验证了张志毅先生的观点:“今天的语料库已经成为能量巨大的语言样本集,它正在印证、充实、修订、改写甚至颠覆以往的辞书释语,它也正孕育着更现代、更可信的辞书!”[3]
从河北里庄到北京王府井,从金台西路到王四营,70年来,人民日报印刷厂与人民日报风雨同舟、同甘共苦、不断壮大,始终是党报事业的重要组成部分。无论是在硝烟弥漫的战争时代、激情燃烧的建设岁月,还是在波澜壮阔的改革时期,人民日报印刷厂始终秉持党报人的优良传统,以高度的政治责任感和强烈的历史使命感,奋战在党报印刷出版的第一线,为人民日报事业的发展做出了积极的贡献。
一 、建立现代汉语 “喊 ”字平衡语料库
截止2018年6月16日,北京大学中国语言学研究中心研制的CCL语料库共计约7.83亿字,其下分古代汉语和现代汉语两个语料库,现代汉语语料库的二级分类包括当代和现代两大类语料;三级分类包括CWAC、口语、史传、应用文、报刊、当代文学、电视电影、网络语料、翻译作品、戏剧、现代文学等12类;四级分类细分为33类语料。由此可见,北大CCL语料库的建立者在采取语料时是非常注重其平衡性的,但是有些学者在运用时却又不注重其平衡性,例如有学者运用CCL语料库时写道:“我们在北京大学汉语语言学研究中心现代汉语语料库中截取了前 1000 例含‘收’的例句”[4],这种随意采取语料的方法是不可取的。为了能够真正描写清楚语言特点,我们认为运用语料的正确方法是既要保证所取语料在量上具有充足性,同时还要保证所取语料的均衡性,为此,我们首先从CCL现代汉语语料库中分类下载33类共34031条298万字的“喊”字语料,由于语料规模过大,我们还要做第二次分离,也就是再按比例从34031条语料中抽取10034条82万字的“喊”字语料,这些语料对于研究清楚“喊”字在现代汉语中的义项分布情况就足够了。最后通过导入ACCESS数据库的形式建立“喊”字平衡语料库,“喊”字平衡语料库所含各类语料情况见下表。
表一 :“喊 ”字语料分布情况表
二 、现代汉语 “喊 ”字义项分布情况的描写
按照李仕春(2016)介绍下载和标注语料的方法[5]103-109,我们对“喊”的义项进行穷尽性的标注和分析后,发现“喊”除了《现汉》[6]已有3个义项外,还有3个未收录义项。具体如下:
(一) 《现汉》中“喊”已有义项分布情况
大声叫
此义项共有8966条语料,使用频率是86.69%。例如:
(1)教练齐锡福一声大喊 ! (2003年新华社新闻报道)
(2)观众和声齐喊 道:“结婚!……结婚!……结婚!”(当代报刊《读书》)
(2)主持喊 :一千一百五! (严歌苓《扶桑》)
(3)“那是什么?”卡伦突然喊 道。 (《读者(合订本)》)
经分析可知,蜀冈-瘦西湖风景名胜区海外游客以中青年为主.中年人观赏古典园林、人文景观的消费娱乐观点和青年人观赏自然风光、品尝特色美食的消费娱乐观点与景区旅游资源吻合,他们成为此地游客的主体.
(4)她常常在梦里出现他在雪中呼喊 的影像。 (《读者(合订本)》)
叫(人),呼唤
此项共有752条语料,使用频率是7.27%。例如:
(2)机关好多人暗地里喊 他张老虎。(《历史的天空》)
(2)玉珠将他喊 住,说她委实走不动了。(1993年作家文摘)
(3)努尔哈赤在城下喊 你说话。(李文澄《努尔哈赤》)
(4)外面有人喊 灵芝去开会。 (赵树理《三里湾》)
(1)张英才见他年纪较大,就喊 他王科长。(1993作家文摘)
大家都在说,好个驮子,真是挑了日子的,昨天走得真及时,要是今天再走,就走不了了。 这样的大雪好几年没有见到了。
此义项共有219条语料,使用频率是2.18%。例如:
大约过了两个时辰,我们在牛车河追上了姜大爹他们。我们沿着去山里的路跑,姜大爹说山里偏远,不招兵丁。咸丰年间遍地是长毛,山里也冇闹过,东洋人就更不会去山里的。可东洋人偏偏让姜大爹失了算。我们近五百号人,还赶着猪啊牛的,拥成一大堆,还真是跑不快。赶了十几里快到杜陂时,一队东洋人就把我们追上了。
(1)他向她挥手,高声呼喊 她下来。(张小娴《卖海豚的女孩》)
BIM技术应用主要分为前端信息处理及末端技术控制两个方面,前端信息处理即根据工程施工要求,对工程设计方案的合理性进行分析,并结合现有的工程建设设计资料,对可能发生的工程建设问题进行预估,将工程建设设计方案以立体化形式进行呈现,确保相关的工程建设问题能够更为直观的呈现在技术人员面前。末端技术控制的优势在于,对各个施工环节能够进行合理的管控,并及时的对相关工程质量及安全问题进行调整,主要应用于工程施工阶段的技术管理,使工程施工技术管理更为规范,为工程建设的顺利进行提供有效的技术管理支持。
(3)明天便不必我喊 妈妈了。 (苏青《烫发》)
(4)她本名叫徐丽芳,机关的人都喊 她老徐。(叶兆言《不娶我你后悔一辈子》)
(二)通过语料库分析发现“喊”字新义项分布情况
通过对所建“喊”字语料库语料的分析,发现还有2290条约占7.62%的“喊”字语料无法用《现汉》中已有的3个义项加以说明,根据所建平衡语料库分析统计后,可为“喊”设立以下3个新义项:
呼吁,提出
此义项共有262条语料,使用频率是2.53%。例如:
(1)政府纠正不正之风喊 了多年。(1994年市场报)
(2)深圳,是最早喊 “时间就是金钱”的城市。 (网络语料)
(3)“副”养挖煤煤矿发展多种经营喊 了几十年。 (1994年当代报刊)
创客空间的师资,均来自所在二级学院(系部)教师。教师熟悉所在学院专业、课程、学生,在创客空间指导学生创新项目开展,更有利于将创新创业融入人才培养全过程。创客空间教师根据不同职责分工,有更多机会参加与创新创业培训提升。成都工贸职业技术学院电气工程及自动化系创客空间多次组织教师外出培训,并取得证书。如参加市科技局主办科技企业孵化器从业人员培训,参加市知识产权局主办的企业知识产权管理体系内审员培训班等培训学习。
(4)减轻农民负担年年喊 ,年年却在加重。 (1993年人民日报)
此义项共有84条语料,使用频率是0.81%。例如:
报(价)、叫(价)
那一年暑假,我找来全套小学语文教材,包括人教社92大纲教材、2000年新修订大纲教材,课标实验人教版教材以及课标实验北师大版教材,一口气读完。经验告诉我,解读教材的能力是一个教师的核心竞争力。熟能生巧,没有熟读,就没有真正的文本细读,也就没有文本的教学解读;我尽量熟读课文,要求学生背的,自己要会背;不要求背的课文,也尽量背。解读教材,必须对教材进行梳理,包括对知识点、能力点、学习方法的梳理;对教材解读和梳理,是为了以简驭繁、深入浅出,这恰恰与教学对象“儿童”的特质相符合。
3.方称呼
将消过毒的种子放在25~30℃的温水中浸泡24小时,使种子吸足水分,捞出控干,使种子互不粘在一起,用多层纱布包好,放在25~30℃的条件下催芽。早晚用同样的温水带着纱布冲洗1次,4~6天即可发芽。
(1)甲明星要2万元,乙明星喊 5万。(1993年人民日报)
随着我国海事管理信息化程序的不断增强,对新技术的需要也逐步增大,在所有海事活动中,精确的数据采集与可靠的通信必然是工作的重中之重。精确的数据采集可以最大程度了解周围的实际环境,同时可靠的数据传输可以使控制台实时监控当前情况,尤其是在环境相对复杂的海事活动中。数据采集系统的运行不公提高了船舶的航行安全,同时也可以记录船舶的动态数据,船位、航向等,为海事执法提供了最为客观、直接的证据。一旦发生事故,可以将这些数据采集出来,并进行回放,从而为事故的分析提供最为直接的证据。
(3)而在谈判中,他则先喊 价3000美元。 (哈佛管理培训系列全集)
不同采收期承德产黄芩比较,以年限为主因素,月份为副因素时,黄芩中黄芩苷、汉黄芩苷、黄芩素、汉黄芩素、千层纸素A成分含量在5~7月间最高,2年生与3年生黄芩从成分变化相近,且3年生黄芩成分含量并未较2年生出现明显提高[42]。而陕西商洛产黄芩中黄芩苷、汉黄芩苷、黄芩素成分含量于黄芩生长第2年10月下旬达到最高[43],基于2015版《中华人民共和国药典》载[19],黄芩与春、秋2季采挖,故应选择黄芩生长第2年进行采收,季节视当地气候条件与黄芩有效成分积累而定。
(2)在污泥厌氧发酵过程中,会产生蛋白质类、辅酶NADH和辅酶F420 3类荧光物质。从荧光平行因子分析可以看出,加适量Fe2+能使辅酶F420的荧光峰明显增强,表明其对厌氧产甲烷过程有促进作用。适量Fe2+会促进微生物细胞破胞水解,胞内物质释放,使得污泥中羧基、醇和酚等官能团增强。
(4)刚断奶的“云巴”,每只喊 一千元。 (1994年市场报)
抱怨
此义项共有61条语料,使用频率是0.59%。例如:
(1)表决结束后,大使们纷纷喊 胳膊酸痛。(读者合订本)
残疾助行器的最大用途是让身有残疾的使用者们享受产品,把普通的使用变为获得对生活的享受,使他们获得生理补偿和心理安慰。想要使设计的助行器更加方便残疾人,就需要设计者们深入残疾人群体,切实感受他们的生活,更加全面地考虑他们的需求,这是残疾人步行机设计的重要出发点。在结合自己设计学知识的同时,设计者应从产品本身出发,分解和熟悉助行器的结构,以便研究和分析残疾人助行器的设计过程,使之更加人性化、理性和科学。
(2)班里有个男青工,抬了两桶就喊 累。 (1993年人民日报)
(3)工作人员喊 卖书难,读者抱怨买书难。 (1994年报刊精选)
(4)考试、补课本来就不少,孩子常常喊 累。 (网络语料)
三 、现代汉语 “喊 ”字义项分布衍生的解释
“喊”在收字4574个常用汉字频率表中排第665位[7],可见其使用频率相对较高,使用频率越高的词,其词义也就容易发生变化。“动词会随着论元结构及搭配对象的变化而增加它的意义,产生动词多义。”[8]我们在标注语料的过程中发现,“喊”作为及物动词,它的论元结构[9]主要由主体论元和客体论元构成①,两者的变化都可能使“喊”产生新义。
当“喊”的主体论元为施事,即为一个人或一群人,客体论元为受事,即表“喊”的具体内容时,“喊”的意义为《现汉》已有义项大声叫,如“呐喊助威”、“大喊着火”、“喊救命”、“齐喊结婚”、“喊打喊骂”、“喊口令”、“喊快来人”等;当“喊”的施事论元不变,客体论元为对象论元,即表示具体的人名或称谓时,“喊”有两个义项,即“叫(人),呼唤”和“○方■称呼”;如果对论元角色没有称谓上的补充,“喊”的意义为《现汉》已有义项叫(人),呼唤,如“喊她”、“喊小张过来”、“喊你吃饭”、“喊你去开会”、“喊小王去报账”、“喊她回来过年”、“喊他们下来”;当“喊”的对象论元有同位语作为称谓上的补充说明时,“喊”就产生了《现汉》义项3“↓方→称呼”,如“喊他叔叔”、“喊她老师”、“喊他张爷爷”、“喊她徐姐姐”、“喊他王老五”、“喊你二娃子”、“喊她李阿姨”等;当施事论元为政府机关、新闻媒体时,对应的受事论元一般会变为表示某种政策或改革举措的方式,“喊”就产生了《现汉》未收录的义项呼吁、提出”,如“新政府喊改革”、“教育局喊纠正不良学风”、“汽车消费喊刹车”、“当权统治喊打倒孔家店”、“BBC喊捍卫人权”、“报纸电视喊减负”、“农业频道喊多种西瓜,少种其他”、“社会喊男女平等”、“学校喊创新”等;当“喊”的主体论元是施事论元或当事论元,受事论元表价格的数目数量时,这时就产生了《现汉》中未收录的义项报(价)、叫(价),如“客户喊五万”、“销售代表喊价二十”、“护肤品喊七十美元”、“叫卖者喊一千一百块”、“服务员喊八千英镑”、“火车模型喊九百港币”、“电脑喊八千九百元”;当施事论元是人,客体论元为结果论元并表现出消极情绪时,“喊”就产生新义项抱怨,如“司机喊吃亏”、“建筑工人喊胳膊酸痛”、“学生喊腿麻”、“小贩喊卖书难”、“老百姓喊买房难”、“劳动孩子喊吃不消”等。“喊”的客体论元从具体到抽象,因此“喊”的义项也从具体义项到抽象义项,这也符合人们对事物认知的规律。
四 、结语
通过对“喊”字平衡语料库的标注与分析,我们把“喊”在现代汉语中的义项分布情况按照使用频率排列如下:大声叫;叫(人),呼唤;报(价)、叫(价);4方称呼;呼吁;提出;抱怨。
[注 释 ]
① 本文划分论元的理论依据见袁毓林《论元角色的层级关系和语义特征》。
[参 考 文 献 ]
[1]李仕春.语料库视野下的现代汉语“绿”字义项分布研究[J].山西大同大学学报(社会科学版),2013(10):62-66
[2]李仕春.基于语料库的现代汉语“黄”字义项分布研究[J].中国海洋大学学报(社会科学版),2016(5):103-109.
[3]张志毅,长召其.辞书编纂现代化的新理念——人机接口工具使用的智能发挥[M]//乐嘉民,亢世勇.辞书编纂现代化研究.上海:上海辞书出版社,2009:42.
[4]朱彦.核心成分、别义成分与动作语素义分析——以“收”为例[J].中国语文,2006(4):313-320.
[5]李晓倩,李仕春.类型学视野下的现代汉语“哭”字义项分布研究[J].牡丹江大学学报,2018(3):92-95.
[6]中国社会科学院语言研究所词典编纂室.现代汉语词典(第7版)[K].北京:商务印书馆,2016:511.
[7]北京语言学院语言教学研究所.现代汉语频率词典[D].北京:北京语言学院,1986:1312.
[8]Fillmore,C.1968.The case for case.In E.Bach and R.Harm,(ed.) Universals in Linguistic theory,1-90.New York:Holt,Rinehart and Winston.
[9]袁毓林.论元角色的层级关系和语义特征[J].世界汉语教学,2002(3):13-17.
* [收稿日期] 2018-12-03
[基金项目] 国家社会科学基金重点项目:“语料库视野下的现代汉语单音多义词义项分布研究”(14AYY018)
[作者简介]
文马虹(1993-),女,四川成都人,西南大学文学院2017级硕士研究生,从事词汇学、词典学研究;
艾红娟(1976-),女,山东日照人,西南大学文学院副教授,研究方向为音韵学、词汇学。
[中图分类号 ]H030
[文献标识码] A
[文章编号] 1007-9882(2019)02-0126-03
[责任编辑 :黄儒敏 ]