语文词典中同实异名外来词的收录、立目研究*
——基于《现代汉语词典》第7版与《现代汉语规范词典》第3版对比分析
李俊杰 冯海霞
摘 要 文章以《现代汉语词典》第7版和《现代汉语规范词典》第3版中的音译外来词为研究对象,对比分析这两部词典中对同实异名外来词的收词、立目问题,以期优化词典收词、立目的规范性。
关键词 《现代汉语词典》 《现代汉语规范词典》 同实异名外来词
《现代汉语词典》(以下简称《现汉》)和《现代汉语规范词典》(以下简称《规范》)都是以收录汉语通用字词为主要内容的中型语文工具书,从整体来看,它们在收词上都符合中型语文词典的要求,都符合词典编纂的原则,都具有规范性。那么,同样性质、相近水平的两部语文词典对于同实异名外来词的收录、立目情况如何?有无优劣之别?我们对这两部词典的外来词部分的收词及立目进行对比分析,以期对其提出规范化建议。
作为和平时代环境下成长起来的优秀高年级学生,特别是已经接受过思政实践课锻炼,并认同实践课的重要价值的高年级学生,也非常渴望在力所能及的范围内奉献自己的绵薄之力,尽自己所能尽快带领低年级学生主动参与课程实践,把学校生活与社会实践相结合,理论联系实际,使其顺利地成长、成才,这种精神是非常难能可贵的。
一 、 《现汉 》和 《规范 》一方收录一方未收录的情况
“如果词典是规范性的,那么词语是否具有全民性,即是否进入了全民语言,应该成为能否将其收为词目的一个基本衡量尺度。”(孙国秀 2006)所以词频就成了我们衡量词典收词是否规范的重要角度。我们结合语料库从词频角度分析这两部词典收录同实异名外来词的情况。语料主要采用北京语言大学BCC汉语语料库(以下简称“BCC语料库”)和北京大学汉语语言学研究中心CCL现代汉语语料库(以下简称“CCL语料库”)。BCC语料库总字数约150亿字,包括报刊、文学、微博、科技、综合和古汉语等多领域语料,是全面反映当今社会语言生活的大规模语料库。CCL语料库规模约为7亿字,包含部分影视作品语料,部分口语语料,网络语料,书面语语料等。其中,报纸语料占绝大多数。同实异名外来词是指,凡是用不同的形式指称同一个外来概念的外来词,全称与简称、正称与俗称、现称与旧称、同一外来术语的不同翻译形式等都属于异形外来词的范畴。以下分两种情况分析。
船舶设备不同于陆上应用的相关车辆设备,其在设备安装中如设备安装质量不合格,其在实际应用中存在修复难度高,危险性高,且造成的经济损失高的现象。其中具体分析安装振动,造成的安装质量不合格也为常见的一类故障原因。因此从设备的安装效果方面分析,船舶设备在组件安装中应用减振措施,对于设备组件安装质量合格性的保障,发挥了重要的作用。规避了设备在安装中因振动等不良现象,造成的设备组件内部损坏,安装误差等不良现象。
(一 ) 《现汉 》收录 ,《规范 》未收录
据我们统计,《现汉》中收录而《规范》未收录的同实异名外来词有4个,分别是“阿兰若”“罗汉”“旦尼尔”“贝斯”,它们的异名词分别是“兰若”“阿罗汉”“旦”“贝司”。前三组词都是因为简称而造成的异名,“贝斯”和“贝司”这组词是因为翻译过程中使用了不同的汉字。具体如表1:
表1 《现汉 》收录 ,《规范 》未收录的外来词的词频表
(二 ) 《规范 》收录 ,《现汉 》未收录
这类词我们只发现了“康乐球”1例。以下是它在《规范》中的释义和在语料库中的出现次数:
由于短时间内长距离链路的状态比较平稳,RSSI变化不大,为了测试对链路状态的自适应性,在实验发送过程中人为改变了发送功率,使得接收端RSSI发生一次剧烈变化.如图10所示,在这15s内,RainbowRate有效吞吐率的范围是[55.91,88.95],平均有吞吐率为72.50Mbps.而AdaCode的有效吞吐率范围是[79.93,152.64],平均有效吞吐率为127.75Mbps,是RainbowRate的平均吞吐率的1.76倍.
(1) 《规范》中标注词源而《现汉》中未标注
表2 《规范 》收录 ,《现汉 》未收录的外来词的词频表
从表1、表2中我们不难得出这样的结论: (1) 在至少一个语料库中显示词频为0,在另一个语料库中词频极低的词是“旦尼尔”和“旦”这一组,这组词在语文生活中比较少用。《现汉》对“旦尼尔”和“旦”这组词的释义是“纤度的非法定计量单位”,即单位量词,虽然在语料库中出现的例证不多,但是考虑到词典收词的统一性,我们认为它们作为基本的单位量词应该被收录。(2) 在两个语料库中出现频率较低的几组词有“阿兰若”和“兰若”、“康乐球”“克朗球”和“克朗棋”。“阿兰若”一词用例极为罕见,它属于佛教外来词,我们认为《现汉》将其收录进来并作为主条并不是很合适。从《规范》的释义来看,“康乐球”“克朗球”和“克朗棋”这组词是相对比较专业的、在日常生活中少见的同实异名词,普通大众对其认知度比较低,我们认为在普通汉语规范词典中可以不收,而将其收录在专业词典中。(3) “罗汉”“阿罗汉”和“贝斯”“贝司”这两组词在两个语料库中都有出现且用例较多,“罗汉”和“阿罗汉”这组虽然也是佛教外来词,但比“阿兰若”和“兰若”的认知度更高,它们已被《现汉》收录,我们认为《规范》也可以酌情收录。“贝斯”和“贝司”这组词的词频较高,并且是常见乐器,大众对其认知度较高,《规范》没有将其收录,我们认为《规范》可酌情补收。
二 、 《现汉 》和 《规范 》都收录的情况
《现汉》和《规范》都收录的同实异名外来词共有60组,我们将其分为两大类: 完全相同的和存在差异的情况。
(一 )完全相同的情况
这类同实异名词是指在《现汉》第7版和《规范》第3版中的收录情况一致。比如“奥林匹克运动会”和“奥运会”这一组词在两部词典中的收录情况完全相同,这类词共有19组: 冰激凌、冰淇淋;波罗蜜、波罗蜜多;布拉吉、连衣裙;酊剂、酊;阀、活门、阀门;佛陀、佛;荷尔蒙、激素;咔叽、卡其等。这类词我们不做详细论述。
(二 )存在差异的情况
这里的“差异”是指虽然两部词典都收录了同一组同实异名外来词,但在以下三个方面存在差异: 一是两部词典在词源标注上的差异;二是词典中出现的这组同实异名词数量上的差异;三是词典在收录这组词时存在主副条的差异。据我们统计,这类词共有40组。以下我们主要对两部词典处理这类同实异名外来词差异的情况进行详细的分析。
1 .词源标注的差异
伊犁州是多民族聚居地区,也是经济欠发达地区。由于各地自然环境、社会环境、文化背景以及文化心理结构不同,中等职业教育有其自身诸多的特殊性,我们不能照搬其他地区的职教模式,而应寻求适合于本地区的教育模式。2014年3—8月,我们对伊犁州几所职业学校进行调研,发现我州职业教育存在的问题主要如下。
这类词有: 胨/蛋白胨、卡路里/卡、坎德拉/坎、勒克斯/勒、流明/流、摩尔/摩。《规范》中未标注词源的这类词都是由于全称和简称而形成的同实异名,且都是一些单位量词,我们认为《规范》可以将这一类词全部标注外来词词源,因为词源的标注对判断一个词是否是外来词具有关键性作用,读者查阅外来词也更方便。
词源标注对判断一个词是否是外来词具有关键作用。从这两部词典中同实异名外来词的词源标注来看,《现汉》与《规范》未标注的数量相当。
5、对角松开开裂阀门的螺栓,松动螺栓的同时试着搬动阀门,观察阀体是否受真空的影响,同时,观测开裂部位的漏油状态,确认阀门受到吸力后,拆卸阀门的安装螺栓,只预留阀门最底端的螺栓,并使其松动。如果此时漏油量较大,无法继续施工,则进行放油更换。
《规范》中标注词源而《现汉》中未标注的有: 阿片/鸦片、二英、观音/观世音/观音大士/观自在、奥林匹克运动会/奥运会、耶稣/基督。有的外来词虽进入汉语的时间较长,很多人也习以为常,认为它们已经是汉语词汇必不可少的词语,貌似不是外来词了,但我们从科学的角度来看,这类词应标注词源。《现汉》中“可卡因/毒品”这组同实异名外来词中可卡因标注了词源“[英cocaine]”,“阿片/鸦片”属于药品、毒品类,也属于同一大类,那么为保持标注的体例统一,我们认为阿片/鸦片也应标注词源。同理,“阿兰若/兰若、罗汉/阿罗汉和观音/观世音/观音大士/观自在”和“耶稣/基督”同属于宗教大类,《现汉》中将“阿兰若/兰若、罗汉/阿罗汉”(见表1)这类词标注了词源,那么其他同类宗教类外来词也都应进行标注,而事实上,“观音/观世音/观音大士/观自在和耶稣/基督”都没有标注词源。
(2) 《现汉》中标注词源而《规范》中未标注
对本文模型中的10个潜变量进行验证性因子分析,使用AMOS17.0软件构建出验证因子分析模型。模型中各个变量的因子载荷均大于0.5,符合要求。
(2) 《规范》称名数量多
“披萨”和“比萨”这两个词都是英文pizza的音译名称,构成了一组同实异名外来词,但《现汉》和《规范》都选择了“比萨”作为词条,“披萨”未被收录,更谈不上立目了。但是,在生活中“披萨”似更常见。我们对其在语料库、人民日报及百度网站中的使用状况进行检索,结果如表5所示:
(1) 《现汉》称名数量多的情况
在《现汉》中出现的同实异名词的数量多于《规范》的这类词有4组,分别是: 爱克斯射线/X射线/伦琴射线、吉普赛人/茨冈人/罗姆人、曼陀林/曼德林/曼陀铃/曼德琳和维纶/维尼纶/维尼龙,详见表3。
表3 《现汉 》多于 《规范 》的同实异名外来词的词频表
两部词典都共同收录了“吉普赛人/茨冈人”这组异名外来词,但《现汉》中还出现了另一个异名词即“罗姆人”。首先我们在语料库中搜索“罗姆人”这个词,发现它在BCC语料库和CCL语料库中分别出现了77例和24例,有一定的使用频率,说明其认知度较高。接着我们考察了“罗姆人”是否为“吉普赛人/茨冈人”的同实异名词,查阅《现代汉语学习词典》(繁体版)、《近现代汉语新词词源词典》、《国语日报外来词词典》、《汉语外来语词典》等词典,只有《国语日报外来词词典》在“吉普赛人”的释义中这样解释:“他们自称为[罗曼尼](Romany)”。似可以佐证“罗姆人”是“吉普赛人/茨冈人”的同实异名词,《现汉》中出现的“罗姆人”是Romany即“吉普赛人”的音译。“罗姆人”有一定的大众认知度,而且是“吉普赛人/茨冈人”的同实异名词,所以我们认为《规范》可以根据具体情况增加该同实异名词。此类词还有“伦琴射线”“曼陀铃/曼德琳”及“维尼龙”。
SHP0201147047型电子分析天平 上海恒平科学仪器有限公司;SW-CJ-IF型超净工作台 苏州安泰空气技术有限公司;LRH-250型生化培养箱 上海齐欣科学仪器有限公司;QYC-2102C型摇床 上海福玛实验设备有限公司;DHG-9140型电热恒温干燥箱 上海三发科技仪器有限公司;YX-280立式压力蒸汽灭菌器 上海三申医疗器械有限公司;BH200微生物显微镜 宁波舜宇仪器有限公司;722S型分光光度计 无锡天牧仪器科技有限公司;HHS-8S型恒温水浴锅 上海光地仪器有限公司。
2 .同实异名外来词收录的比较
氯化铁等金属盐蚀刻剂的危害主要是废液中的重金属污染。此类废水的处理,需将酸性中和后,以化学反应或电解的方式回收其中的金属。美术院校版画工作室的条件下,通常将废液收集后交环保企业回收处理。
在《规范》中出现的同实异名词的数量多于《现汉》的这类词比较多,共15组,详见表4。
表4 《规范 》多于 《现汉 》的同实异名外来词的词频表
(续表)
《现汉》和《规范》都收录了“阿片/鸦片”这组词,而《规范》还收录了“大烟/鸦片烟/阿芙蓉”这几个异名词。我们在语料库中分别检索,发现这几个词在两个语料库中出现的频率都比较高,具有较高的大众认知度,所以我们建议《现汉》可增加这几个异名词。此类词还有“戈壁滩”“弥勒佛”“香槟”等。还有一类是《规范》中出现的同实异名词在两个语料库中词频极低,甚至为0,如:“尔德节/尔代节”“”“琐罗亚斯德教/波斯教”等,这一类词《现汉》不收录似更合理,我们可随时间发展及语言的演变来考虑是否增录。
从表3和表4中可以发现,在外来词异名词的收录上,不管是作为主副条出现,还是在释义中出现,《规范》所列出的同实异名词都要多于《现汉》,就是说《规范》在体现外来词的称名多样性上比《现汉》更加全面。我们应该从实用性和尊重语言事实的角度出发,因此,《现汉》可以基于语言事实,对某些日常使用的高频词做一定的增收。
康乐球 英语cornerbool音意合译。一种游艺项目。在周围有挡板、四角有洞的方盘上进行。二至四人轮流用木杆击一扁圆形公用球子,将已方的球全部先撞击入洞者为胜。也说克朗球、克朗棋。
3 .同实异名外来词立目的异同
同一个外来概念的译写,可能会有不同的多个称名,词典不但要关注一组同实异名外来词的收录,还需要重点考虑主条和副条的安排。在表示同一个概念的两个或者几个不同的称名中应选择哪一个出条立目?到底选择哪一个做主条?同时,我们参考BCC语料库、人民日报和百度等语料库,考量它们在语文生活中的使用态势。以“比萨/披萨”和“色拉/沙拉”为例,探究两部词典对于这类词的立目出条的处理方式。
以淄博、滨州、德州、广饶4个国家级节水型社会建设试点及21个省级节水型社会建设试点为示范,以点带面,推进全省节水型社会建设。根据国家要求,部署开展全国节水标杆企业的评选推荐工作。出台了《关于加强建设项目节水设施 “三同时”工作的通知》。会同经信等部门联合发布了纺织印染等行业高耗水工艺、设备名录。加强工业节水技术改造,加大农业节水技术改造力度,大力推广渠道防渗、管道灌溉、喷灌、微灌、IC卡控制灌溉等十类节水灌溉技术,先后实施了50处大型灌区续建配套与节水改造项目。
同实异名,顾名思义是指一个事物有两个或两个以上不同的名称,据周荐先生(1997)统计《现汉》共有同实异名词语2487组,随着《现汉》的不断修订,据我们统计,既是同实异名词语又是外来词的在《现汉》和《规范》中约为59组。虽然两部词典都有意识地收录了外来词,但在异名外来词数量上却有差异,两部词典有的同实异名词出现的多,有的出现的少,为什么同一个异名词这部词典收录了而另一部没有收录,我们同样根据词的通用性即词频来考察,对两部词典是否应该增加此异名词提出建议。
表5 “比萨 ”和 “披萨 ”的词频表
从表5中的数据来看,“披萨”的出现频率远远高于“比萨”,也就是说,在日常生活中,我们多用“披萨”,而“比萨”比较少见,在国内,肯德基、麦当劳和必胜客等快餐店也大多使用“披萨”而非“比萨”。《现汉》自2005年第5版开始收录这个外来词后一直使用“比萨饼”,到第7版增收了“比萨”。《规范》自2004年第1版到2014年第3版也一直以“比萨饼”立目。基于上述的语言事实,我们认为《现汉》和《规范》都使用“比萨”立目是偏离语言事实的。不可否认的是,“比萨”一词曾经流行过,我们在BCC语料库的历时检索中搜索发现“比萨”在1992年到1994年使用频率较高,但到了2000年以后使用频率大大降低,这就再次印证了两部词典使用“比萨”立目有失偏颇。
图1 “比萨”在BCC语料库中的历时频次图
在分析《现汉》与《规范》共同收录的同实异名外来词中,我们还发现两部词典对“沙拉”和“色拉”这组异名外来词主条和副条的处理正好相反。在《现汉》中,“沙拉”为主条目,“色拉”为副条目,而《规范》做了相反处理。具体收录情况如下:
沙拉 西餐中的一种凉拌菜,一般是由熟土豆丁、香肠丁、水果或蔬菜等加调味汁拌和而成。也译作色拉。
(《现汉》)
色拉 见【沙拉】。
(《现汉》)
色拉 英语salad音译。一种凉拌食品,一般由香肠丁、土豆丁、水果丁或蔬菜等加色拉酱调和而成。也译作沙拉。
(《规范》)
沙拉 色拉。
(《规范》)
我们在语料库中检索,结果如表6:
表6 “沙拉 ”和 “色拉 ”的词频表
由表6可知,“沙拉”一词在各个语料库中的出现频率都高于“色拉”,两部词典用了不同的词作为主条目,说明它们有不同的规范化倾向。基于我们所统计的数据,“沙拉”比“色拉”一词更通用,所以我们认为《规范》对“色拉”和“沙拉”这组同实异名外来词的主副条的安排是需要商榷的。类似的还有“十四行诗”和“商籁体”等词的处理。
三 、结论
我们在上文主要对比了《现汉》与《规范》中同实异名外来词的收录、立目问题,发现在外来词的收录方面,个别词在《现汉》里收录了,在《规范》里没有收录;抑或有的外来词,《规范》已经收录,而《现汉》却没有。对此,我们基于词典的系统性,并且根据漏收词语在语文生活中词频的高低,对其是否应该被收录提出了建议。两部词典对外来词的收录情况绝大多数是一致的,但这些同实异名外来词在词源的标注、收录数量及立目问题上呈现出差异和问题: 对于两部词典在词源标注上的差异,我们认为只要是外来的词语,就应该标注词源;在收录称名数量上的差异,我们也根据词频的高低即大众认知度对其是否应该收录提出了建议。关于两部词典的立目方面,我们发现,两部词典大多数情况都是科学的,但也存在某些问题: 一种情况是两部词典在选词立目时虽做出了相同的选择,但根据语言事实来看却有失偏颇;另一种情况是两部词典对有些同实异名外来词组中主条与副条的选择呈相反的情况,针对这种情况,我们基于语言事实给予了建议。总之,对于同实异名外来词的收录与立目,两部语文词典各有千秋,虽然都存在些许问题,但并不影响其典范性。我们期望两部词典在今后的修订中能够关注这些小问题,使其更加完善。
附 注
本文检索语料的截止时间为2018年5月16日,所得数据排除了大部分无效语料。因个人能力有限,所以数据为约数。
电机驱动部分。两路(水平和俯仰)H桥驱动直流电机,通过H桥的通、断组合状态来实现用两线控制直流电机的正反转,如图5,Q1、Q4,Q2、Q3都截止时,电机处于静止状态;当Q1、Q4截止,且Q2、Q3导通时,电机往一个方向转动;当Q2、Q3截止,且Q1、Q4导通时,电机往另一个方向转动。处理器通过基础的日期时间、传感器信号、限位状态和手动控制状态来控制H桥的通断组合,实现对两电机的驱动,完成对日跟踪。在这过程中一定要注意Q1、Q4、 Q2、Q3截止和导通的时序,严禁Q1和Q2或Q3和Q4同时导通的情况。
参考文献
1. 岑麒祥.汉语外来语词典.北京: 商务印书馆,1990.
2. 国语日报出版部编译组.国语日报外来词词典.台北: 国语日报社,1986.
3. 李行健.现代汉语规范词典(第3版).北京: 外语教学与研究出版社,2014.
4. 刘善涛.汉语外来词异名同实概念词的词汇分布研究.语言教学与研究,2017(4).
5. 商务印书馆辞书研究中心.现代汉语学习词典(繁体版).香港: 三联书店(香港)有限公司,2015.
6. 孙国秀.《现代汉语词典》与《现代汉语规范词典》外来词比较研究.山东师范大学学士学位论文,2006.
7. 香港中国语文学会.近现代汉语新词词源词典.上海: 汉语大词典出版社,2001.
8. 中国社会科学院语言研究所词典编辑室.现代汉语词典(第7版).北京: 商务印书馆,2016.
9. 周荐.同实异名词语研究.中国语文,1997(4): 277.
CISHU YANJIU LEXICOGRAPHICAL STUDIES March ,2019 Abstracts of Major Papers in This Issue Linguistic Evolution ,Paleoanthropology and Cognitive Neuroscience
Wang William Shi-Yuan
Abstract : Recent years have witnessed rapid advances in such disciplines as cognitive neuroscience (brain imaging) and paleoanthropology (ancient DNA). This article is a brief summary of the corresponding development in linguistic evolution based on the achievements in these fields. During the recent decades, fossils of human species unknown before have been unearthed and new methods of extracting DNA from these fossils have been invented. All these advances reveal that the human evolution process and linguistic evolution process are much more complicated than we think. Today, we can look at language from more diversified perspectives. Language, particularly those less-used ones, is extremely varied in many aspects. Although research in linguistic neuroscience attempts to position the functions of specific languages in human brains, such as the production, understanding, and reading of language, we now believe that language cannot be formed without the joint operation of numerous neural circuits in different parts of the brain. Today, we have already had a relatively thorough understanding of how language is acquired in the early stage of life, and though we are late-comers regarding how language is damaged and disappears in the late stage of life, we have started to learn about this field.
Keywords : linguistic evolution, paleoanthropology, cognitive neuroscience
Development of the Machine Dictionary Oriented to Natural Language Processing
Yu Shiwen Zhu Xuefeng
Abstract: The Institute of Computational Linguistics at Peking University has been developing the machine dictionary for natural language processing for more than 30 years, producing a machine dictionary namedGrammatical Knowledge Base of Contemporary Chinese (GKB). Based on GKB, a series of achievements have been made and integrated into the Comprehensive Language Knowledge Base. This paper introduces GKB and its related achievements and summarizes the practical experiences of large-scale language engineering, hoping that these experiences will be of reference value to practitioners of language engineering, as well as to scholars exploring interdisciplinary integration.
Keywords: natural language processing, language engineering,Grammatical Knowledge Base of Contemporary Chinese , Comprehensive Language Knowledge Base, interdisciplinary
Chinese Verbs and Their Categorization :Construction and Application of the Semantic Network of Chinese Verbs
Liu Mei-Chun Wan Mingyu
Abstract: With the growth of AI, linguistics has become a new field in which researchers in different areas can cooperate and make breakthroughs. The construction and labeling of semantic resources have thus turned into a hot topic, as well as a difficult point to overcome. This article discusses Chinese verbs and their semantic categorization from three perspectives, namely, theoretical bases, semantic network construction, and application. The theory used for this research is framework semantics and particularly Gestalt; the construction of the semantic network is based on linguistic analysis and language data. The semantic knowledge base currently consists of eight types of verbs and has been effectively used in many kinds of Chinese natural language processing tasks, including automatic semantic disambiguation, automatic semantic role labeling, event identification, and automatic story generation.
Keywords: frame semantics, construction grammar, verb categorization, semantic labeling, natural language processing
On the Origin and Growth of wuye
Liu Danqing Zhang Ding
Abstract: The wordwuye in contemporary Chinese comes from Hong Kong, but its meanings and uses are different in China’s mainland and Hong Kong. This article describes the different treatments of this word in various dictionaries and investigates its origin and semantic growth.
Keywords: wuye , origin, semantic evolution, language contact
Categorization and Characteristics of the Phenomenon of “Different Tones Leading to Different Meanings ”in the Wu Dialect
You Rujie
Abstract: Taking Wenzhou dialect as an example, this article studies the categorization and characteristics of the phenomenon of “different tones leading to different meanings” in Wu dialect. It argues that there are three major types of this phenomenon and this is different from the traditional “four tones and different word meanings”.
Keywords: four tones and different word meanings, different tones leading to different meanings, Wu dialect, Wenzhou dialect
* 本文为国家语委项目“现代汉语外来词形式称名变异研究”(项目编号 ZDI135-22)的阶段性成果,受到“山东省高等学校优秀中青年骨干教师国际合作培养计划”项目经费赞助。
(鲁东大学文学院 烟台 264001)
(责任编辑 马 沙)
标签:《现代汉语词典》论文; 《现代汉语规范词典》论文; 同实异名外来词论文; 鲁东大学文学院论文;