2010-2018年词典研究的中外文献定量分析
陈仕鸿,余晓晖,李雨珊
(广东外语外贸大学,广州 510420)
摘要: 采用文献计量法,对中外主要文献网站2010-2018年间发表的词典研究相关学术论文进行定量分析,研究中外文献在词典研究领域的研究现状及中外研究异同。分析结果表明:近年中外词典研究的论文数量基本保持平稳,文献来源及研究者较为集中;研究热点已倾向与语料库等信息技术的融合;词典编纂与语料库成为最大的共现关键词,中外词典研究的聚类大致分为7类和8类;中外在词典研究内容上略有不同,国内学者主要研究特定词典的应用,而国外主要研究词典的功能。
关键词: 词典学;文献计量法;CNKI; Web ofScience
引言
人类的词典编纂的历史已经超过了4500年[1],而在我国,词典的出现也已有2000年的历史[2]。古代的人类智慧留下《说文解字》《永乐大典》《牛津英语词典》等源远流长的辞书巨著。然而,直到1971年捷克词典专家Ladislav Zgusta出版了专著Manual of Lexicography(《词典学概论》),才标志着词典学正式开始成为一门学科。[3]
职业教育是以培养高素质的技能型人才为目标的,因此在教学过程中要着力培养学生的动手能力、综合职业素质和创新能力。职业教育的教学方法同传统的教学方法相比也有很大的不同。职业教育面对的对象大都是初中、高中毕业生,自控能力不强、基础差,在学习中不会很主动、很积极地学习各种专业知识,导致教与学的效果都不是很好。铁道工程机械系统故障排除课程实践性强,能引起学生的兴趣,培养学生的实践精神与创新能力。教学方法直接影响教学效果,而“任务驱动情景教学法”可以达到比较理想的教学效果。
1.4.1 主观指标 在治疗前后采用疼痛视觉模拟评分法(visual analogue scale,VAS)评分与腰椎功能障碍问卷 (roland-morris disability questionnaire,RMDQ)对患者的症状进行评价。
文献计量法是指基于多种知识载体,用数学和统计学的方法,定量地分析某一学科领域的方法。随着电子文献的普及和检索的便利,越来越多学者利用文献计量法来分析各学科领域的研究现状。[4-5]本文将采用文献计量法,对中外两个主要论文网站上从2010到2018年间大约2000篇词典研究领域的论文进行了定量的综述分析。笔者分别检索Web of science和CNKI的词典学、词典编纂相关的学术研究的发表文献,多角度展开分析,从中发现中外词典研究现状和异同,并用可视化的形式将之呈现,更好地了解词典学的发展现状,为学者们把握发展的前沿方向提供参考。
一、数据来源及处理
本文收集2010-2018年期间中外代表性数据库收集的词典研究文献,借助数据分析工具,以文献计量学为理论支撑,以检索到的文章为切入点,总体把握中外的词典研究状况。
(一)数据来源及检索
进一步将CNKI和Web of Science的词频前10名关键词进行两两配对,统计它们在所有文献中共现频次,形成10*10的共现矩阵。结果如表4、表5所示。共现矩阵是一个对称矩阵。主对角线的数据为该词出现的频次,非主对角线上的数据表示两个不同的关键词共同出现在同一篇论文中的次数。由共现矩阵可得出词典研究主题聚类的特点:在中外文献中“词典编纂”的共现词频最多,但其辐射范围在中外文献中较为不同。在中文词典学文献中其影响辐射集中在“语料库”“词典学”“辞书编纂”和“词汇学”;外文文献其影响辐射集中在“dictionary(s)/词典”“function theory/功能论”“terminology/术语”“corpus/语料库”。“语料库”为中外文献关键词“词典编纂”的唯一共同辐射。
伴随着互联网技术的快速发展,大数据为财务管理提供了平台、技术和数据等丰富的资源。新型时代下财务管理转型已经成为一种趋势和必然发展之路,从企业角度而言,财务数据作为反映企业运作情况的主要数据,管理层利用数据为企业运作方向调整、战略制定等,越来越多的企业尝试着通过多种方法获取数据和资料,为财务管理提供客观数据。大数据下财务管理转型发展方向如下:
(二)分析方法
由表4可以得出,CNKI上关键词前3的共现对为(词典学,词汇学)=36,其次是(词典编纂,语料库)=19,(词典编纂,词典学)=18。
(三)分析内容
其中的原因也从一些论文中有所体现,由于这些关键词的发展经历了前计算机时代和计算机化时代两个时期,而这也对应了词典编纂的前与后的两个时期。计算机应用技术兴起之前的词典编纂所使用的卡片法和阅读项目组方法,是语料库词典学的早期雏形。这种传统方法和语料库词典研究方法的差异是明显的。第一,这些早期的语料收集没有语言“代表性”意识,而词典编纂者强调的是资料的规范性和词汇使用的正确性。第二,在20世纪70年代以前,各种词典中所包含的口语信息非常有限。第三,大型语料库的建立使得对词语的共现和关联模式的分析得以在更为复杂的层面上进行。因此上述三方面的优势综合起来看,新语料库词典学使得词典学的研究视角得到了极大的拓展,也使词典编纂更为专业全面,因此“词典编纂”和“语料库”也就成为了中外词典学论文的共有热词。
二、研究方法及结果分析
(一)年度分析
由表5可以得出,Web of Science上关键词前3的共现对为(lexicography(词典编纂),dictionary(字典))=25①,(lexicography(词典编纂),function theory(功能论))=7,(lexicography(词典编纂),terminology(术语))=6,(lexicography(词典编纂),corpus(语料库))=6。
图1 中外词典研究文献发表1010-2018年度分布图
(注:2018年的数据是利用线性回归方法预测而得)
(二)文献来源及发表机构分析
为能更加深入了解近8年来词典研究文献的研究热点分类,在共现矩阵的基础上,利用k-均值聚类算法,根据多次实验的最佳结果,将CNKI的20个关键字划分为8个(即k值为8)研究热点类别,Web of Science划分为7个研究热点类别如表6所展示。笔者可以归纳出中外词典学文献研究热点分类的特点:一是,国内的前五项研究领域与国外词典学的研究方向一致,从总体上看,中文词典研究文献同世界范围内的研究方向齐头并进。二是,中国借助本国独特的本族语言在汉语词典,辞典编纂等中文相关领域颇有建树。反观外国文献中在词典的普遍功能如一词多义,拼字等有相对优势。
表1 中外词典研究文献发表来源前10名
对近8年来中外词典研究文献发表机构的前10名进行数据汇总,整理结果如表2所示。可以看出近年来,词典研究文献发表机构有以下特点:一是,中外词典研究文献发表机构前10名均为高校,表明中外发表词典研究文献的学者来自高校的居多。二是,中外词典学的发表文献都比较集中在前二的机构,表明该机构在词典研究领域具有一定的领头及代表作用。国内词典研究文献比较集中在广东外语大学及鲁东大学;国外文献则集中在Stellenbosch University(斯泰伦博什大学)和Aarhus University(奥胡斯大学)。
表2 中外词典研究文献发表机构前10名
(三)关键词分析
采用词频分析法对关键词进行分析,通过对文献作者定义关键词进行汇总统计,可以看出该领域文献的主题内容。表3为近8年来中外词典研究文献关键词词频的前20名。可以看出近年来,词典学的研究主题有以下特点:一是,“词典编纂”“语料库”“词典”“词汇学”及“词典学”是近8年来中外词典研究的共同热点。二是,中文文献主要研究特定词典的应用,其中以中文词典占多数。外文文献主要研究词典的功能,比如一词多义,术语等。
周贝利(2011)指出,真正的原儒所奉行的是一种具有高度人生智慧的依时变通的灵活处世原则,而非循规蹈矩的固定行为模式。同时,也正是这种主张因时、因事、因地、因势通权达变,反对泥古不化、僵守一端的理论张力,才使得儒学具备了与时具迁的生命力,而经权思想正是这种儒学生命力的集中体现。但也不应该忽视另一方面的内容,从总体上来看,经主权从、经贵权轻、经制约权、权服务于经是先秦儒家在经与权的关系上的共同旨归。
表3 中外词典研究文献作者定义关键词词频前20名
以CNKI发表文献代表中国学者词典研究文献,通过CNKI数据库设置检索条件为“主题”,关键词为“词典学”或“词典编纂”,发表日期在“2010-2018.7.31”之间,得到文献总1327篇,其中含有作者定义关键词1312篇。在Web of Science中检索的国外的词典研究文献,在数据库中设置检索条件为“主题”,主题词“Lexicology”或“Lexicography”及发表日期“2010-2018.7.31”,得到文献总370篇,其中有60篇文献没有提供论文的关键词。
以检索到的文章为切入点,从词典研究文献的年度发展情况、文章出版及机构发表趋势、高频关键词等方面进行中外词典研究情况的统计和对比,尝试发现中外词典学学界研究现状及异同。
表4 CNKI词典研究文献共现矩阵中前10个关键词
将检索获得的文献分别以其数据库所给定的形式保存为txt格式的文档。之后将所获得的数据导入Microsoft Office Excel 2016办公软件进行统计和预分类处理,利用Bib Excel文献分析软件,Python编程,UCINET网络分析集成软件对预处理数据进行定量和定性分析。
表5WEB OF SCIENCE词典研究文献共现矩阵中前10个关键词
通过对文献按年度发表数量进行汇总统计,可以看出该领域研究的发展状况。对2010-2018年的中外词典研究文献进行按年度汇总,各年份的发表情况详见图1。可以看出,近年来,词典学论文发表有以下特点:一是,中文文献明显多于外文文献,表明中国学者对词典学的关注度远大于外国学者,但是在论文的档次上还有明显的差距;二是,中外文献数量基本均衡,波动不大。但是,放之于全局的文献增长趋势相比,没有明显的增长即是倒退,所以,词典学的研究明显处于边缘化的状态。词典研究
通过对文献按文献来源数量进行汇总统计,可以看出该领域研究文献的发布状况。对近8年来中外词典研究文献来源的前10名进行数据汇总,整理结果如表1所示。可以看出近年来,词典研究文献发布有以下特点:一是,中外词典研究文献来源为学术期刊出版占多且分布较为集中:CNKI前10名文献来源分为8个期刊及2个高校出版社,其中期刊《辞书研究》占有相对优势;Web of Science则分为5个期刊及5个高校出版社,期刊Lexikos占有相对优势。二是,由表中期刊类型可以推出主流发布文献类型:目前中国词典学发表文献的主要内容是词典编纂的理论与实践;而国外词典学发表文献主要是词典编纂领域内不同学者的评论。
表6 中外词典研究关键词词频前20的聚类分析
笔者将中外文献关键词词频前20名的共现矩阵进行中心性分析,得出关键词的共现网络关系,如图2、图3所示。图中点的不同的颜色代表不同的聚类,点的大小代表词频的大小,点与点连线的粗细代表词共现的大小。因此,从图中可以一览词频、共现矩阵及k-means均值分析的多角度的分析结果。
图2 CNKI词典研究文献前10个关键词的共现网络关系
图3 Web ofScience词典研究文献前10个关键词的共现网络关系
三、结束语
本文使用了新的文献计量法中的几种可视性方法,对中外主要论文网站——CNKI和Web of Science上从2010到2018年以来近2000篇词典学相关论文进行对比分析。通过获取文献分布特征的描述性统计方法和基于各类算法计算研究热点关键词的数据性统计方法,得出研究结果:近年中外词典研究的论文数量基本保持平稳;文献来源及研究者较为集中,《辞书研究》和Lexikos是词典学研究的主要期刊,广东外语大学、鲁东大学,以及国外的Stellenbosch University和Aarhus University是词典学研究的重要单位;研究热点已倾向与语料库等信息技术的融合,词典编纂与语料库成为最大的共现关键词,词典研究的聚类大致分为7类或8类。此外,笔者发现,从总体的研究方向和内容上看,中外在词典研究除了在语言类别差异之外,国内学者主要研究特定词典的应用,而国外主要研究词典的功能。分析结果能够从宏观的角度来为中外学者提供不同研究热点与方向的参考,从而促进词典学研究的发展。
注释:
①是dictionaries和dictionary数据合并的结果。
The kinetics requirement equation of the actuator is
参考文献:
[1]GREEN J.Chasing the sun:dictionary makers and the dictionaries they made[J].American Speech,1997,72(4):428-33.
[2]章宜华.《辞书研究》与新时期词典学理论和编纂方法的创新[J].辞书研究,2010(1):57-69.
[3]张相明.21世纪词典学研究的电子化发展新趋势——兼评《电子词典学》[J].辞书研究,2014(4):10-9.
[4]周宙,邱树华,文彦元,等.浅析当前世界语言学研究的特点和趋势——基于2006—2015年Web of Science的文献[J].西南石油大学学报(社会科学版),2017,19(2):112-20.
[5]张继东,陈文.国际语料库语言学研究的可视化分析[J].外语电化教学,2016(6):66-73.
Quantitative Analysis of Chinese and Foreign Essays on the Lexicographical Research in 2010-2018
Chen Shihong,Yu Xiaohui&Li Yushan
(Guangdong University of Foreign Studies,Guangzhou 510006,China)
Abstract: By using bibliometrics,this paper makes a quantitative analysis of lexicology-related essays posted on Chinese and foreign main literature websites in 2010-2018,and studies the current research situation and similarities and differences between Chinese and foreign literature in the field of lexicographical research.The results show that:the amount of essay-publication on the lexicographical research in China and foreign countries remains stable in recent years;the sources and the researchers of these lexicographical researches are comparatively concentrated;the research hotspots tend to be integrated with information technology such as"Corpus";"(Lexicography,Corpus)"has become the most frequent co-occurrence keywords in these essays;the lexicographical research hotspot clustering is roughly divided into 7 or 8 categories;Chinese scholars mainly study the application of specific dictionaries,while foreign literature mainly studies the function of dictionaries.
Key words: lexicography;Bibliometrics;CNKI;web of Science
中图分类号: H061
文献标志码: A
文章编号: 1671-1084(2019)05-0090-07
DOI 10.16221/j.cnki.issn1671-1084.2019.05.019
收稿日期: 2019-03-13
基金项目: 广州市哲学社会科学发展“十三五”规划项目(2018GZGJ40和2017GZGJ18);广东省普通高校特色创新项目(2016KTSCX036);广东外语外贸大学语言工程与计算实验室招标课题(LEC2018ZBKT002)
作者简介: 陈仕鸿,硕士,广东外语外贸大学副教授、硕士生导师,研究方向为自然语言处理;余晓晖,广东外语外贸大学国际商务专业在读本科生,研究方向为自然语言处理;李雨珊,广东外语外贸大学国际商务专业在读本科生,研究方向为自然语言处理。
标签:词典学论文; 文献计量法论文; CNKI论文; WebofScience论文; 广东外语外贸大学论文;