基于文献计量和形势概念分析的语言学发展态势研究
袁国廷
(济宁医学院 外国语学院,山东 日照 276826)
摘 要: 以Web of Science数据库为语料数据来源,收集2006-2015年语言学领域相关文献,采用文献计量分析法,从发表时间、地域、语种、来源期刊、机构、著者、引文等角度,定量揭示语言学研究的概况与全貌;并利用形式概念分析方法,结合学科知识语义信息,挖掘语言学领域的学科主题特征,以期为语言学学科建设与发展提供一定的参考。
关键词: 语言学;文献计量;形式概念分析;研究态势
引言
语言学(Linguistics)是以人类语言为研究对象的学科,探索范围包括语言的性质、功能、结构、运用和历史发展,以及其他与语言有关的问题[1]。随着时代的进步与社会的发展,越来越多的学者投入到了语言学领域的研究当中,并取得了丰硕的成果,其理论主张、研究成果和研究方法也逐渐在相关领域得到了越来越广泛的应用和验证。国际语言学发展态势的探索对我国及时准确把握其发展脉络、深入开展领域相关研究具有重要的启发和借鉴意义。
目前学者们对于语言学相关领域发展态势的研究主要采用调研、归纳、访谈以及文献词频统计等方法。王立非等(2011)采用关键词词频统计和内容分析法,对2006-2010年国家社科基金外国语言学课题指南和立项情况进行分析。结果发现:课题指南与课题立项相互作用,近五年研究热点依次为外语教学、翻译学、语言研究和功能语言学;历年均受关注的领域是二语习得、教学法、语料库研究、语用学、测试与评估等[2]。束定芳(2012)对近10年来国外认知语言学最新进展与发展趋势进行探察,研究表明:就认知语言学本身来说,其传统的研究课题无论在范围还是在深度方面都得到了较大的拓展和深化,发现了很多新的语言事实和现象,提出了许多有一定解释力的假设与理论模型,其研究方法也从传统的以内省为主逐渐过渡到以语料库或以心理和仪器实验为基础的实证研究为主,成为一种跨学科、全方位、多视角的研究[3]。吴珊(2012)对2001-2010年国家社科基金所资助的语言学类项目进行立项年代、项目类别、预期成果、语种及主题词分布等方面的统计分析,探讨国内语言学研究现状和发展趋势。结果表明,立项总量呈逐年递增之势;青年项目数量增长较快;预期成果中专著所占比例较高;有关汉语和英语的立项数量最多,且教学类及语言对比类研究比重较大;目前的研究热点有“方言”、“语料库”、“语法”、“教学”等。总体而言,理论研究有长足进步,应用研究仍是热点,创新性有待提高[4]。王立非等(2015)以2008-2015年国际SSCI期刊论文为语料,采用文献计量分析方法,对国际会话分析的研究热点与进展进行考察和分析[5]。
要造就一支德才兼备、教学科研能力强的骨干队伍,培养一批创新思维活跃、学术视野宽阔、发展潜力大的青年骨干教师和学科带头人,为名师梯队建设提供充足的后备力量。
本文采用文献计量分析法,从发表时间、地域、语种、来源期刊、机构、著者、引文等角度,定量揭示语言学研究的概况与全貌;并利用形式概念分析方法,结合学科知识语义信息,挖掘语言学领域的学科主题特征,以期为语言学学科建设与发展提供一定的参考。
二、在大家根本找不到的地方挖了墙根,打了洞?部里的一群人没能耐干这些,他们的胆识比在仓库里顶风作案的耗子们小多了,而下货的那几个,估计他们脑袋想的我的屁股都会想到。
一、研究对象的选择与数据获取
1.学科分布。学科分布可以反映研究主题的知识利用特点及跨学科性[19]。语言学文献的学科分布情况如表7所示。
这种病害主要危害的部位是果穗,一旦玉米植株受到感染,通常都会颗粒无收。对于玉米的危害性极大,针对这种病害的防治力度必须加强。玉米种子对于病害的抵抗能力较弱的情况下,在土壤中非常容易受到土壤中细菌的感染,这样在植株不断生长的过程中细菌会进一步蔓延之果实,最终导致玉米减产,针对这种病变,目前最有效的方法是选用抗病性较强的玉米品种,同时也可以物理、化学及生物相结合的方式来处理。针对玉米叶茎根等的病虫害要及时的喷洒适量的农药,缓解植株的病变情况。
考虑到网络数据库的数据更新,为了保持数据的一致性,笔者在2017年3月22日集中采集了数据。
二、数据处理与结果分析
(一)语言学文献外部特征总体分布分析
由上表可知,双语、会话、话语、身份、二语习得、西班牙语、句法、英语、特殊语言障碍、儿童、失语、口吃、音韵、语用学、叙事、评价、多语制、语义学、翻译等是当前语言学领域的研究热点问题。
1.年代分布。2006-2015年,语言学领域历年文献产出量如图1所示。
图1 语言学历年文献分布量
由上图可知,随着时间的推移,语言学领域的文献产出量不断攀升,说明越来越多的科研实体关注并投入到了该领域的研究中,并取得了丰硕的研究成果,语言学领域的探索与创新活动快速发展起来。
配送是连锁企业管理过程中的重要组成部分,只有快速专一的配送,才能保证企业良好的效益与效率。虽然连锁企业经过不断的完善和更新,已经实现了现代化和自动化的配送模式,但是在互联网快速发展的今天,别说企业的配送模式仍然有待加强。多年来,连锁企业主要采取的是集中采购的模式帮助企业降低成本,然后再通过统一配送,提高企业的配送率,但是这些都需要达到一定数量的加盟店之后,才能真正为企业达到降低商品成本,提高经济效益的目的。目前,我国大部分连锁企业中,一般都是采用直营式的经营模式,对于规模比较小的连锁企业来说,经营状态并不理想,结合电子商务线上配送相比较,连锁企业的经营效率明显较低。
2.地域分布。2006-2015年,多达140个国家/地区的科研实体开展了一系列语言学相关研究,其中,排名前十位的地域分布情况如表1所示。
表1 语言学文献的地域分布表(Top 10)
语言学等领域进行假设检验的“黄金标准”。
3.语种分布。2006-2015年,语言学领域文献共涉及31种语言,其中,排名前十位的语种分布情况如表2所示。
表2 语言学文献的语种分布表(Top 10)
由上表可知,SCI-EXPANDED、SSCI以及A&HCI国际权威数据库中收录的语言学领域文献的语种分布极不均衡。其中,绝大多数为英文文献,其比例高达83.38%;德语、西班牙语分别位居第二、三位,但其所占比例远小于英语;汉语文献仅有254篇,排名第六。究其原因可能为,当前国际权威数据库中收录的期刊绝大部分为英文刊物,其他语种的刊物仅占极小份额。因此,我国语言学领域学者应重视英文论文的写作,以提升科研成果的国际可见度与影响力。
洋山港四期进港主航道及附近水域船舶交通状况比较复杂,通过对2016年10月13日至2016年10月19日共7 d的洋山港船舶自动识别系统(Automatic Identification System, AIS)数据解码,并设置4条断面观测线,进行交通流量统计见表1。通航船舶的主要类型及其航路如下:
4.期刊分布。2006-2015年,出版语言学领域文献的期刊共264种,其中,排名前十位的来源期刊分布情况如表3所示。
表3 语言学文献的来源期刊分布表(Top 10)
由上表可知,当前语言学领域的权威期刊为《语用学报》、《语言与听力研究杂志》、《语言学》、《大脑与语言》、《记忆与语言杂志》、《临床语言学与语音学》等刊物。其中,《语用学报》创办于1977年,涉及普通语言学、社会语言学、话语分析、会话分析、认知语言学、语料库语言学等主题,同时鼓励探索语言语用学及其临近学科(如包括非语言交际在内的传播学、发展与实验心理学、语言哲学、包括所有发展和获得性交流障碍在内的语言病理学等)的关联研究[7]。创办于1997年的《语言与听力研究杂志》主要刊登听力、语言、言语障碍及其治疗相关主题文献[8]。《语言学》则聚焦于普通语言学问题,旨在呈现当前语言学各领域的研究热点内容[9]。
5.机构分布。2006-2015年,一万余家科研机构参与到了语言学领域的研究中,其中,排名前十位的机构分布情况如表4所示。
表4 语言学文献的机构分布表(Top 10)
3.学科主题形式概念分析。以文献量居于前15位的学科作为对象集,以语言学领域具有实质意义且达到一定阈值的58个高频词作为主题词集,建立学科-高频主题词共现矩阵,即形式概念背景(如表9所示)。
6.著者分布。2006-2015年,排名前十一位的著者分布情况如表5所示。
表5 语言学文献的著者分布表(Top 11)
由上表可知,除匿名作者外,悉尼大学澳大利亚口吃研究中心的Mark Onslow发表的语言学文献最多(59篇),其主要致力于学龄前儿童早期口吃的流行病学、口吃者的心理健康、口吃的测评以及口吃的本质与治疗等方面的研究[10];该中心的Ann Packman,发文量占文献总量的0.11%,居于第二位;再次为普渡大学跨学科研究学院语言学项目组的Laurence B.Leonard(发文量53篇),其主要研究方向为儿童的语言发展与语言障碍,近期聚焦于不同语种中特殊语言障碍儿童的早期言语、词汇和句法的发展,同时对语言治疗措施的有效性进行探索[11]。查尔斯特大学言语与语言习得Sharynne McLeod教授的研究侧重于儿童言语习得;从身体功能与结构、活动和参与、环境因素、个人因素等方面,将2007年世界卫生组织发布的《国际功能、残疾和健康分类》(ICF-CY)应用于言语障碍儿童的功能诊断、干预、评估和康复;探索儿童语音障碍的患病率与影响,并与政策和服务提供问题进行关联[12]。
7.引文分布。文献之间的引用关系反映了文献在内容或主题上的相通之处,在很大程度上,能说明被引用文献的学术价值及其对其他学术研究的影响[13]。一般来说,被引频次越高,说明文献的质量越好、影响力越大。排名前十二位的语言学文献引文分布情况如表6所示。
果然,没有几天,杰克领着杨律师走进客厅,向苏穆武和苏母介绍:爸,妈,这是杨律师!苏穆武和老伴不知杰克葫芦里卖的什么药,面面相觑。杰克说:爸,妈,我想了一下,咱们的问题,还是请律师解决比较好。苏穆武懵懂地:什么问题?杰克说:关于人权问题,我不想争论了,用婷婷的话说,会伤感情的。苏穆武好像明白了,不满地:用律师解决就不会伤感情? 杰克说:当然,法治社会最好的办法就是通过律师。我已经跟杨律师说过了,我现在回避一下,爸,妈,你们跟杨律师谈谈吧!苏穆武朝杰克的背影:谈你个腿!
表6 语言学文献的引文分布表(Top 12)
由上表可知,当前语言学领域最具影响力的文献为《基于交叉随机效应的被试和项的混合效应建模研究》[14],被引频次高达1574,该文介绍了混合效应模型以分析被试和项作为交叉随机效应的重复测量数据。通过实例展示了如何利用最新软件进行混合效应建模,通过模拟研究证实了混合效应分析相对于Quasi-F检验法、基于被试分析法、基于被试和项目相结合的分析法、随机回归分析法等的传统分析法所具有的优点,并进一步讨论了其在多领域的应用前景。其次为《分类数据分析:从方差分析到混合Logit模型》[15],被引702次,该文探讨了方差分析法在分类结果变量分析中存在的问题,引入了既具有一般Logit模型的优势,又能够解释分析中的随机被试和项目效应的混合Logit模型,并运用心理语言学数据集对多种不同的统计方法进行了比较。《验证性假设检验中的随机效应结构:取最大值》[16]位列第三,该文通过应用蒙特卡洛模拟,基于相关理论基础,论证了随机效应结构对于线性混合效应模型推广性的影响,研究发现应用极大似然估计的线性混合效应模型可以作为心理
由上表可知,美国是当今语言学领域文献产出最多的国家,约占总量的30.49%,处于世界顶尖水平,是语言学研究的核心国家;其次是英国(10.60%);德国、西班牙、加拿大、澳大利亚和法国分别居于第三至第七位。中国以1733篇文献的产出量居于第八位,但不足美国的八分之一,说明我国的语言学研究虽取得了一定的成果,但还有待进一步加强与完善。
“当然不是啦,傻孩子,文科考完了就要准备考武科啊!”张全辉在门口怪笑,“所以接下来的半年啊——是比以前严酷好几倍的武科训练,都做好准备吧!”
可见,统计学方法等定量分析方法不仅是自然科学领域的重要研究工具,在语言学研究中亦具有重要的作用。
(二)基于形式概念分析的语言学学科主题知识发现
形式概念分析(Formal Concept Analysis,FCA)[17]是Wille提出的一种从形式背景进行数据分析和规则提取的强有力工具,形式概念分析建立在数学基础之上,用于对数据集中的概念结构的识别、排序和显示的数据分析理论。形式概念分析强调以人的认知为中心[18],提供了一种与传统的、统计的数据分析和知识表示完全不同的方法,在数据挖掘、知识发现、信息检索等领域得到了广泛的应用。
根据形式背景中概念的偏序关系,利用Concept Explorer软件构建概念格,以层次网络的形式重构学科-主题词二分网络。绘制概念格Hasse图(如图2所示),可视化描述与萃取语言学领域的学科主题概念层次结构。
利用美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的国际权威引文数据库Web of Science[6]中的SCI-EXPANDED、SSCI、A&HCI网络数据库进行检索,得到2006-2015年语言学主题中类型为“Article”的文献共49080篇。
谷草有较高的营养价值,为了更好地对比谷草的营养价值,通过查阅相关资料,把谷子的粗蛋白含量、粗脂肪含量、粗纤维含量、无氮浸出物含量、粗灰分含量与禾本科作物燕麦、玉米的秸秆,豆科作物大豆的秸秆及专用牧草苜蓿进行对比[15-18],对比结果见表3。
表7 语言学文献的学科分布表
由上表可知,与语言学领域相关的学科众多,其与文学、心理学、教育与教育研究、听力与语言病理学、康复学、通信学、神经科学与神经学、历史学、计算机科学等24个学科都存在不同程度的知识交叉关联。语言学研究表现出显著的多学科性和学科融合特征。
2.主题词分布。按照关键词词频由高到低进行排序,选取出现160次以上的58个高频关键词(见表8)作为研究样本。在一篇文献中,关键词往往是著者对其研究内容的最准确且最精炼的概括与表达。由于这些关键词是语言学文献中出现频次较高的词,因此它们很大程度上可以体现该领域的研究主题和方向。
表8 语言学文献的高频主题词信息
使用Thomson Data Analyzer(简称TDA)对语言学文献信息进行文本处理,经过数据清洗等步骤后,提取发表时间、地域、语种、来源期刊、机构、著者、引文等文献外部特征信息,以获得语言学研究的概况与全貌,明晰研究主体、研究呈现形式和研究基础理论的集中与分散性。
这个月依北中学发生了一件大事。同学们纷纷谈论,一个叫姜祈的抽签入学的高一男生,竟然从电光手里救下一名“叛徒”,还借势带领一帮抽签入学的学生成立了自己的团体。此事等同于给了电光一记响亮的耳光。也因此,姜祈与电光主席彻底结了怨。
由上表可知,英国的伦敦大学是产出语言学文献最多的机构,其次为爱丁堡大学,比利时的根特大学位列第三。加拿大多伦多大学、美国宾夕法尼亚州立大学、比利时天主教鲁汶大学、美国约克大学、芬兰赫尔辛基大学、英国曼彻斯特大学以及美国伊利诺伊大学亦有大量相关文献发表,且其产出比例分布较为均匀。说明欧美高校为当前语言学领域的主流核心研究机构,且各高校在该领域的科研实力相对均衡。
如引言所述,为了降低网络的通信带宽和节点的能量消耗,本文考虑每个传感器节点不直接传输测量信号 yk,i,而是先将其与一个门限值进行比较,然后向FC报告测量信号是大于该门限(用1表示),还是小于该门限(用-1表示),即每个节点向FC传输1比特数据 dk,i:
表9 语言学学科主题形式概念背景(部分)
本文引入形式概念分析的原理和方法,将学科视为对象,主题词视为属性,将概念视为由学科集合(外延)和主题词集合(内涵)所组成的知识结构单元。构建学科-主题词形式概念背景,即知识单元之间的关联关系。根据形式背景中概念的偏序关系,构建学科知识网络概念格,通过格上作业(层次聚类分析),可视化描述语言学领域演化过程中学科主题知识间的契合、离散关系以及知识属性之间的组分异质性规律。
由于上层概念的内涵(主题词)被下层概念所继承,因此最上层概念节点的内涵能够作为学科的主要交叉研究领域,随着概念节点层次的深化,其内涵越丰富,也就是各个研究主题不断细分主题概念,每个主题的关联关键词则可通过与之相连的上层概念的内涵描述出来。而每个主题的关联学科则通过该概念的外延展示出来。越上层的概念主题越宽泛,关联学科越多;越下层的概念主题越具体,关联学科越少[20]。由上图可知,语言学领域与其他学科产生知识交叉关联的主题主要为:话语、隐喻、互动、会话、语言、交流、性别、转换语言、语言习得、语用学等。其中,西班牙语、日语、法语、德语、汉语、英语是这些交叉主题最为常用的研究语种对象。
在语言学领域范畴内,文学、心理学、教育与教育研究、通信学、历史学等学科位于概念格底层,说明其知识内涵最为广泛,与语言学学科关联最为紧密,知识的交叉融合最为深入;神经科学与神经学、亚洲研究次之;再次为听力与语言病理学、康复学;计算机科学位于概念格上层,说明其内涵较为狭窄(即包含的主题特征属性较少),与语言学学科关联相对松散。随着计算机技术的发展,许多语言学理论、方法及成果都是在其基础上或启发下产生和解决的,计算机科学与语言学知识相互协同、渗透,从而衍生出诸多新的交叉领域及科学问题。其中,计算语言学(通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的)可以说是二者相结合的产物。目前,该领域的研究主要集中在文本信息检索、文献自动分类、自动文摘、语音自动识别与合成、机器翻译以及文本信息提取和过滤等方面。另外,语言资源的建设和基于语料库的语言分析方法也受到了格外关注,取得了较快的进展[21]。
图2 语言学领域学科主题概念格
结论
本文利用文献计量和形式概念分析法,对国际语言学领域的研究现状及学科主题特征进行了全面系统的分析与讨论。得到的主要结论为:
陶水旺也只是猜测。苏楠不知道该怎么安慰李峤汝,她本来还想说,那个时代,农村妇女的活重,早产很正常。但她自己都觉得这样的劝说太苍白。突然冒出来的生父,要是个达官显要说不定还让她多少有种隐秘的优越感,谁让他是个没有什么修养的农民呢?那么老,而且那么龌龊,被生母杀死——仇恨地杀死,任谁突然被凭空推出一个这样的生父也会感到羞辱。
(1)随着时间的推移,语言学领域的探索与创新活动呈攀升趋势。
(2)美国是当今语言学领域文献产出最多的国家。我国的语言学研究虽取得了一定的成果,但还有待进一步加强与完善。
(3)国际权威数据库中收录的语言学领域文献的语种分布极不均衡。其中,绝大多数为英文文献,因此,我国语言学领域学者应重视英文论文的写作,以提升科研成果的国际可见度与影响力。
(4)当前语言学领域的权威期刊为《语用学报》、《语言与听力研究杂志》、《语言学》等刊物。核心著者为Mark Onslow、Ann Packman、Laurence B.Leonard等。
(5)欧美高校为当前语言学领域的主流核心研究机构,且各高校在该领域的科研实力相对均衡。
(6)统计学方法在语言学研究中具有重要的作用。
(7)语言学研究表现出显著的多学科性和学科融合特征。
(8)双语、会话、话语、身份、二语习得、西班牙语、句法、英语、特殊语言障碍、儿童、失语、口吃、音韵、语用学、叙事、评价、多语制、语义学、翻译等是当前语言学领域的研究热点问题。语言学领域与其他学科产生知识交叉关联的主题主要为:话语、隐喻、互动、会话、语言、交流、性别、转换语言、语言习得、语用学等。
参考文献:
[1] 语言学[EB/OL].http://www.baike.com/wiki/语言学.[2016.04.06].
[2] 王立非,江进林.“十一五”期间国家社科基金外国语言学立项热点及分布分析[J].外语教学与研究,2011,43(5):772-779.
[3] 束定芳.近10年来国外认知语言学最新进展与发展趋势[J].外语研究,2012,(1):36-44.
[4] 吴珊.中国语言学研究现状及发展趋势——近十年(2001—2010)国家社科基金资助项目的统计分析[J].北京航空航天大学学报(社会科学版),2012,25(1):93-97.
[5] 王立非,李琳.会话分析的国际研究进展:考察与分析(2008-2012)[J].外国语,2015,38(1):72-81.
[6] WEB OF SCIENCE[EB/OL].http://isiknowledge.com/.[2016.03.22].
[7] Journal of Pragmatics[EB/OL].[2016.04.10].http://www.journals.elsevier.com/journal-of-pragmatics.
[8] Journal of Speech Language and Hearing Research[EB/OL].[2016.04.10].http://jslhr.pubs.asha.org/.
[9] Lingua[EB/OL].[2016.04.10].http://www.journals.elsevier.com/lingua/.
[10]Professor Mark Onslow[EB/OL].[2016.04.13].http://sydney.edu.au/health-sciences/about/people/profiles/mark.onslow.php.
[11]Laurence B.Leonard[EB/OL].[2016.04.13].https://www.cla.purdue.edu/linguistics/directory/?p=Laurence_Leonard.
[12]Professor Sharynne McLeod[EB/OL].[2016.04.13].http://www.csu.edu.au/faculty/educat/teached/staff/profiles/professor/mcleod_sharynne.
[13]李贺,袁翠敏,李亚峰.基于文献计量的大数据研究综述[J].情报科学,2014,(6):148-155.
[14]Baayen R.H,Davidson D.J,Bates D.M.Mixed-effects modeling with crossed random effects for subjects and items[J].Journal of Memory and Language,2008,59(4):390-412.
[15]Florian Jaeger T.Categorical data analysis: Away from ANOVAs (transformation or not) and towards logit mixed models[J].Journal of Memory and Language.2008,59(4):434-446.
[16]Dale J.Barr,Roger Levy,Christoph Scheepers,et al.Random effects structure for confirmatory hypothesis testing: Keep it maximal[J].Journal of Memory and Language.2013,68(3):255-278.
[17]Wille R.Restructuring lattice theory: an approach based on hierarchies of concepts[M].Springer Netherlands,1982.
[18]Wille R.Formal concept analysis as mathematical theory of concepts and concept hierarchies[M].Springer Berlin Heidelberg,2005.
[19]王曰芬,曹艺.引文分析的研究与进展——基于文献计量分析[J].情报理论与实践,2011,34(8):124-128.
[20]刘萍,吴琼.基于形式概念分析的学科知识结构探测——以图书情报学为例[J].图书情报工作,2014,58(18):50-65.
[21]计算语言学[EB/OL].http://baike.baidu.com/view/758741.htm.[2016.04.14].
Research Trend of Linguistics Based on Bibliometrics and Formal Concept Analysis
YUAN Guo-ting
(School of Foreign Languages ,Jining Medical University ,Rizhao 276826,China )
Abstract :With literature collected from 2006 to 2015 in the field of linguistics from Web of Science,the research situation in linguistics is revealed quantitatively from aspects of published year,countries,languages,source journals,institutions,authors and citation analysis by employing bibliometric analysis.Furthermore,formal concept analysis is applied to exploring disciplinary subject features by integrating semantic information of disciplinary knowledge,so as to provide a reference for discipline construction and development of linguistics.
Key words: Linguistics;bibliometrics;formal concept analysis;research trend
中图分类号: H087
文献标识码: A
文章编号: 1671-380X( 2019) 05-0073-08
收稿日期: 2019-04-01
基金项目: 济宁医学院青年基金项目“基于共词分析的语言暨语言学领域热点及演进态势研究”(项目编号:JYQ14RW17);山东省社会科学规划立项课题(项目编号:11CWZJ05)。
作者简介: 袁国廷(1985—),男,山东寿光人,济宁医学院讲师,硕士,研究方向为英汉语对比与翻译。
(责任编辑:周雅春)
标签:语言学论文; 文献计量论文; 形式概念分析论文; 研究态势论文; 济宁医学院外国语学院论文;