国外2014-2018年“语篇分析”研究动态的可视化分析-基于WebofScience核心数据库的统计论文

国外2014-2018年“语篇分析”研究动态的可视化分析
——基于Web of Science核心数据库的统计

李鸿春1,2

(1.青海民族大学外国语学院,青海西宁810007;2.朴茨茅斯大学汉普郡朴茨茅斯PO12DZ)

摘 要: 本文选取Web of Science核心数据库(Core collection)收录的2014—2018年有关语篇分析的论文,借助 Citespace软件进行聚类,绘制国外语篇分析研究领域的科学知识图谱。通过挖掘机构、国家合作、领域等的共现,考察高频关键词和突变专业术语,追踪了国外近五年在语篇分析领域过去产生的及当前研究的热点和前沿。

关键词: Citespace;国外语篇分析;可视化分析

一、引言

语篇分析(discourse analysis)是对自然产生的语篇的语言进行分析的一种方法。这一术语的提出可追溯到Zelling S. Harris(1952)的结构研究。二十世纪六七十年代,语篇研究在欧美国家迅速发展起来,到九十年代得到空前发展。其研究范围不断扩大和深化,已经非常广泛。那么,经过几十年的发展,国外语篇分析领域研究现状如何?将来的研究趋势及研究热点又是什么?这些都是语篇分析研究者非常关注的。但是,近年来就这些问题缺少基于文献计量法,大规模整理及分析的综述。鉴于此,本文尝试利用Citespace软件,结合传统的定量研究方法,对语篇分析研究领域的核心研究机构、研究主题及热点等进行可视化分析,考察高频关键词和突变专业术语,追踪国外2014-2018年在语篇分析领域产生过的及当前的研究热点和研究前沿,并进一步揭示语篇分析领域未来的研究趋势,以期能够为国内语篇分析爱好者提供参考。

二、研究数据与方法

(一)数据来源

本研究数据基于Web of Science的核心数据库(Core collection),时间跨度为2014-2018年。以“标题”和“文章”为检索类型,输入字段discourse analysis,共得到1582条文献。人工剔除书评、会议通知、会议概要等无关条目后,最终选取1 168篇为本研究的分析数据。

(二)研究方法

本研究主要借助由美国德雷塞尔大学陈超美教授开发的,应用于科学文献中识别并显示科学发展新趋势和新动态的软件—Citespace,对国外近五年(2014—2018年)语篇分析领域的文章进行聚类分析,绘制科学知识图谱。通过挖掘机构、国家合作、领域等的共现,考察高频关键词和突变专业术语,追踪研究热点和研究前沿。

三、发文国家/机构可视化分析

(一)主要发文国家/地区

在Citespace中,选取“country”为节点类型,时间分区(Time Slicing)为2014至2018,时间切片(Years per Slicing)为1年,selection criteria 为Top50,即选择每个时间分区出现频次排名前50的关键词为研究对象,得到图谱1。其中Modularity Q=0.6902,Mean Silhouette=0.6365。根据Citespace,“Modularity Q值越大,则表示网络得到聚类越好。Q>0.3时意味着得到的网络社团结构是显著的。Silhouette值是用来衡量网络同质性的指标,越接近1,反映网络的同质性越高,在0.5以上,可以认为聚类结果是合理的。”[1]由此,该聚类具有显著性和合理性。

本文利用古特曼(1976)所给出的中尺度二维定常问题的数学模型,对非对称地形给出了大气运动解析解;并对不同地形高(深)度以及不同的Froude数对大气运动的影响做了讨论。主要结论有:

图1 2014-2018年主要发文国家/地区知识图谱

节点最大的是批评性语篇分析,其中Silhouette值为0.733,具有高信度。批评性语篇分析自产生之日起,通过Norman Fairclough,Teun A. van Dijk, Ruth Wodak, Roger Fowler等许多学者的推动,呈现出方兴未艾的发展势头。本文的分析显示自2014至2018年批评性语篇分析经历了2016和2018两个高峰期。随着信息技术的发展,批评性语篇分析越来越关注更加多样化的电子语篇,包括Face book, YouTube,Twitter。由于批评性语篇分析更加注重实现其导致社会变革的政治使命,因此,除了政治语篇,交通、教育、旅游、医疗、气候变化、难民、生态、年度报告、档案等主题的语篇也得到了越来越多的关注(NG, Chi Wui; Iftikhar, Waseem; McAlinden, Maggie;Chaudary, Sunita; Mullet,Dianna R.;Munro,Morag,etc.)。此外,批评性语篇分析的研究方法也呈现出多样化的特点, 开始与语料库、认知、视觉、文化理论、多模态等紧密联系(Wang, Guofeng; Brock, Andre; Roderick,Ian,etc.)。

西门子MindSphere的三个新应用程序包,包括Connect & Monitor(连接和监控), Analyze & Predict(分析和预测)和Digitalize & Transform(数字化与转型),三者都包含全面的咨询服务。这些新应用包将帮助用户更快、更简单地实现物联网项目,例如加快对资产的连接、分析和优化,利用预测分析来预防非计划停机。同时还将简化服务和商业模式。

巴西的语篇研究起步较晚,自2015年起得到迅速发展。虽然缺乏有影响力的学者,但是研究领域却非常广泛,涉及语言学,交际学,信息科学,文学,计算机科学等。

首先,修身的关键需要体认天理,程朱理学认为天理主要在自身之外,因此要体认天理就需要到自身之外的事事物物当中,特别是圣贤书当中,去格物穷理。通过今日格一物明日格一物的日积月累,最终会对外在于自身的天理有一个豁然贯通的顿悟。

如图4所示,每个节点代表一个关键词,这些关键词展示了国外近五年语篇分析研究领域的热点话题。其中较大的节点,即出现频次高的关键词依次为批评性语篇分析(critical discourse analysis)、语篇分析(discourse analysis)、交际互动(communicative interaction)、页岩气政策(shale gas policy)、民族志语篇分析(ethnographic discourse analysis)、叙事分析(narrative analysis)、第二语言社会化(second language socialization)和健康风险(health risk)。这些关键词中除了语篇分析(discourse analysis)这个范畴词以外,其他的都代表了近五年国外语篇分析研究领域所关注的热点话题。

表 1 2014-2018年发文量前十国家统计

某一机构的论文贡献也由该节点的大小来决定。在Citespace中,选取“institution”为节点类型,其他参数设置同上,得到相应的图谱。其中Modularity Q=0.9632,Mean Silhouette=0.213。Silhouette主要在聚类后来衡量某个聚类内部的同质性。该图谱的该值较低,说明聚类的内部成员很少,相似性较低。这说明近五年来缺乏影响力较大且保持活跃度的合作机构。但是,不乏有突出贡献的研究个体(见表2)。

研究热点可以认为是在某个领域中学者共同关注的一个或者多个话题,具有很强的时间特征。“通过研究某一个时间段特定领域出现的文献,揭示其共现的关键词,我们就可以发现这个时期该领域的研究热点。”[5]根据Citespace,论文的主题、关键词及科学类别图谱中,节点的大小代表出现的频次。节点越大,表示在多份文献中反复出现,因此可以被视为该领域的研究热点。

图2 2014-2018年突发性较强的前四发文国家

(二)主要发文机构

此外,我们还可以利用Citespace做突发性检测。根据Citespace,某个聚类所包含的突发节点(burstness)越多,那么该领域就越活跃。可以分为突发主题、作者、领域以及文献等。通过检测发文国家,我们可以得到图2。根据统计,英格兰(England)在2014年共发表有关论文22篇。马来西亚(Malaysia)在2015 年共发表22 篇。但以上国家的爆发只维持了一年。巴基斯坦(Pakistan)以2017年发表 3篇和2018年发表 7篇的贡献量持续了两年的爆发时间。以上统计可以看出,欧美国家仍然是该研究领域的中坚力量。但是,近年来其他国家异军突起,也逐渐成为研究的新生力量。这也进一步证明语篇研究具有强大的生命力。

表 2 2014-2018年主要发文机构

此外,2016年发文量最多的是University of Jyvaskyla(7篇),University of Ghent(6篇)和University of Melbourne(6篇)。2017年是Kazan Federal University(4篇)和University of Texas Austin(3篇)。2018年是University of Toronto(4篇),Aristotle University of Thessaloniki(4篇)和University of Fluminense(3篇)。其中Kazan Federal University尤为突出。根据突发性检测,Kazan Federal University维持了两年的突发性。

图3 2014-2018年突发性较强的前三发文机构

四、研究动态可视化分析

(一)研究热点分析

产业动态区域集聚指数,反映出一定时间段内某一产业向某地区的聚集情况,体现了产业在区域间转移的方向和速度。产业动态集聚指数小于1代表产业转出,而且数值越小,表示转出强度越大;产业动态集聚指数大于1代表产业转入,而且数值越大,表示转入强度越大。公式为:

对微流控电泳仪采集到标记荧光蛋白信号进行去噪,有利于对检测样品中蛋白定性定量的进一步分析.为了提高对重叠峰严重的标记荧光蛋白信号去噪质量,提出具备可调因子的新阈值函数,弥补了硬、软阈值函数本身的不足.选择db7小波基,经过matlab实验仿真,在处理重叠严重的模拟高斯峰信号时,新阈值函数去噪后信噪比和均方根误差指标值均高于文献[3]中阈值处理函数和其它阈值处理函数.证实了可调新阈值函数在处理带有重叠严重的高斯峰信号时,去噪质量最好.

在Citespace中,可以根据词频、词汇的突发性对研究主题进行分析。我们选取“keyword”为节点类型,其他参数设置同上,得到图谱4。其中Modularity Q=0.4263,Mean Silhouette=0.8172。Silhouette为0.7时,聚类结果是具有高信度的。Keyword具有关键词共现分析功能,可以反映出某一领域当前研究热点及过去产生过哪些热点研究。

图4 2014-2018年国外语篇分析研究热点知识图谱

中国的语篇分析研究在二十世纪九十年代初真正起步,而且一直紧跟国际发展的步伐。许多学者的研究已经表明语篇分析在中国的影响力已经大大超越传统语言学的研究。值得关注的是近年来中国学者在国外期刊发表的论文无论从数量还是质量上都有了突破性的飞跃。尤其在2018年,国外期刊发表有关论文激增至18篇。

学习数学的目的是为了应用数学.在完成教材中简单的例题教学之后,教师可进行变式和拓展,提出更为深刻的问题.如:函数y=lnx+2x-6存在几个零点?

根据Citespace,节点的整体大小反映了节点出现的次数。从图1可以看出,美国(USA)的节点最大,说明该地区近五年对语篇分析研究贡献的文献数量最多。其次,按节点大小发文量前五的依次为英格兰(England),巴西(Brazil),西班牙(Spain),加拿大(Canada)和澳大利亚(Australia)。进一步统计显示(见表1),美国在2015-2018三年间均以42篇、60篇、40篇、40篇的数量成为发文量最多国家,进一步证明美国在该领域研究多年来保持稳定,可以确定为研究的前沿重地。其研究领域涉及教育、交际、语言、管理、信息科学等。长期活跃着Chiu Mingming, Jessica Lester等学者。Chiu Mingming(2016,2017)的“Understanding Positively Within Dynamic Team Interactions: A Statistical Discourse Analysis”[2],“Statistical Discourse Analysis: Modeling Sequences of Individual Actions During Group Interactions Across Time”[3]以及Jessica Lester(2016)的“ATLAS.ti for Conversation and Discourse Analysis”[4]都具有极高引用率。

为了进一步清晰地展现每个聚类中的主要研究内容,我们提取各聚类中中心性(centrality)大于0.1的关键词(见表3)。中心性是测量节点在网络中重要性的一个指标。Citespace认为一个关键词的中心性越高,表示该关键词在文献中出现的可能性越高,其在共现网络中的影响力越大。[6]一般认为Centrality>0.1的节点在网络结构中极具重要性。由此,我们可以清楚地看出近五年国外语篇分析研究中关键词出现的中心度,可以反映出研究领域的研究重点。

表 3高中心度关键词

(二)研究前沿分析

Citespace从数据库文献的题目(Title)、摘要(Abstract)和关键词(Keyword)等检索专业术语,出现频次增长率快速增加的专业语,即突变术语,将被确定为研究前沿术语。所谓突变术语,是指使用频次突然明显增多、或在较短时间内突然出现的术语。与一般的高频次关键词相比,突变专业术语的动态变化特性使之能更准确地反映出某一学科的研究前沿[7]

根据Citespace的突发性检测,我们统计了国外近五年语篇分析领域维持两年的突变术语表(见表4)。这些术语能够清晰地展现在该领域曾经和当前的研究前沿。值得注意的是2017年开始,心理学、应用语言学、语料库语言学、符号学等学科知识已经在语篇研究中得到了广泛的应用,而且学者逐渐开始关注社会各层面的群体,包括年轻人、难民、寻求政治避难者等;开始关注各种社会问题,包括人权、可持续性发展、欧洲一体化等,表明语言学者关注社会行为和社会问题,通过相关语言的分析进而进行阐释和解释,具有承担社会责任感的意识。

表 4 2014-2018年突变术语表

除此之外,有些关键词保持着高热度,持续了三至五年,主要有以下几个:online,risk,attitude, mass media, discursive pattern, textural feature, multimodal critical discourse analysis。其中,online持续的时间最长,持续时间长达五年。进一步的检索显示,以online为研究载体的文献由2014年的7篇激增至2015年的17篇。且此后三年中一直呈稳定状态发展。这进一步反映出了电子语篇近年来所受关注度之高。

(三)研究趋势分析

我们另选取Web of Science收录的2019年发表论文91篇,以“keyword”为节点类型,时间分区(Time Slicing)为2019年,selection criteria 为Top20,其他参数设置同上,得到相应的图谱。其中Modularity Q=0.5715,Mean Silhouette=0.6799。该图谱合理。按照节点的大小,我们依次得到Hillary Clinton,Gees identity framework, diachronical corpus-based critical discourse analysis, online news coverage,critical discourse analysis等关键词。此外,在每个节点中gender,power, political discourse,language,communication,corpus linguistics,education等具有很高的中心性。这些大节点、高中心度的词或许可以反映出语篇研究领域近期的研究趋势。

此外,语篇分析在研究方法上研究呈现出多路径,多视角的趋势。通过Citespace,我们可以构建学科关联网络,进行学科共现分析,揭示出语篇分析领域与其他各个学科之间的内在联系。在Citespace中,选取“category”为节点类型,其他参数同上。得到图谱5。其中Modularity Q=0.4376,Mean Silhouette=0.6295。该图谱合理。图5显示出语篇分析研究已经紧密逐渐开始结合语料库、历史、哲学、文化理论、统计学等学科。此外,文学、法律、医学、老年医学、地理学等领域的语篇也开始进入学者的研究视野。

图5 2014-2018年国外语篇分析研究领域知识图谱

四、结语

本文运用 CiteSpace信息可视化软件,对国外近五年有关“语篇分析”研究领域的文章进行了聚类分析,绘制了研究动态的科学知识图谱,研究了语篇分析领域研究的热点。通过突变术语的探测,揭示了每年的研究前沿和最新的发展趋势。我们发现最近五年语篇分析领域研究呈现了以应用为主,以批评性语篇分析为主导,多路径发展的特点及趋势。

本文的研究在软件的使用、研究的深度等方面还存在许多的局限性。此外,开展国内外对比研究也有广阔的空间。我们期待更多的学者借助 CiteSpace等分析工具对语篇分析这一研究领域的发展现状及趋势进行更加全面、深入的研究。

参考文献:

[1][6][7]李杰,陈超美. Citespace:科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社,2016.

[2]Chiu Mingming. Understanding Positively Within Dynamic Team Interactions: A Statistical Discourse Analysis[J].Group & Organization Management,2017,(1):39-78.

[3]Chiu Mingming. Statistical Discourse Analysis:Modeling Sequences of Individual Actions During Group Interactions Across Time[J].Group Dynamics-Theory Research and Practice,2016,(2):242-258.

[4]Lester Jessica. ATLAS.ti for Conversation and Discourse Analysis[J].International Journal of Social Research Methodology,2016,(4):405-428.

[5]张继光.国内翻译研究动态的科学知识图谱分析(2005—2014):基于12种外语类核心期刊的词频统计[J].东北大学学报(社会科学版),2016,(4):429-435.

Visualization Analysis of Overseas Discourse Analysis in 2014-2018——Based on Core Collection of Web of Science

LI Hong-chun1,2

(1.Institute of Foreigu Languages ,Qinghai Nationalities University ,Xining 810007,China ; 2.University of Portsmouth ,Portsmouth Hampshire PO 1 2DZ ,UK )

Abstract :Based on the data from Core Collection of Web of Science, the paperuses Citespace and maps knowledge domain of discourse analysis. It also studies high-frequency key words and burst terms to trace the research focuses, tendencies and frontiers of discourse analysis research area in the past five years by exploring the co-occurrence of the institutions, countries and categories.

Key words :Citespace;Discourse Analysis;Visualization Analysis

收稿日期: 2019- 06- 13

基金项目: 2018年西部地区人才培养特别项目(留金项[2018]10006号)

作者简介: 李鸿春(1975-),女,汉族,江苏扬州人,语言学博士,青海民族大学副教授。研究方向:系统功能语法及语篇分析。

中图分类号: H04

文献标识码: A

文章编号: 1000-5102-( 2019) 04-0148-05

(责任编辑:李 静)

标签:;  ;  ;  ;  ;  

国外2014-2018年“语篇分析”研究动态的可视化分析-基于WebofScience核心数据库的统计论文
下载Doc文档

猜你喜欢