基于CSSCI的国内情报学领域作者耦合分析_情报学论文

基于CSSCI的国内情报学领域作者文献耦合分析,本文主要内容关键词为:情报学论文,文献论文,领域论文,作者论文,国内论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

文献耦合的概念最早是由美国学者M.M.Kessler提出的[1]。他发现,越是学科或者专业内容相近的论文,它们的参考文献中包含的相同文献数量就越多。于是,他把两篇论文同时引用一篇论文的论文(即共同的参考文献)称为耦合论文(coupled papers),并把它们之间的这种关系称为文献耦合。基于类似的考虑,同样也可以根据作者引用相同文献的情况,建立基于引文的作者耦合关系。这种耦合关系的建立与作者共被引关系相似,都是通过第三方文献而建立,是一种隐性的、间接的学术关系。如果两个作者共同引用的文献越多,则说明他们的研究兴趣越一致,这也就为通过作者耦合关系的构建来研究学科(领域)的知识结构以及学者的研究动向提供了一定的理论前提。明确提出作者文献耦合分析方法的是D.Z.Zhao,他在文中探讨了该方法的基本思路,并将其应用于世界范围情报学领域的演化研究中[2]。笔者以此为契机,借鉴D.Z.Zhao的分析思路,综合运用作者文献耦合分析和社会网络分析的方法,利用CSSCI近十年来的引文数据,对国内情报学领域核心作者的耦合关系进行深入发掘,进一步尝试实现其研究活力情况以及该领域前沿性学科结构的探索分析。

2 数据来源与研究方法

2.1 样本选取

本研究主要选取《中文社会科学引文索引》(CSSCI)在2000-2009年所收录的中图类号为G35(情报学、情报工作)的来源文献作为数据样本。笔者以此作为限制条件,共获取论文总数为9 208篇,其中有具体作者的文章共9 189篇,具有参考文献的文章有8 603篇,删除重复的文章以及纯粹评论性的文章,最后共获取数据样本8 567篇。

对由8 567篇文章组成的数据样本进行统计分析,得到以第一作者身份发文的学者共4 806人,其中只发表1篇文章的有3 389人,发表2篇论文的有730人,发文在10篇以上的作者有66人,其中前30位(发文数≥15)的高产作者如表1所示;对所有引文数据的第一作者进行统计,得到引文70 947篇(含英文文献),引文作者31 470位(含英文作者),其中被引1次的作者有22 512人,被引2次的有4 296人,被引10次以上的有853人,其中前24位(被引频次≥100)的高被引作者如表2所示。

2.2 研究方法与工具

作者共被引分析(Author Co-citation Analysis,ACA)的概念于1981年被White和Griffith引入[3]之后,便引起了不同研究领域的广泛重视,许多学者也在致力于将其应用到特定领域知识结构的研究分析中。然而共被引分析刻画的只是过去的活跃作者对当前研究领域产生的知识影响,而不能体现出当前研究群体的活力及其研究重点所在。面对这种情况,D.Zhao等人提出了一种描述当前研究作者自身的研究活力与倾向的方法,即作者文献耦合分析(Author Bibliographic-Coupling Analysis,ABCA),该方法可以更好地分析出某领域当前研究的现实情况,是共被引分析的一个有益补充。另外,作者耦合与文献耦合是有根本关联性的。两篇论文同时引用相同的参考文献,即为文献耦合,而作者耦合的主体是论文的作者。这一主体的更换使得耦合关系也有了很大的转变:作者之间的耦合强度会随着时间的改变而改变,从而使得引证文献之间固定而长久的静态关系变成了作者之间的动态结构,于是作者耦合关系的分析相比文献耦合对于研究学科前沿、发现学科知识结构更具有应用价值,并且作为一种现在时的分析工具还在一定程度上弥补了作者共被引分析局限于历史性、过去时分析的缺陷。考虑到目前还没有对CSSCI引文数据进行共现分析的体系软件出现,所以这一研究过程将通过笔者自行编写相关的VBA程序以实现特定的共现分析,为深入的作者文献耦合关系挖掘作好铺垫。

社会网络分析(Social Network Analysis,SNA)是对社会网络中各种关系结构及其属性加以分析的一套理论和方法,它主要分析的是行动者之间的关系模式。该方法已经被证实可以应用于引证关系的研究[4]。在社会网络分析的辅助下,引文分析这一知识网络研究的重要工具也可以发挥更大的功效[5]。本文将综合运用作者文献耦合分析与社会网络分析的方法构建情报学领域核心作者的耦合网络,对其耦合关系情况进行深入探究,以期实现其研究活力情况以及该领域前沿性学科结构的探索分析,主要将通过UCINET这一整体网分析软件来实现。

同时,文献计量的理论也将贯穿研究始终,其中的普莱斯定律可以协助我们找到该领域内的核心作者[6],以作为本文的主要研究对象。在研究中还将利用因子分析的统计方法对作者的耦合情况进行深入分析,以便发现当前具有高研究活力作者的聚集分类情况,从而揭示出国内情报学领域的研究热点以及研究主题的变更趋向,这一过程将利用SPSS统计软件实现。本研究将采用Netdraw来实现各种网络结构的可视化显示。

3 作者文献耦合分析

3.1 选定核心作者群

由于发文量是衡量作者学术水平和科研能力的重要指标,核心作者是指那些在本学科研究中造诣较深、获得科研成果较多的学科带头人。按照普赖斯的理论,发表论文数为N篇以上的作者为杰出科学家,即核心作者,计算公式为:,式中为发文量最多的作者的论文数[6]。由上可知,情报学领域核心作者发表论文量应为N=6.18篇以上,因此本文选定发文6篇以上的核心作者群(共180位)进行分析。本文对于核心作者研究活力的分析将借鉴D.Z.Zhao所提出的作者文献耦合的思路进行探讨。首先在上述180位核心作者中选取平均耦合频次≥0.0444的102位作者作为耦合分析的作者群(此处作者数量的选择主要是基于与共被引分析作者数量相当的考虑)。高平均耦合频次表明该作者要么与其他作者有相当大程度上的文献耦合总数,要么与小部分的作者有非常强的耦合联系。这种选择作者群的模式既考虑到作者的高产性又考虑到作者在相应研究领域中的高连通性,从而为进行领域内核心作者研究活力的探讨做好了铺垫。

这里,两个作者的耦合次数计算方法是:将每个作者(只考虑第一作者)所有的发表论文的参考文献分别列出,然后比对这些参考文献,找出共同的参考文献次数即为两个作者之间的耦合次数。由于一篇文献在某个作者的参考文献中出现的次数不止一次,比如在A作者中出现N次,同时在B作者的参考文献中出现M次,则这篇文献要给个权值,具体为MIN(N,M)。这一过程将通过自编VBA程序实现。最后取某一作者与其他作者所有耦合次数之和除以总作者数减1作为作者的平均耦合频次值。从表3中可以看出,国内情报学领域作者的平均耦合频次相对偏低,全部都在1以下;另外,在核心作者中还有18位作者未与其他任何核心作者产生耦合关系,整体水平与笔者之前对科学计量学这一微领域在世界范围内的研究情况相差甚远[7]。这可在一定程度上反映出国内情报学领域的研究仍然处于一种相对封闭的状态,研究动力与活力相对低落。

3.2 构建作者文献耦合矩阵

对上述102位作者生成耦合矩阵如表4所示。其中,为了突出自己与自己的亲密关系,采用最大值+1的方法作为对角线上的取值[8]。进一步对耦合作者对的分析,发现这5 151组作者对形成耦合关系只有1 340次,平均次数仅为0.2,可见作者之间总体的耦合强度非常低;4 337对作者之间没有直接的耦合关系,该比例占到总数的84%,具有耦合关系的作者也大多集中在1次~2次左右,耦合频次≥10的只有5对,仅占0.1%,可见该领域内核心作者的连通性相对很差,集中研究方向较为分散,整体研究活力相对较低。耦合强度最高的作者对是邱均平-文庭孝、肖勇-梁战平、肖勇-王知津,他们的平均耦合频次值也相对较高,是当前国内情报学研究中较为活跃的几位作者。

3.3 耦合网络结构分析

对上述耦合矩阵作出耦合网络结构图,如图1所示。与作者共被引网络图类似的,图中每个圆点表示1位作者,圆点的大小代表他们在该网络中的中心度情况,圆点之间的连线粗细可表示作者两两之间耦合频次的多少,圆点之间连线的长短可在一定程度上表示出作者之间因耦合关系所产生的密切程度。另外,作者颜色的不同也可用以区分通过K-cores分析所得到的分组情况。

我们发现,该网络高度不连通,网络密度为0.2601,与共被引网络密度相差较大,也就说明了国内情报学领域作者耦合强度比共被引强度低很多,大量作者之间没有产生研究耦合关系。这也在一定程度上说明,作者影响领域离散与研究领域集中的博弈现象普遍存在。通过中心性测度,可以发现在耦合网络中,王知津和肖勇的程度中心性、中介中心性和亲近中心性都是最高的,其次是邱均平、文庭孝等,他们在该领域中具有较强的研究活力。这与以上耦合作者对的分析也是一致的。

将国内情报学领域核心作者群内作者发文数、平均耦合频次与耦合网络所测度的三种中心性指数进行相关性分析(如表5所示),可以发现发文数、平均耦合频次与三种中心性指数都存在显著相关关系,其中平均耦合频次与程度中心性的关系数达到0.9976,这一点是由其原理所决定的,其计算过程具有一定的相通性,从而决定了二者必然密切相关。以上分析可以大致说明国内情报学领域内的核心作者大多居于耦合网络的中心位置,有较强的网络连通性和信息控制能力。这种高产、高连通性在一定程度上决定了他们在该领域内的高活跃性,使得他们在领域内当前乃至未来的研究发展中将会产生巨大的推动力。

利用SPSS软件将作者耦合矩阵转化为相关矩阵,可以发现耦合强度高的作者对一般具有相对较高的正相关性,而耦合强度较低的作者对所存在的相关性则相对较低,这在一定程度上也是作者对于不同领域的研究活跃程度以及研究主题不一致性的体现。这一结论与共被引分析的结果也是类似的,可见无论是高被引作者的影响程度也好,还是核心作者的研究活力也好,都存在一定的集中离散分布趋势,但所集中或离散部分的作者或者研究主题却未必是相同的。

3.4 因子分析及其可视化显示

与共被引分析类似的,应用SPSS对耦合矩阵进行因子分析,采用主成分(Principal Components)萃取因素,以直接斜交(Direct Oblimin)进行转轴,在碎石图(如图2所示)的参考基础之上,可以提取出9个因子,累计贡献率为80.023%。在对载荷阀值做出限定之后(限定载荷在0.2以上),借鉴D.Z.Zhao曾经提出的可视化思路[9],利用Netdraw软件对因子分析得到的结构矩阵进行二维图的可视化显示,如图3所示。其中,圆形节点表示因子,方形节点表示作者,因子节点的大小表示所有作者对该因子的载荷总值,作者节点的颜色表征涉及因子数目的不同,作者与因子节点之间的连线粗细表示作者对该因子的载荷大小。程刚、屈宝强、孙建军、叶鹰、罗贤春和杨海平6位作者,他们有的是该领域新兴作者,有的是侧重于其他相关学科(如经济管理领域)的研究,总之都对于情报学领域的研究方向不够集中或者活跃性不强,因此对以上9个因子的载荷都在0.2以下,于是就成为孤立的节点

通过因子分析,可以对核心作者群进行分组。对由作者文献耦合关系所形成的各个研究共同体中的作者发表论文中所标引的关键词进行统计,可以发现相应研究团体的领域研究热点所在。按照耦合关系,可将近十年来国内情报学核心作者大致分为9个主题领域,即文献计量与科学计量、情报学理论与方法、竞争情报与信息咨询、信息分析与信息服务、信息资源管理与配置、信息检索与可视化技术、知识管理与科技创新、网络信息资源组织与整合以及图书分类与情报检索,但是不同主题所涉及核心作者情况以及领域内核心作者对于不同主题的研究贡献情况都有很大区别(如表6、表7所示)。其中,情报学理论与方法和信息分析与信息服务两大研究主题下的核心作者总数最多(均为35),其次是文献计量与科学计量和竞争情报与信息咨询(分别为28和23),最少的是信息检索与可视化技术这一主题领域;但是从首要载荷作者(作者对某一领域的载荷贡献最大)情况来看,计量学和竞争情报这两个主题的数量最多,并且载荷均值和最大载荷值都是最大的,可见核心作者对于这两大领域的研究集中性和活跃性都相对较高;而知识管理与科技创新和图书分类与情报检索两个主题下的首要载荷作者分别只有3位和2位,而且载荷值也相对较低,这与以上研究主题的学科交叉性和综合性是有关系的,它们或许还尚未形成或者已经淡出了国内情报领域的研究重点。另外,有27位作者对于情报学理论和信息分析与服务这两个主题都有较高的载荷贡献,这也在一定程度上反映出二者的高度相关性,与图3所示的结果也是一致的。

3.5 结果分析

目前,国内外都有学者已经证明从作者耦合关系出发,能够动态地揭示一个学科(领域)的知识结构,尤其体现在其前沿知识结构。这一点与White等人所提出的作者共被引分析是有相似之处的。White曾两度利用作者共被引分析对国际情报学领域的研究情况进行探索,并对其进行分类;后来D.Z.Zhao也曾结合作者共被引和作者文献耦合分析对国际情报领域研究演化情况作出了深入的探究。在本研究中,笔者结合前文中作者文献耦合关系的图表情况(图3和表6),也将国内情报学研究大致分为基础研究和延伸探索两大部分。前者主要以文庭孝、邱均平、肖勇、梁战平、周宁、张学福、白华等学者为代表,多集中于情报学理论与方法、文献计量与科学计量、信息检索与可视化技术以及图书分类与情报检索等基础理论、方法与技术方面的研究;而后者则以吴晓伟、包昌火、韩毅、刘春茂、朱庆华、夏立新、储节旺、冷伏海、马文峰、杨建林等学者为代表,主要涉及竞争情报与信息咨询、信息分析与信息服务、信息资源管理与配置、知识管理与科技创新、网络信息资源组织与整合等综合交叉性、应用性的衍生主题的研究。

由于图3是利用Netdraw软件作出的MDS图,所以可以在一定程度表征各个因子之间的相互关联性,同时结合因子分析得到的因子相关性矩阵(表8),可以发现基础研究和延伸探索两部的因子之间都存在较强的相关性,比如信息分析与服务和情报学理论方法、计量学这两大基础之间都存在较高的关联度,这在一定程度上反映了情报学理论研究向信息分析应用研究发展的趋向,正是在既存的研究团队中那些具有桥梁和导向作用的中间研究者推动了这种研究取向的转变,而他们也将在这一转变中形成新的研究共同体,从而进一步将新的研究热点推向高潮。另外,因子7即知识管理与科技创新这一主题与基础研究部分的相关性也是相对比较高的,并且与情报学理论与方法这一基础主题的载荷作者重复度也相对偏高,这也在一定程度上验证了情报学促生知识管理学发展的论断[10]。同时,借鉴其他相关学科主题的研究方法和经验,这一主题的研究活力也在迅速扩大。但是该主题的平均载荷值却比较低(仅为0.2963),这也在一定程度上说明该主题领域的核心作者群还未明显形成,其研究主体与客体还有待进一步明确和稳定。而与之相对的,竞争情报与信息咨询这一主题似乎独成一支,与其他相关主题关联性相对较弱,该主题下的独立研究作者相对较多,相比其他的延伸领域发展更为迅速,相对更为成熟。从表9中,我们还可以发现因子5、6、8之间的相关度也是相对较高的,这可以反映出信息资源的良好配置、网络信息资源的有效组织都离不开信息技术的强力支撑,三方面的研究也势必要连接在一起,共同达到现代化信息资源管理这一研究热点的推进。

同时,我们还可以发现,文献计量与科学计量、竞争情报、信息检索技术这三大研究主题下的相对单贡献作者数(表示只在单一因子中载荷值≥0.2的作者数占总载荷作者数的比例)最多,尤其信息检索主题最为突出,这一主题下的核心作者(如周宁、张学福、张会平等)更多地关注技术方面的研究,而与其他主题的理论方法研究相对分离,但却是相辅相成的。在基础研究部分,文献计量研究是与情报理论方法研究并列存在的,其他很多主题领域的研究都是在这两个传统主题上衍生发展出来的,这一点可以从他们与其他因子之间的相关性上体现出来。当然也有很多学者始终专注与计量学这一特定主题的研究,从最初的文献计量到后来的信息计量、科学计量、网络计量,乃至现在刚刚出现的知识计量,邱均平、王宏鑫、庞景安等人对于这一主题的研究贡献都比较大,并形成了自己的研究团队,尤其以邱均平为核心的师生团队,比如文庭孝、张洋、赵蓉英等新生研究力量已经在计量学的舞台占据了很大的空间,他们都对于这“五计学”的发展作出了重大的贡献。竞争情报作为经济学、管理学与计算机领域的交叉研究主题也在崛起后快速发展,吴晓伟、包昌火、秦铁辉、彭靖里等这一主题下的单贡献作者,作为国内竞争情报的奠基人,现在仍然活跃于这方面的研究,在推动该主题领域的发展上功不可没。

另外,从表6中可以看出,国内情报学领域核心作者的研究所涉及的主题情况也是有很大不同的。通过因子载荷(载荷值≥0.2)的统计,发现涉及领域最多的是王知津、马海群、周九常、化柏林4位学者,他们在4个领域都有或多或少的研究贡献。有23位作者在3个领域有所涉及,32位作者集中于2个领域的研究,有37位作者只在1个领域有贡献值,他们有些是集中贡献于某一特定因子,即主要在某一特定主题进行深入研究,如文庭孝、包昌火等人;有些学者只在特定因子上有较小的载荷值,他们可能属于跨学科的研究,而在情报领域主要偏重于相关主题的泛在研究,或者刚刚进入情报学领域,还没有更为深入的建树,如邓小昭、卢青等人。从因子载荷分布来看,大多数作者主要集中于单一主题或者两个主题的研究,可见国内情报领域内核心作者的总体研究方向较为集中,研究模式大多属于双主题跟进、单一主题深入的形式,尤其在情报学理论方法、信息分析与服务、知识管理、图书分类与情报检索等主题内的作者重复率最高。

4 结语

通过对近十年来CSSCI收录的情报学领域中核心作者的耦合关系进行分析,可以得出以下结论:

(1)通过作者文献耦合强度的计算以及耦合作者对的分析,可以发现,国内情报学领域作者的平均耦合频次整体偏低,领域研究仍然处于一种相对封闭的状态,研究动力与活力相对低落。不过,其中邱均平、文庭孝、肖勇、王知津、梁战平5位作者两两之间的耦合频次最高,他们的平均耦合频次值也相对较高,是当前国内情报学研究中较为活跃的几位作者。

(2)通过作者文献耦合网络结构的分析发现,该网络高度不连通,有大量的桥连接现象存在,作者整体耦合强度比较低,大量作者之间没有产生研究耦合关系。在所有的耦合关系中,王知津和肖勇与其他作者的耦合频次最多,程度中心性、中介中心性和亲近中心性都是最高的,其次是邱均平和文庭孝,他们大致居于网络的核心位置,在网络连通以及信息流动中也同样具有极高的控制力。同时,作者的发文数、平均耦合频次与以上三种中心性指数都存在显著的相关关系,这一方面是与计算原理密切相关的,另一方面也可以反映出国内情报学领域内的核心作者大多居于耦合网络的中心位置,有较强的网络连通性和信息控制能力。这种高产、高连通性在一定程度上决定了他们在该领域内的高活跃性,使得他们在领域内当前乃至未来的研究发展中将会产生巨大的推动力。

(3)通过因子分析,可将近十年来国内情报领域的核心作者大致分为9个主题领域,即文献计量与科学计量、情报学理论与方法、竞争情报与信息咨询、信息分析与信息服务、信息资源管理与配置、信息检索与可视化技术、知识管理与科技创新、网络信息资源组织与整合以及图书分类与情报检索。其中,情报学理论方法和信息分析两大主题下的核心作者数最多,但是二者的重复作者率也是最高的,二者具有高度的相关性;计量学和竞争情报这两个主题首要载荷作者数最多,且载荷值均值也最大,可见核心作者对于这两大领域的研究集中性和活跃性都相对较高;由于学科交叉性和综合性等关系,知识管理和图书分类两个主题下载荷作者数和载荷值都相对较低,说明这两个子领域或许还尚未形成或者已经淡出了国内情报领域的研究重点。进一步分析,可将国内情报学研究大致分为基础研究和延伸探索两大部分,前者多集中于情报学理论与方法、文献计量与科学计量、信息检索与可视化技术以及图书分类与情报检索等基础理论、方法与技术方面的研究;而后者则主要涉及竞争情报与信息咨询、信息分析与信息服务、信息资源管理与配置、知识管理与科技创新、网络信息资源组织与整合等综合交叉性、应用性的衍生主题的研究。在这两部之间也存在一些具有桥梁和导向作用的中间研究者,在某种程度上推动了这种研究取向的转变。同时,他们也在这一转变中逐渐形成新的研究共同体,从而进一步将新的研究热点推向高潮。

(4)通过可视化结果以及作者与主题之间的对应关系可以看出,基础研究和延伸探索两部的因子之间都存在较强的相关性,比如信息分析与服务和情报学理论方法、计量学这两大基础之间都存在较高的关联度,这在一定程度上反映了情报学理论研究向信息分析应用研究发展的趋向;知识管理研究主题与基础研究部分的相关性也是比较高的,并且与情报学理论这一基础主题的载荷作者重复度也相对偏高,这也在一定程度上验证了情报学促生知识管理学发展的论断,但该主题领域的核心作者群还未明显形成,其研究主体与客体还有待进一步明确和稳定;信息资源管理与配置、网络信息资源组织以及信息检索技术之间也有较高的相关性,这可以反映出信息资源的良好配置、网络信息资源的有效组织都离不开信息技术的强力支撑,三方面的研究也势必要连接在一起,共同达到现代化信息资源管理这一研究热点的推进。另外,计量学、竞争情报、信息检索技术这三大研究主题下的相对单贡献作者数最多,这在一定程度上反映了这三个主题领域作者研究的集中性与专注性。

(5)国内情报学领域核心作者的研究所涉及的主题情况也是有较大区别的。研究范围最广的作者可涉足4个主题领域,其中青年作者的研究力和活跃性都在扩展迅速。但多数作者仍集中于2个或2个以下主题领域的研究,其中有37位作者只在1个领域有贡献值,其中有的是主要在某一特定主题进行深入研究,有的则是偏重于相关主题的泛在研究或者是刚刚涉足该领域的研究。总体来看,国内情报领域内核心作者的总体研究方向较为集中,研究模式大多属于双主题跟进、单一主题深入的形式,并倾向于从基础研究到衍生主题发展的趋向。

标签:;  ;  ;  ;  

基于CSSCI的国内情报学领域作者耦合分析_情报学论文
下载Doc文档

猜你喜欢