基于CSSCI的国内情报学领域作者共引分析_情报学论文

基于CSSCI的国内情报学领域作者共被引分析,本文主要内容关键词为:情报学论文,领域论文,作者论文,国内论文,CSSCI论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

doi:10.3772/j.issn.1000-0135.2012.01.013

1 引言

1990年,McCain将作者共被引分析(Author Cocitation analysis,ACA)的步骤归纳为选择作者、检索共被引频次、构造共被引矩阵、转化为皮尔逊相关系数矩阵、多元分析和解释结果及效度分析6个步骤,人们称其为传统ACA或德瑞克赛模式[1],这一模式为后来学者进行ACA分析提供了良好的范例,并且在揭示学科结构的发展现状以及变化情况等方面都有非常广泛的应用。本文将借鉴这种模式,但又采取区别于这种传统思路的共被引分析方法,即通过程序自动生成共被引矩阵,继而综合采用引文分析、因子分析以及社会网络分析等多种方法,利用CSSCI近十年来的引文数据,对国内情报学领域高被引作者的共被引关系进行深入发掘,进一步尝试实现其研究影响力情况以及该领域学科结构的探索分析。

2 数据来源与研究方法

2.1 样本选取

本研究主要选取《中文社会科学引文索引(CSSCI)》在2000~2009年所收录的中图类号为G35(情报学、情报工作)的来源文献作为数据样本。笔者以此作为限制条件,共获取论文总数为9208篇,其中有具体作者的文章共9189篇,具有参考文献的文章有8603篇,删除重复的文章以及纯粹评论性的文章,最后共获取数据样本8567篇。

对由8567篇文章组成的数据样本进行统计分析,得到以第一作者身份发文的学者共4806人,其中只发表1篇文章的有3389人,发表2篇论文的有730人,发文在10篇以上的作者有66人,其中前30位(发文数≥15)的高产作者如表1所示;对所有引文数据的第一作者进行统计,得到引文70 947篇(含英文文献),引文作者31 470位(含英文作者),其中被引1次的作者有22 512人,被引2次的有4296人,被引10次以上的有853人,其中前25位(被引频次≥100)的高被引作者如表2所示。

2.2 研究方法与工具

作者共被引分析(Author Co-citation Analysis,ACA)的概念于1981年被White和Griffith引入[2]之后,便引起了不同研究领域的广泛重视,许多学者也在致力于将其应用到特定领域知识结构的研究分析中。White后来也曾一度对共被引分析的方法进行探索,并将其总结为一套标准的思路,即采用因子分析、聚类分析和多维尺度分析的方法模式进行研究。国内学者大多采用聚类分析与多维尺度分析相结合的思路来探讨某一领域作者基于共被引关系的分类情况,进而找出该领域的研究热点与趋势所在。而鉴于本研究的数据特性和研究目的,将借鉴Zhao等的思路单独选择因子分析的方法对国内情报学领域高被引作者的共被引关系进行深入分析[3],并与前人的研究结果进行比较,以期为国内作者共被引分析的固有模式,提供一个新的视角,进一步形成有益的补充。这一过程将利用SPSS统计软件实现。

社会网络分析(Social Network Analysis,SNA)是对社会网络中各种关系结构及其属性加以分析的一套理论和方法,它主要分析的是行动者之间的关系模式。该方法已经被证实可以应用于引证关系的研究[4],本文将应用社会网络分析方法对情报学领域高被引作者的共被引网络进行系统分析,主要将通过UCINET这一整体网分析软件来实现,同时采用Netdraw软件来实现各种网络结构的可视化显示。另外,国内基于CSSCI数据对纯粹被引作者的引证关系进行分析的研究还并不常见。考虑到目前还没有对CSSCI引文数据进行共现分析的成型软件出现,所以这一研究过程将通过笔者自行编写相关的VBA程序以实现特定的共被引分析。

本质上讲,因子分析、聚类分析和多维尺度分析都是基于分类思想的研究方法,传统模式下后两种方法的结合多是一种图形化的归类和有限条件下的可视化显示,而因子分析与社会网络中相关可视化软件(如Netdraw)的结合使用可以给出表达方式更为恰当、富含信息更为详尽的一种分类模式,并且能够从中得出不同类别之间的区分度与关联性,从而帮助研究人员更为准确地分析某一领域的知识结构。另外,借鉴社会网络的思路,作者共被引关系也可以进一步网络化,从而借助网络结构分析、凝聚度和中心性分析等方法可以对特定领域内作者的影响力情况进行深入的探索,以期对研究工作的推进和学科领域的发展提供一定的参考和帮助。

3 作者共被引分析

3.1 构建共被引矩阵

已有学者指出并证实了在情报学中也普遍存在二八法则现象,这与文献计量中的洛特卡定律、齐普夫定律、布拉德福定律等集中离散规律也是一脉相承的[5]。所谓二八律就是说,在领域中,20%的人做了80%的工作;类似地,20%的高被引作者也可以反映出80%的总体情况。因此,我们选择国内作者中总被引次数占20%(总数为48 053次)的101位高被引作者(被引频次≥40)作为共被引分析的对象。

首先,编写程序对这101位高被引作者构建共被引矩阵。其中,为了突出自己与自己的亲密关系,采用最大值+1的方法作为对角线上的取值[6]。进一步对作者共被引对的分析,发现这5050组作者对形成共被引关系9886次,平均次数接近2次/对,可见作者之间总体的共被引强度相对较低。另外,有2680对作者没有共被引关系,占到了53%;共引次数≥10的作者对只有234组,只占总数的4.63%,其中只有7组作者对的共引次数≥50(表3),可见国内情报学领域高被引作者的共被引程度相对分散,并没有形成统一的研究群体影响模式,作者所产生影响的主题领域也较为分散,缺乏相对的稳定性。通过分析共被引次数最高的7组作者对,即邱均平—马费成、马费成—严怡民、马费成—王知津、马费成—梁战平、严怡民—邱均平、王崇德—邱均平、邱均平—王知津,可以发现,其中涉及邱均平、马费成、严怡民、王知津、梁战平和王崇德6位作者,可以推断他们对于国内情报学领域的发展都产生了最大的影响;以上作者对主要依靠邱均平和马费成连接在一起,另外,严怡民与梁战平和王知津所构成作者对的共引次数也分别达到了48次和44次,这也在一定程度上说明了严怡民教授作为国内情报学的拓荒者和奠基人对于情报领域发展产生的重要影响。

3.2 共被引网络结构分析

利用Netdraw对上述共被引矩阵作出作者共被引网络图,如图1所示。图中每个圆点表示一位作者,圆点的大小代表他们在该网络中的中心度情况,圆点之间的连线粗细可表示作者两两之间共被引的频次的多少,圆点之间连线的长短可在一定程度上表示出作者之间的密切程度;另外,作者颜色的不同可用以区分通过K-cores分析所得到的分组情况,其中红色标识的是最庞大的一组,作者数最多,并且对情报领域具有最强的影响力。

利用Ucinet对上述网络结构进行分析,发现该网络密度为1.9576,网络连通性在一般社会网络中居于中间水平,有些节点高度连通,同时也存在多数节点间没有直接连通的现象,通过中心性测度(表4)可以发现,马费成和邱均平与其他作者的共被引频次最多,因此程度中心性最高,居于网络的核心位置,对近十年来国内情报学领域的影响力也是最为巨大的;并且两人在中介中心性和亲近中心性上也是最高的,这也在一定程度上表明了这两位学者在网络连通以及信息流动中也同样具有极高的控制力。另外,严怡民、王知津和包昌火紧跟其后,也在共被引网络中占有非常重要的地位,并对近十年情报领域的发展产生了极为深远的影响。以上分析结果恰好验证了共被引作者对分析的推断。

将国内情报学领域高被引作者群内作者被引频次与共被引网络所测度的三种中心性指数进行相关性分析(表5),可以发现被引频次与三种中心性指数都存在显著相关关系,这一结论也与前文对三种中心性指数的分项分析结果相吻合。以上分析可在一定程度上说明国内情报学领域内的高被引作者同时在共引网络中有较强的影响力,居于较核心的位置,对于该领域内信息传播与知识交流进而推动学科发展都具有非常重要的作用。

图1 作者共被引网络结构图

利用SPSS软件将作者共被引矩阵转化为相关矩阵,可以发现共被引强度高的作者对一般具有相对较高的正相关性,而共被引强度较低的作者对所存在的相关性则相对较低,有些作者甚至出现了负相关,这一结论与蔡明月教授于2003年对半导体领域的作者共被引分析所得出的结论基本一致[7],不同的是国内情报学领域作者共被引强度分布更为分散,负相关性的存在更为普遍。这种相关系数的离散分布也是作者对于不同领域的影响程度以及主题不一致性的大致体现。

3.3 因子分析及其可视化显示

进一步应用SPSS对共被引矩阵进行因子分析,采用主成分(principal components)萃取因素,以直接斜交(direct oblimin)进行转轴,在碎石图(图2)的参考基础之上,可以提取出8个因子,累计贡献率为85.591%。通过斜交旋转的因子分析,我们可以得到两个矩阵,即因子图式矩阵(pattern matrix)和因子结构矩阵(structure matrix),前者中的载荷系数突出的是作者(变量)对研究主题(因子)的独特影响力情况;而后者则可以通过作者对特定主题的贡献以及主题之间的关联性反映出作者(变量)与研究主题(因子)之间的相关性[8]。因此,我们将进一步选择结构矩阵进行分析。对载荷阈值做出限定之后(限定载荷在0.2以上),利用Netdraw软件对上述结构矩阵进行二维图的可视化显示,如图3所示。其中,圆形节点表示因子,方形节点表示作者,因子节点的大小表示所有作者对该因子的载荷总值,作者节点的颜色表征涉及因子数目的不同,作者与因子节点之间的连线粗细表示作者对该因子的载荷大小。由于史忠植研究员主要侧重于计算机领域的研究,对于情报学领域的影响并不集中,因此对8个因子的载荷都在0.2以下,于是就成为一个孤立的节点。

图2 作者共被引关系因子分析碎石图

通过因子分析,可以对高被引作者群进行分组。对由共被引关系所形成的各个研究共同体中的作者的高被引论文中所标引的关键词进行统计,可以发现相应研究团体的影响领域所在。按照共被引关系,可将近十年来国内情报学高被引作者大致分为8个主题领域,即情报学理论与应用、竞争情报与信息分析、文献计量与科学计量、数字图书馆与知识组织、信息资源配置、管理与服务、知识管理与知识产权、信息检索与信息技术以及信息产业与信息经济,但是不同主题所涉及高被引作者情况以及领域内高被引作者对于不同主题的贡献都有很大区别(表6、表7)。其中,情报学理论和文献计量两大研究主题下的高被引作者数最多(分别为29和24),其次是竞争情报和信息检索(分别为15、14);信息产业与信息经济属于交叉研究主题,主要载荷作者数最少(只有1),且载荷值相对较低,这在一定程度上说明该主题处在边缘化的范围,并非国内情报领域的研究重点所在。

3.4 结果分析

结合作者共被引关系的图表情况(图3和表6),我们可以看出,与White和Mccain在1998年在多维尺度分析与聚类分析相结合的思路下,利用作者共被引分析对国际情报学领域研究的结果类似[9],从研究主题的关联性来看,国内情报学研究总体上同样可以被分成两大阵营,即文献情报与信息检索,而前者的研究主题更为细化,涵盖了情报学理论与应用、文献计量与科学计量、竞争情报与信息分析、信息资源配置、管理与服务、数字图书馆与知识组织以及知识管理与知识产权六大主题的内容。但是这两大阵营内作者的数量规模却有明显的悬殊。White在后来2003年的研究中,采用PFNET算法对1998年的同一数据进行了作者共被引分析。结果显示,情报学领域总体上仍然可以划分为左右两大阵营,左即领域分析,右即信息检索,但在这两大阵营中间还存在一部分作者属于跨领域研究:他们对于左右两大阵营都有较大的贡献,并且通过他们的研究将这两个看似独立的研究主题联系在一起;两大阵营之间也存在研究的交叉,有些信息检索研究者也可能会介入文献情报基础理论的研究,同样也有文献分析者在情报检索与技术应用方面有一定建树;另外在两个阵营内部,情报理论、文献计量、科学交流等核心主题之间也存在各种各样的关联[10],这也是情报科学认知结构的真实体现。借鉴以上分析思路,我们也可以将国内情报学领域的作者分为上下两部分,即下层基础部分的文献情报研究者和上层外延部分的信息技术应用研究者,前者主要以严怡民、梁战平、马费成、邱均平等为代表,多集中于情报学理论、文献计量、知识管理、数字图书馆、信息资源管理等主题方向;而后者则以张琪玉、包昌火、马张华等为代表,多集中于信息检索、竞争情报、信息分析、信息经济等主题方向。同样,在两大群体之间也存在一些具有桥梁和导向作用的中间研究者,正如White所描述的那样,他们多倾向于借鉴信息检索者的研究思路利用信息技术进行信息政策和利益相关的研究,并没有因此成为情报学领域内强劲的代表力量,但是却对于文献情报研究者的研究产生了巨大的影响,尤其对于知识管理、数字图书馆、信息资源管理等后来衍生出的应用性较强的主题领域产生了非常大的促进作用,这一群体的主要代表作者有霍国庆、蒋永福、盛小平和柯平等。

图3 作者共被引关系因子分析结果图

由于图3是利用Netdraw软件作出的MDS图,所以可以在一定程度表征各个因子之间的相互关联性,同时结合因子分析得到的因子协方差矩阵(表8),可以发现在信息技术应用研究部分的3个主题都独成一支,与其他相关主题关联性相对较弱;而在基础理论部分的5个主题则紧密相连,密不可分,这也是由于研究内容的相关性以及研究主体的多面性所导致的。多数作者的研究与影响方向以情报学理论与应用研究为基础不断向其他研究主题领域延伸,从而进一步衍生出数字图书馆与知识组织、知识管理与知识产权以及信息资源配置、管理与服务这三个新生的但却快速发展的高相关性主题,尤其在知识管理与知识产权领域,载荷作者总数最多,并且与情报学理论与应用这一基础主题的载荷作者重复度最高,这也在一定程度上验证了情报学促生知识管理学发展的论断[11]。

同时,我们还可以发现,文献计量与科学计量、竞争情报与信息分析和信息检索与信息技术这三大研究主题下的单贡献作者数(表示只在单一因子中载荷值≥0.2)最多,尤其信息检索主题最为突出,这一主题下的核心作者(如张琪玉、马张华、陈树年、曹树金、侯汉清等)更多地关注与技术方面的研究,而与基础部分的理论研究相分离,但却是相辅相成的。实际上,文献计量的研究是与情报理论应用研究是并列存在的,其他很多主题领域的研究都是在这两个传统主题上衍生发展出来的,这一点可以从他们与其他因子之间的相关性上可以体现出来;当然也有很多学者始终专注与计量学这一特定主题的研究,从最初的文献计量到后来的信息计量、科学计量、网络计量,乃至现在刚刚出现的知识计量,罗式胜、庞景安和邱均平等对于这一主题的载荷值最大,对于这“五计学”的发展产生了极为深远的影响,同时丁学东和姜春林等对这一因子的单载荷体现,也充分说明了他们对这一主题领域发展的贡献情况。竞争情报作为经济学、管理学与计算机领域的交叉研究主题也在崛起后快速发展,包昌火、陈峰、彭靖里和谢新洲等几近于这一主题的单贡献作者,作为国内竞争情报的奠基人,在该推动该主题领域的发展上是功不可没的。

另外,从表7中可以看出,国内情报学领域高被引作者的研究所涉及的主题情况也是有很大不同的。通过因子载荷(载荷值≥0.2)的统计,发现涉及领域最多的是青年学者马海群和查先进,他们在前7个领域都有或多或少的影响力,可见国内情报学领域新生力量的发展还是非常迅速的。同时有23位作者只在一个领域有贡献值,他们有些是集中贡献于某一特定因子,即主要在某一特定主题进行深入研究,如集中于信息检索和信息技术主题的张琪玉、马张华、陈树年和曹树金等,集中于竞争情报与信息分析主题的陈峰、彭靖里和谢新洲,科学计量方面的丁学东、姜春林和党亚茹等;有些学者只在特定因子上有较小的载荷值,他们可能属于跨学科的研究,而在情报领域主要偏重于相关主题的泛在研究,或者刚刚进入情报学领域,还没有更为深入的建树,如储荷婷、何荣利、任胜利、李景和曾民族等。另外,介于载荷1与7之间的作者群体最大,有75位作者,其中在5/6个主题领域有贡献值的作者数最多,可见多数作者的研究和影响模式仍然属于多主题跟进、单一主题深入的形式,尤其在情报学理论与应用、信息资源配置、管理与服务、数字图书馆与知识组织、知识管理与知识产权等主题内的作者重复率最高。

通过社会网络中的核心—边缘分析,我们可以得到情报学领域的核心作者群有邱均平、包昌火、马费成、王知津、严怡民、王崇德和梁战平这7位作者,这一结果跟以上的分析是一致的。同时这7位作者同属于基础研究群体,在情报学理论应用研究以及在其基础上衍生出的主题领域内都具有非常重要的核心地位和高度影响力。

4 结论

通过对近十年来CSSCI收录的情报学领域中高被引作者的共被引关系进行分析,可以得出以下结论:

(1)通过作者共被引对的分析发现,邱均平、马费成、严怡民、王知津、梁战平和王崇德这6位作者两两之间的共被引频次最高,对于国内情报学领域的发展都产生了最大的影响。国内情报学领域高被引作者的共被引程度相对分散,并没有形成统一的研究群体影响模式,作者所产生影响的主题领域也较为分散,缺乏相对的稳定性。

(2)通过作者共被引网络结构的分析发现,该网络结构中有一小部分作者存在高强度的连通性,但仍有些作者之间没有直接连通,网络中仍然有桥连接的现象存在。在所有的共被引关系中,马费成和邱均平与其他作者的共被引频次最多,程度中心性、中介中心性和亲近中心性都是最高的,居于网络的核心位置,在网络连通以及信息流动中也同样具有极高的控制力。同时,作者被引频次与以上三种中心性指数之间都存在显著的相关关系,这也可以在一定程度上说明国内情报学领域内的高被引作者同时在共引网络中有较强的影响力,居于较核心的位置,对于该领域内信息传播与知识交流进而推动学科发展都具有非常重要的作用。

(3)通过因子分析,可将近十年来国内情报学高被引作者大致分为8个主题领域,即情报学理论与应用、竞争情报与信息分析、文献计量与科学计量、数字图书馆与知识组织、信息资源配置、管理与服务、知识管理与知识产权、信息检索与信息技术以及信息产业与信息经济,其中情报学理论和文献计量这两大研究主题下高影响力作者数最多,而信息产业与信息经济属于交叉研究主题,载荷作者最少,处在边缘化的范围,并非国内情报领域的研究重点所在。进一步可以分析出,国内情报学领域的研究可分为上下两部分,即下层基础部分的文献情报研究和上层外延部分的信息技术应用研究,前者多集中于情报学理论、文献计量、知识管理、数字图书馆、信息资源管理等主题,而后者多集中于信息检索、竞争情报、信息分析、信息经济等领域。在上下两部之间也存在一些具有桥梁和导向作用的中间研究者,他们对于文献情报研究者的研究产生了巨大的影响,尤其对于知识管理、数字图书馆、信息资源管理等后来衍生出的应用性较强的主题领域产生了非常大的促进作用。

(4)通过MDS图以及作者与主题之间的对应关系可以看出,情报学理论与信息资源管理、数字图书馆和知识管理这些衍生出的主题之间存在极为密切的相关性,同时重复作者数最多,其中知识管理与知识产权与情报学理论与应用这一基础主题的载荷作者重复度最高,这也在一定程度上验证了情报学促生知识管理学发展的论断,但该主题领域的核心作者群还未明显形成,其研究主体与客体还有待进一步明确和稳定。基础研究部分的文献计量和竞争情报两大主题的单贡献作者数最多,这在一定程度上反映了这两个主题领域作者研究的集中性与专注性。

(5)国内情报学领域高被引作者的研究所涉及的主题情况也是有很大区别的。研究范围最广的作者可涉足7个主题领域,其中青年作者的研究力和影响力都扩展迅速。有23位作者只在一个领域有贡献值,其中有的是主要在某一特定主题进行深入研究,有的则是偏重于相关主题的泛在研究或者是刚刚涉足该领域的研究。相对地,跨主题领域研究的作者数更多一些,多数作者的研究和影响模式仍然属于多主题跟进、单一主题深入的形式。情报学领域核心作者群中的7位作者在情报学理论应用研究以及在其基础上衍生出的主题领域内都具有非常重要的核心地位和高度影响力。

另外,本文基于因子分析的作者共被引分析的结果跟传统分析思路(即综合使用聚类分析和多维尺度分析的方法)所得到的结果是类似的。文中对高被引作者基于共被引关系的分类与之前对近30年来高产作者共被引分析的结果是基本一致的[12],但是通过因子分析及其可视化显示,进行了更为深入的分析,从而对学科发展及其对相关学科领域的影响做出了进一步的探索,以期对于本学科以及其他相关学科的发展提供一定的参考。

收稿日期:2010年12月23日

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于CSSCI的国内情报学领域作者共引分析_情报学论文
下载Doc文档

猜你喜欢