国内情报学作者互引与学科结构披露分析_情报学论文

国内情报学作者互引分析与学科结构揭示,本文主要内容关键词为:情报学论文,学科论文,结构论文,作者论文,国内论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      引文分析在领域学科结构揭示中的应用研究已经非常普遍,主要包括共被引分析、耦合分析、直引—互引分析三种典型形式。以作者为分析单元的作者共被引[1-3]、作者文献耦合[4-6]等引文分析方法也相应地在研究同行探寻、学术团体识别、知识结构分析、科学图谱绘制等方面产生了一定的应用,并逐步形成一套相对固定的研究模式[7]。直引—互引分析的研究也曾引起过研究人员的注意[8],但是由于数据可获得性等原因[9]而被忽视,直到最近才被大家所逐渐重视。国外多集中于利用期刊互引来进行知识交流、主题分类以及期刊评价[10-11]的相关研究;国内对应的也有一批针对于利用期刊互引网络来揭示期刊的学术影响力[12]以及期刊主题演化与领域划分[13-14]等问题的研究成果。在以作者为特定分析单元的作者互引研究中,国外研究还相对较少,国内学者所开展的作者互引研究主要体现在利用中国引文数据库(CCD)数据源构建特定主题下的核心作者互引网络,继而对这种作者互引关系下的社会网络进行网络整体特征分析、节点密度与中心性分析以及群体派系分析等[15-17]。然而上述研究对作者互引分析基础上的学者知识交流特点以及科学结构揭示等问题的研究还不够深入,鉴于此,笔者曾利用国外Web of Science数据库,分别从高产作者群、高被引作者群以及核心作者群出发,对特定领域内高活跃作者、高影响力作者和综合性核心作者之间不同的知识流动情况以及学科结构主题分类与发展演化情况等进行了一定的揭示[18-19]。为了与国外情报学研究现状进行对比,从而为国内情报学研究发展提供相应的参考,本文将利用类似的研究思路对国内情报学领域的作者互引网络、知识交流情况以及学科主题结构揭示进行深入剖析。

      2 数据来源与研究方法

      2.1 数据样本

      《中文社会科学引文索引》(CSSCI)中的来源期刊是根据期刊的影响因子、被引总次数等数量指标与各学科专家意见而确定的,选刊标准相对严格,文献质量相对较高。因此,选取CSSCI数据库在2000—2011年所收录的中图分类号为G35(情报学、情报工作)的来源文献作为数据样本,以此作为限制条件,共获取论文10 994篇,由于重点关注作者之间交叉引用的情况,所以其中具有明确作者信息的10 308篇文章便构成了本研究的数据。

      考虑到CSSCI获取的引文作者均为第一作者,所以研究对象均选择发文和引文的第一作者。对数据集中的第一发文作者进行统计,共获得5586位独立作者,其中发文≥5篇的有329人,≥10篇的有89人,我们将其定义为高产作者;对于数据集中具有参考文献的9581篇论文的引文数据进行统计分析,共获得22 265位国内个人作者,其中被引频次≥10的有857位,被引频次≥100的有34位,可称之为高被引作者。依据“二八定律”,20%的高被引作者或高产作者可以反映出80%的总体情况。因此,我们选择国内作者中总被引次数占20%,同时总发文数量也在20%以上的110位作者作为核心作者群(如表1所示),形成互引分析基础上学科结构揭示的对象。

      

      2.2 研究方法与工具

      采用文献计量、引文分析、共现分析、社会网络分析、因子分析、内容分析、可视化分析等多种方法相结合开展研究。其中高产作者、高被引作者以及核心作者等研究对象的选取主要依赖文献计量中的集中离散分布定律、普赖斯定律等相关理论规律,该过程可直接使用Excel软件以及频次统计工具Keywordcount予以实现。引文分析与共现分析结合可用于揭示作者相互之间的引用关系,即在数据集中,当文献发文作者A与参考文献作者B在同一条文献记录中共同出现,则记A引用B一次,以此类推,可构建所有作者对象之间的互引频次矩阵,该过程可以通过VBA自编程序实现。作者互引矩阵构建完毕之后,可以进行作者互引网络的分析,可涉及网络整体特征分析、节点中心性分析以及群体结构分析等,具体可通过UCINET软件实现,进一步对这种特殊的社会网络进行可视化分析,可利用Netdraw软件和VOSViewer软件共同实现。

      VOSViewer是荷兰莱顿大学开发的免费软件,作为利用VOS可视化技术专门针对文献知识单元的可视化工具,其突出特点是图形展示能力强,特别适合分析大规模样本数据。但是它不能从文献数据中抽取和构建共现矩阵,数据预处理需要外部程序执行,在本研究中将首先通过VBA处理和UCINET转化以形成该软件所需要的数据格式。VOSViewer的可视化中具体使用相似性度量从共现矩阵中创建相似矩阵,所形成的二维图,元素间的距离反映其相似性,具体是所有的单元优化后,通过最小化加权的欧几里得距离平方和来实现。它可使用VOS聚类技术(基于模块化聚类)探测学术团体,也可使用其他技术构建众多二维图谱[20]。图谱形成后有四种视图浏览:标签视图、密度视图、聚类密度视图、分散视图,每种视图展示内容各有侧重,在本文的研究中,将重点采用聚类密度视图进行结果展示。

      针对核心作者的互引分析结果,可进一步采用因子分析的方法,将所有的作者进行研究主题区分基础上的群体划分,并借助内容分析方法,即通过作者发表文献的关键词统计以及通常的专家研究领域认知情况,来获得相应分类下的主题领域识别,并进一步利用二模网络的可视化分析方法(Netdraw软件)进行作者群体与主题关联的揭示。

      3 高产与高被引作者互引分析

      3.1 高产作者互引分析

      高产作者可被视为领域内活跃研究主体的代表,对高产作者之间的互引关系进行分析研究,可用以揭示活跃作者之间研究方向的相似性以及同一作者研究的连贯性。利用VBA编程获得高产作者之间的互引矩阵(其中对角线的数据表示作者的自引频次),继而利用VOSViewer进行可视化分析,获得聚类密度图谱(如图1所示)。

      

      在该图谱中参考VOS的聚类分析结果,可大致将这些高产作者分成三大类:第一类,以邱均平、马费成、文庭孝、肖勇等人为代表,他们是国内情报学研究最庞大的一个群体,主要集中于情报学基础理论、情报分析与服务应用以及文献计量与科学计量等方面的研究;第二类是以包昌火、彭靖里、吴晓伟等人为代表的竞争情报与知识管理研究群体;第三类是以王知津、黄晓斌、苏新宁等人为代表的信息系统、信息分析与信息资源管理研究群体。但这三种分类相对比较模糊,没有国外研究的三大类别清晰,这也在一定程度上反映出当前国内情报学领域活跃学者的研究广博性,相对国外研究仍不够精专,尤其在与现实应用的对接中还尚有不足,比如医学信息处理与研究已在国外形成相对稳定且独立的研究群体,针对用户分析的特定研究也相对突出,然而这些在国内研究力量中还仍有相当的欠缺。

      3.2 高产—高被引作者互引分析

      高产作者与高被引作者两个不同群体之间的交叉引用情况分析可用以描述当前活跃作者与该领域的奠基人或高影响力作者之间的引用关联,从而可以揭示出过去高贡献力作者对当前研究的影响情况,以及相近研究方向内不同学者之间的研究继承与发展。同样,利用VBA编程获得高产—高被引作者之间的互引矩阵,并利用Netdraw软件进行可视化分析,获得聚类密度图谱(如下页图2所示),其中圆点代表施引的高产作者,方点代表被引的高被引作者,箭头的方向指的是由施引指向被引,这种引证关系的导向也可在一定程度上表征知识流动的方向,即与引证方向相反,由高被引作者流向高产作者。利用Ucinet软件对该网络进行密度测度,为0.6299,这一密度值相比国外高产—高被引作者互引的网络密度值(0.4565)稍高一点,但是考虑到国外高产作者(被引频次≥100)有490多位,比同水平国内作者数量(仅34位)高出很多,且若将国内被引频次设定为50次及以上时(共93位),仅获得高产—高被引互引网络密度0.3274,由此看来国内该层次下的网络密度相比国外还是要低一些。同样对前文中的高产作者互引网络进行密度测度,得到0.1735,这一数值也远远低于国外高产作者互引网络水平(1.0535),且比国内的高产—高被引作者互引网络密度值还要低一些。这一对比结果与国外的分析结论恰好相反:国外的高产互引网络密度远大于高产—高被引互引网络密度,表征活跃作者之间的知识交流更强于来自过往高影响力作者的知识流动;而国内的高产—高被引互引网络密度则更高一些,说明研究者更倾向于依赖高影响力作者所产生的权威文献的知识关注与采纳,而对新兴学者的科研成果关注和知识生产流动的认可程度还相对较低。

      在高产—高被引作者互引可视化图谱中,也可以大致看到研究群体的三大分类,这与高产作者的分类情况是基本保持一致的,这在一定程度上说明高被引作者与高产作者的研究方向基本趋同,领域内的研究继承性相对较好。与国外分析结果类似的,在国内的作者互引分析中,知识的单向流动相比双向流动更易形成,存在的也更为普遍,如肖勇曾引用马费成的文献52次,反之则为0,然而却鲜有作者对之间的互引频次均在5以上,这一点远不如国外的分析结果(国外作者对之间互引频次在20次以上的都比较普遍,更有Bar-ilan J和Thelwall M之间互相引用40次以上),可见国内研究的平等性、知识交流互动性还有待重视和加强。同样地,与高产作者互引网络类似,作者自引频次往往是最高的,如邱均平、马费成、吴晓伟等人均达到了40次以上,其中邱均平的自引频次达107次;具有合作关系或师生关系的作者之间互引关联强度也相对更高一些,其中后者的影响更为明显一些,如文庭孝、赵蓉英、张洋与邱均平之间的引用关联等。在除去这些现实关系的相互引用关联中则更能发现研究同行,而进一步促进科研合作。同时在强大的单向知识流动背后也可发现权威学者有助于开展专家评价与遴选。

      

      4 核心作者互引分析基础上的学科结构揭示

      对国内情报学领域中同时具有高产和高被引特征的核心作者进行互引关联分析,可在此基础上对学科结构中的学术共同体、研究主题分类等进行剖析。首先获得核心作者之间的互引关联矩阵,进一步利用VOSViewer进行可视化分析,获得聚类密度图谱(如图3所示),其中李广建和沈丽容两个作者在矩阵中的施引总频次为0,所以在后面的分析中做了排除。

      

      在该图谱中,也可大致看出三种分类的情况,但这种分类与前文的高产作者以及高产—高被引互引群体分类已有所不同,核心作者中类别间的关系更加紧密,分类也相对模糊,比如以王知津等人为代表的一类与马费成、肖勇等人为核心的群体有逐渐融合的趋势,共同集中于信息分析、信息资源配置与管理的研究,而以邱均平为代表的计量学与服务应用研究群体则相对突出,以包昌火等人为代表的竞争情报研究团队仍相对独立。对核心作者互引网络的结构特征进行分析,可得到该网络的密度值为0.2388,该值相对国外核心作者互引网络的密度值(0.1422)偏高一点,但是这与国内核心作者群体数量相对较少还是有一定关系的,不过从这一数值可以看出国内情报学领域内核心作者间的知识交流已比较频繁,然而该值远远小于最大值1,可见知识传播的深度和知识交流的效率还有很大的提升空间;同样,利用Ucinet软件可计算节点间平均距离为2.628,表明每个作者平均至少走3步才能到达其他任意一个作者,这种相对远距离的传播也容易造成信息失真和发散。进一步对核心作者互引网络的节点中心性进行测度(如表2所示),可以发现肖勇、文庭孝、邱均平等人的外中心度最高,处于施引网络的核心;邱均平、马费成、包昌火、王知津等人的内中心度最高,居于被引网络的核心,也是三大研究群体的主要代表;邱均平、马费成、王知津、张玉峰等人的中间中心度最高,多位于整个引用/被引——互引网络的间距中心,是知识传播的中间掌控力量;周晓英、陈传夫、华薇娜等人的内接近中心度最高,赵星、邱均平、王知津等人的外接近中心度最高,表明前者在施引网络中的自主性最强,而后者则在被引网络中的自主性最强。

      

      利用SPSS软件对核心作者互引矩阵进行因子分析,采用主成分(Principal Components)萃取因素,以直接斜交(Direct Oblimin)进行转轴,共提取12个因子(累计贡献率为83.42%),进而选择分析结果中的结构矩阵,利用Netdraw软件对其进行可视化展示,如图4所示,其中圆形节点表示因子,方形节点表示作者,因子节点的大小表示所有作者对该因子的载荷总值,作者节点的颜色表征涉及因子数目的不同,作者与因子节点之间的连线粗细可以表征作者对该因子的载荷大小。在该图谱中,我们也可以大概看出整个学科领域的三个子集分类,其中第一大子集是归属因子1、2、3、4、5、6、7、12的情报学基础理论方法研究类,第二大子集是归属因子8、9、10、11的信息系统与信息组织研究类,第三子集便是两类之间的交叉领域——情报工作与服务应用研究类。

      通过对每个因子内作者发表文章的标题和关键词进行统计,可对每个因子所对应的研究主题进行识别。虽然图中有12个因子,但是由于互引的相对不确定性决定了作者的分类没有传统的共被引分析那么明显,有些因子之间存在较大的相关性,不能将其割裂,比如因子8、9、10、11都是细小的分支,彼此之间又密切联系,因此可将它们归结为一个主题分类。同时对每个类别中的关键载荷作者进行识别,可得到下页表3。在分析结果中,可将国内情报学研究大致分为九大主题领域,即:文献计量与网络计量、竞争情报与知识管理、信息规划构建与信息资源管理、技术竞争情报与产业竞争情报、情报分析与网络计算、知识组织与知识经济、知识网络与知识图谱、信息系统/技术与信息服务、信息组织与信息检索。其中,从因子载荷情况来看,因子1、3、7、12的作者代表性更强,主题特色也比较突出;因子5则只有齐艳红是首要载荷作者(即在该因子上的载荷值最大),虽拥有最多的载荷作者数,但却不是他们的主要研究方向所在。基于因子分析的主题划分也并非是绝对的,因子2和4在竞争情报领域有一定的研究交叉,因子7所涉及的知识计量与评价与因子1的计量学研究也有一定的共通之处。因子8、9、10、11共同组成的研究主题载荷值最低,代表作者之间真实的研究共性也并不是很高,但是从关键词统计来看,其中的国家创新体系、社会信息能力、科技期刊等作为该群体中的高频词汇,也在一定程度上表征了情报学服务应用的热点取向。

      

      将上述主题领域划分与国外情况[19]进行比较(如下页图5所示),可以发现国外在计量学的研究方向分支相对较多,文献计量、信息计量、网络计量、科学计量、专利计量以及引文分析各成一支,而国内学者虽多数都涉及了计量学的研究,然而主要集中的分支只有一个,即文献计量与网络计量,其他则对应到了科技管理与科技情报的研究中,这也可以在一定程度上解释:虽然国外没有竞争情报这一研究方向,但是其中的专利计量、市场分析等都可列属于该研究范畴之内。同时国内在知识网络和知识图谱研究中也有知识计量的涉及,而国外对该主题的研究还较为鲜见。国外对于信息安全、市场与用户分析的研究主题较为突出,虽与国内的知识产权、知识经济与信息服务研究可产生对应,但具体、深入的研究方向与内容还相对缺乏。国外对于信息系统与信息检索的研究相对集中,而国内则较为分散,且更多的与信息组织和信息服务交叉在一起,更偏向于服务应用的研究。

      

      作者互引分析是建立在知识相互流动基础上的学科结构剖析方法,这是一种相对较新的研究视角,鉴于此,我们将其分析结果与传统经典的共被引分析模式下的学科结构分析结果[21]进行比较(如图5所示),可以发现共被引分析所揭示的学科主题分类更为集中,其中的大类情报学理论与应用在互引分析的多个研究主题中都有显现,其他类别也往往可以与互引分析中的多个类别对应。这种分类的不同与作者共被引分析和作者互引分析的原理是有很大关系的,前者是基于不同学者被相同文献共同引用这种学术关联而实现科学结构发现,更注重过往高贡献学者的影响性;后者则是综合作者的施引和被引以揭示交互引用全景下的科学知识结构情况,更侧重当前活跃学者的互动性。因此,所揭示的主题领域也就有了一定的区别,前者类似提炼与总结,更集中;而后者更能展现当前研究热点所在。

      5 结语

      综合运用引文网络分析、因子分析、可视化分析等方法,对国内情报领域内89位高产作者、34位高被引作者以及综合考虑发文和被引的110位核心作者三个作者群分别进行了彼此间互引关系的分析,并绘制了由这三个群体分别组成的网络关系图谱,进而对这三个交叉群体内的关系网络结构及其背后的学科主题结构进行深入探究,并与国外相同领域内的作者互引分析情况进行了比较,得出以下结论:

      (1)与国外研究结果类似,无论从高产作者群体还是高产—高被引作者互引群体,甚至是核心作者群体,都能发现国内情报学领域的研究也大致可分为三大类,即以计量学为代表的情报学基础理论、分析与服务应用研究,竞争情报与知识管理研究,信息系统、信息分析与信息资源管理研究。它们的代表性活跃作者分别有邱均平、马费成、文庭孝;包昌火、彭靖里、吴晓伟;王知津、黄晓斌、苏新宁等。然而这三种分类却比较模糊,相互之间的交叉研究更多一些,这在一定程度上反映出当前国内情报学领域活跃学者的研究广博性,相对国外研究仍不够精深专。

      

      (2)通过对高产作者互引以及高产—高被引互引网络的密度分析,可以发现国外领域内活跃作者之间的知识交流更强于来自过往高影响力作者的知识流动;而国内的研究者更倾向于依赖高影响力作者所产生的权威文献的知识关注与采纳,而对新兴学者的科研成果关注和知识生产流动的认可程度还相对较低。实际上,这与国内研究的现实情况是吻合的,国内作者之间的相互认同是达不到国外的普遍认可程度的,因此也造成了国内作者总体互引频次都相对较低,其中多数还集中在具有地域相近关系、合作关系或师生关系的作者之间,只有刨除这些现实的关联,纯粹基于知识互动获取的动机而开展的作者互引行为才更有利于形成知识交流和科研合作与创新;国内研究中作者单向引用的情况居多,单向的知识流动也更加频繁,这种权威知识源的分析可以有助于开展专家评价与遴选。

      (3)通过核心作者互引网络分析以及学科结构揭示,可以发现肖勇、文庭孝、邱均平等人位于施引网络的核心,邱均平、马费成、包昌火等人居于被引网络的核心;邱均平、马费成、王知津多处于整个引用/被引——互引网络的间距中心,是知识传播的中间掌控力量;周晓英、陈传夫、华薇娜等人在施引网络中的自主性最强,而赵星、邱均平、王知津等人在被引网络中的自主性最强。整个领域研究可在互引分析基础上划分为九大类,其中计量学、竞争情报、信息资源管理以及信息检索等方面的研究更为突出。这一主题分类可分别与国外情报学互引分析结果和国内情报学共被引分析结果进行大致对应,但比较发现国外对于信息安全、市场与用户分析的研究更为集中,而国内则相对有所欠缺;同时传统的作者共被引分析更注重过往高贡献学者的影响性,揭示主题结构相对集中,而作者互引分析则更侧重当前活跃学者的互动性,主要展现当前研究热点所在,二者可互补应用,共同揭示整个领域的学科结构特征。

      通过国内外对于作者互引分析的研究可以发现,该研究方法在领域内知识交流情况以及学科结构揭示方面已经产生了一定的应用,但是其研究模式、方法流程还有待进一步优化和总结。同时由于国内期刊论文相对国外文献的引文数量更少一些,从而可能造成作者互引联系的减少,这在一定程度上也会妨碍作者互引分析的结果与比较应用。因此在未来的相关研究中,还应进一步引入参考文献数量以及作者施引总人次等指标的考量,以使作者互引分析的结果更加科学合理,而且更具认可度和推广性。

标签:;  ;  ;  ;  ;  

国内情报学作者互引与学科结构披露分析_情报学论文
下载Doc文档

猜你喜欢