高等教育研究中高引文作者的引文网络分析_显著性论文

高等教育研究高被引论文作者互引网络分析,本文主要内容关键词为:引论论文,高等教育论文,作者论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

高等教育学创立于1979年前后,经过30多年建设,无论从研究成果的数量和影响力看,还是以研究队伍的人数衡量,它已成长为教育学学科体系中最重要的二级学科之一。高等教育学作为一个学科研究领域,研究者的研究工作是相互影响和联系的。从量化研究的要求看,研究者相互引用是观测这种影响和联系的指标之一。“引文可视为科学家非正式交流的社会结构,也可显示科学家之间的合作组织结构。”[1]由相互引用所构成的社会网络,反映了研究者之间信息与知识传递的结构特征。分析这一网络,可以揭示学科发展中研究人员之间知识流动的状况,推断学科发展的成熟度,了解学者的影响力等,为我们把握学科发展态势和考察研究者群体互动提供实证指标。社会网络分析作为一种社会结构分析策略,“在近一二十年迅速发展成为了学术界的一个热点领域,并得到了广泛的应用”[2]。有学者认为,社会网络分析也是研究引证关系和引文网络的有力工具。[3]近年来,一些研究者尝试将社会网络分析应用于某一学科领域的期刊或研究者之间互引关系分析。例如,有学者运用社会网络分析方法分析了34种管理学期刊之间的互引关系;[4]有学者以CSSCI 2006-2007年图书情报学来源期刊为数据源,采用社会网络分析,对该学科期刊形成的引用网络结构进行解析,为期刊布局与评价提供了定量支持;[5]有学者考察了参考咨询领域内的32位高被引作者的互引关系,发现了该学科领域具有突出贡献的作者和研究热点。[6]“有证据表明,绝大部分对科学进展起作用的研究工作都是由少数科学家做的。”[7]本研究仅以1979-2008年中国高等教育研究领域所发表的高被引论文数排前50位作者组成的群体为研究对象,运用网络分析技术,探讨这一群体由高被引论文互引关系所构成的社会网络,分析他们之间的信息与知识流动关系特征,从而为我国高等教育学学科发展现状提供新的描述视角和解释证据。

二、研究方法

(一)研究取样

本研究样本取自CNKI中国引文数据库(新)“高等教育专题”中1979年以来的论文,截止日期为2008年12月31日。我们将高被引论文的入选标准设定为被引次数13次及以上的论文,筛选出符合此标准的论文4253篇。从中选择发表高被引论文数排前50位作者的505篇高被引论文为统计对象,分析这505篇高被引论文作者的互引关系。这50位作者(即顶点),发表高被引论文最多者28篇,最少者7篇。按发表高被引论文数从多到少排列对作者进行编号,论文数相同则按作者姓名的拼音首字母顺序排列,具体编号和姓名的对应见表1。

(二)分析框架

本研究主要运用社会网络分析软件Ucinet5.0,分析50位作者505篇高被引论文的互引网络结构特征。研究的思路是:先分析互引网络整体特征,再分析子群特征,最后讨论顶点与边的显著性。

整体特征主要涉及网络的度分布、紧凑性和连通性。度分布,包括出度分布和入度分布,指某一度数的顶点在网络所有顶点中所占的比例;[8]紧凑性,可用网络密度和网络中心势来描述,网络密度指顶点间联系的多少,网络中心是指网络能够在多大程度上围绕某些特定点组织起来;[9]连通性是指有多少顶点能相互可达及可到达需要的最少步数(距离)[10]。

子群特征分析,包括观察互引网络核心区域的存在状况,即拥有至少k个邻居的顶点组成的子网络及其核塌缩序列;[11]有无明显的社群结构即内部密度高,外部密度低的区域;[12]强互惠子图即由相互往来的顶点所构成的子网络[13]。

顶点和边的显著性,指顶点或边在网络中的地位或作用。[14]顶点的显著性可通过以下三个方面来揭示。接近性,即某个顶点与其他顶点的距离。[15]PageRank即Google采用的网页排序指标,用来衡量顶点的影响力。[16]中间度,即一个顶点能在多大程度上成为他人联系的中间人,控制他人之间的联系。[17]边的显著性,主要使用边中间度,即一条边能在多大程度上成为其他顶点联系的中介并控制顶点间的联系。[18]

(三)数据搜集与处理

从CNKI数据库中提取表1中作者发表的505篇高被引论文的被引记录,排除不在表1中出现的作者的引用和作者自引,统计50位作者之间的互引数据,在EXCEL中建立50×50的矩阵,初始值设为0。如果顶点1的论文被顶点2引用了一次,表格中顶点1和2对应单元格增加1,使得顶点1的出度增加1,顶点2的入度增加1。有共同署名论文,系50位中的作者,每位作者同等对待,分别记数,构造出加权网络。加权网络中边权表示有多少次引用,可参见图1a。把加权网络中不为0的位置记为1,就生成无权网络。无权网络中,边表示有无引用,1表示有,0表示没有,参见图1b。

网络中不是所有顶点对间都存在信息与知识流动,由相互可达的顶点构成的网络被称为强连通子图。[19]50位高被引论文作者互引网络的强连通子图有40个顶点。(见图1c)

图1a中,顶点大小表明出度(被引)的多少,边的粗细表示边权的大小。可直观看出顶点1最大,出度最高(29),边12→22最粗,顶点22引用顶点12次数最多(9次)。从图1a和图1b都可以看出顶点36为孤立点,与其他49个顶点没有联系。图1c中的40个顶点相互可达,与另外10个顶点相比,联系更为紧密。

在图1的基础上,使用社会网络分析软件Ucinet5.0计算各种网络指标,并用数学软件Matlab7.0绘制度分布图和计算PageRank值。[20]

三、网络分析结果

(一)网络整体特征

Seglen发现,论文的引用与被引都服从幂律分布(power-law);[21]Redner对ISI与PRD论文引文研究表明,幂律分布现象普遍存在。[22]图2描述了50位高被引论文作者互引网络的出度分布和入度分布。

图2a和图2b显示,50位高被引作者互引网络的出度与入度分布都出现了类似幂律分布现象。顶点出度和入度的描述性统计见表2

从表2可见,50位高等教育高被引作者互引网络顶点的出入度相关系数不大,这说明引用多的学者并不一定被引多。网络存在最小出度或最小入度为0的顶点,说明存在只有被引或引用行为的学者。这些学者要么只把50名以外学者的信息与知识传入网络,要么只是把网络中的知识传到网络之外。无权网络的总度数为161,可计算出:网络密度为0.066,网络中心势为24.5%。前者说明网络凝聚力的总体水平不高,后者说明网络内聚性不太大。根据这两个特征,可认为整个网络紧凑性不高,顶点间联系不太多,还不能把这个网络看成围绕某些特定顶点组织起来的结构。

由表3所示的顶点间距离比较可知,强连通子图的直径比整个网络的最大距离[23]缩小了1,调和平均距离[24]缩小了0.078,紧密度增加了0.09,差异不太明显。平均距离均在3左右,表明任意两个顶点间平均大约通过两个其他顶点产生联系。距离为2、3、4的顶点对出现的比例最大,这说明两个顶点间大多是通过其他一到三个顶点而产生相互联系,信息与知识在网络中的直接流动不多。不在强连通子图中的10个顶点只影响到网络局部或者只受到网络局部的影响,但不排除因50名之外的作者的引用关系使连通性发生变化。

(二)子群特征

Seidman提出,使用k-核分析可以发现网络的高凝聚力区域。[25]以图1b的出度为基础进行k-核分析,生成了有向3k-核心网络。(见图3)

图3可见,在3的k-核心网络中,只存在14个顶点。可以认为,这14个顶点学术联系比较紧密和活跃,是整个网络主要的知识来源。

核塌缩序列指当k值增加1时损失的顶点数与比例。[26]表4可见,50位高被引论文作者互引网络的核塌缩序列为(0.06、0.30、0.36和0.28),除0.06之外,其他三个比例差异不大,可认为核的塌缩是逐渐的,[27]说明去掉3个出度为0的顶点(顶点36、42和23)后,网络结构在总体上具有一定的一致性。较低的k值(0.06)后没有出现0值,[28]表明50位高被引论文作者互引网络不存在密度特别高的区域。

图3 50位高被引论文作者互引网络有向3k-核心网络

采用Girvan-Newman快速分群算法对网络进行分群,[29]Q值最大不超过0.3,无法说明网络存在明显的社群结构。[30]任意两个有相互引用关系的顶点所构成的子网络,被称为强互惠子图。50位高被引论文作者互引无权网络的强互惠子图见图4。

图4 50位高被引论文作者互引网络强互惠子图

图4显示,强互惠子图由30个顶点和30条双向边组成,分离成三个区域,包括:一个有22个顶点和24条边的规模较大的子图、一个由3个顶点以及另一个由5个顶点构成的链。强互惠子图说明,30位高被引作者形成了一个较大的学术共同体和两个较小的学术伙伴群。与顶点1有引用关系的21个顶点,9个邻居与之有强互惠关系,表明这9个顶点与顶点1的联系更为紧密。顶点1、29、32、13和3处于相对核心和关键位置,对所在子图连通性有影响。这5个顶点的邻居之间只有顶点3和13有强互惠关系,说明处于关键和核心位置的顶点之间缺乏直接联系。

(三)顶点与边的显著性

顶点的显著性表征学者在本领域内的威望、影响或受关注程度。边的显著性指引用的重要性和关键性,可以衡量某引用关系对于网络整体性的影响。表5反映顶点和边的显著性。

表5可见,顶点1、13和29都排在前10位。顶点1的显著性尤其明显,所有指标都排在第一位。这说明顶点1在高等教育研究领域威望很高,具有非常大的影响。同时,顶点13和29的作用也不可忽视。顶点32、20、6和10有三个指标排在前10位,在本领域中也有相当大的影响。虽然顶点50的高被引论文不多,但内接近性与PageRank都排在前10位。这说明顶点50经常受到他学者关注,具有较大的发展潜力。这与顶点50引用过顶点1和17,而且被顶点1引用过有关。与顶点1联系的21个顶点中,有13个出现在前10位中,这说明与某些显著性高的顶点发生学术联系会提高自己在特定学术网络中的显著性。

表5显示,边中间度上,与顶点1有联系的边有6条,其中边1→3具有最大的边中间度。这说明与顶点1发生的联系,在很大程度上控制了其他顶点之间的联系。

四、总结

本研究讨论的50位高被引论文作者互引网络,是在作为信息网络的引文网络基础上衍生出来的社会网络。这一网络反映了高等教育学高水平研究人员之间信息与知识传递的结构特征和知识流动状态。综合上述分析,我们可以得出以下初步结论与观点。

第一,互引网络的出度分布与入度分布呈现了类似幂律分布现象,高等教育研究领域同样具有“少数作者被大量引用”和“大量引用来自于少数作者”的特征。

第二,虽然互引网络出现了学术联系比较紧密和活跃的较大群体,但网络结构总体呈现一定的一致性,不存在密度特别高的区域和明显的社群结构。这可理解为,高等教育学学术流派尚未形成,研究群体分工不明确,研究领域较为宽泛。

第三,虽然有以顶点1为代表的威望高、影响大的多位核心人物,整个网络的知识主要来源已现雏形,但网络紧凑性不高。整体上看,高等教育学还不是一个围绕共同规范建构而成的学术共同体,学科发展尚处于前科学阶段。[31]这也许与高等教育学研究领域特点、学科性质和发展方式有关。[32]

第四,强连通子图分析可见,顶点平均距离在3左右,任意两个顶点间平均大约通过两个其他顶点产生联系。距离为2、3和4的顶点对出现的比例最大,两个顶点间大多是通过其他一到三个顶点而产生相互联系。强互惠子图分析发现,只有5个顶点处于相对核心和关键位置,对所在子图连通性有影响,而这5个顶点的邻居之间只有2个顶点有强互惠关系。这说明,高等教育学领域高水平学者信息与知识的相互流动以间接为主,无法观测到他们的研究之间存在明显的继承和发展。这可能是以思辨研究为主的高等教育研究方法论导致的。[33]

由于取样的特殊性,本研究结果只能说明高等教育领域高水平研究人员由互引产生的信息与知识流动关系,解释整个学科领域还需要更多证据。此外,论文引用模式存在社会因素,[34]引用一定程度上也反映了作者之间特定的人际关系,所以,作者的学术联系与其他联系的耦合研究也可以作为下一步的研究任务。

标签:;  ;  ;  

高等教育研究中高引文作者的引文网络分析_显著性论文
下载Doc文档

猜你喜欢