组织内科研合作网络的实证分析研究论文

组织内
科研合作网络的实证分析研究

文/陈丽伟 郭强 刘建国

摘要: 分析组织内的科研合作网络对于了解学科现状,优化学科发展等学科管理具有重要意义。本文收集了某科研单位的论文发表信息,以三千余位科研工作者为节点,合作关系为边,构建科研合作网络。结合作者的年龄、职称等信息,使用社会网络分析等方法对该单位内的合作情况进行了分析。实证数据发现科研合作网络中高科研产出者一定有多个合作者;不同年龄段科研人员的度和集聚系数表现出不同的合作形式;职称越高,科研合作形式越单一。

关键词: 科研合作网;社会网络分析;时间演化

引言

随着知识经济时代的到来及科学技术的全球化发展,科研合作(Scientific Research Collaboration)已成为当今科学发展的重要动力[1]。按照合作的一般定义,科研合作就是科学工作者为达到生产新的科学知识这一共同目的或实现各自的科研目标而进行的协同创新的科学活动。

3)IMERG与CGDPA日降水强度在中国大陆大部分地区的相关系数介于0.2~0.5,只有少数地区超过0.6,昆仑山、天山和祁连山等地甚至出现负相关,相关系数介于-0.3~-0.5。IMERG日降水估计量在中国大陆东部绝大部分区域比CGDPA偏低10%~30%,甚至偏低35%。西部IMERG日降水估计精度具有较大的不确定性:在塔里木盆地、准噶尔尔盆地及青藏高原大部分地区,IMERG比CGDPA偏高50%以上,但在青藏高原东南部和昆仑山、祁连山地区,则偏低50%以上,甚至偏低65%。

科研人员间的论文合作关系是一种社会关系,所构成的合作网络则是一种具有代表性的复杂社会关系网络。关于科研合作网络,国外已经有很多研究,其中较为全面的是Newman。他收集了物理学、生物医学、计算机科学三个学科的科研论文并建立科研合作网络,分析了合作网络的统计特性,包括作者发表论文量、平均每篇论文的作者数、作者的合作人数、派系的存在及大小、聚集性。在此基础上,Newman发现科研合作网络既有小世界网络的特性,又有无标度网络的特性。2004年Newman又从论文数量分布规律、合作人数分布规律、网络节点的平均距离等方面来研究合作网络。在国内,也有很多学者进行科研合作网络的研究。刘云等对一个权威的国际科技检索系统统计发现,至上个世纪90年代,该检索系统收录的科研论文中,各国不同机构间的合著文章数增长了46%,跨国合作的文章数增加了115%。通过对科研合作网络结构特性的研究与统计,对科研合作整体状态的明确、科研人员角色与位置的识别和人员之间关系的刻画有着积极作用。刘杰等通过对一个小型科研合作网络的分析,发现其也具有类似许多大型合作关系网络所具有的网络特性。李进[10]等以一个专业期刊为样本利用社会网络分析方法对作者科研合作影响进行分析。结果显示,具有较大影响力的科学家作为合作网络的中心节点,可以带动科研机构间的学术交流,促进科研工作的发展。郭崇慧等收集重点大学的合著论文,运用复杂网络与社会网络分析方法,从整体、个体和社区三个方面分别对国内和国际期刊校际科研合作网络进行分析,分别得到国内期刊和国外期刊是以某几所高校为核心的社区。庞秀丽等基于社会网络的分析方法,从教师合著网络的个性属性及整体属性两方面分析研究了某大学一个学院教师论文合著特点,给出优化科研团队建设的建议。张心悦等采用社会网络分析方法,对中国科研机构国际合作网络的时间演化问题进行了分析,揭示了中国科研机构在创新管理领域的国际合作的发展规律及运行状态。周建林等通过构建有向科研合作网络,将社会网络分析方法和节点重要性度量方法相结合来识别复杂系统领域内有科研潜力的年轻学者和广受欢迎的权威学者等重要节点。

本文沿用社会网络分析方法,从科研论文中作者合著这一角度来研究科研合作关系,运用Pajek软件构建作者科研合作网络。不仅分析了网络的结构特性,还从网络结构的时间演化探索该科研单位的合作情况。利用集聚系数指标本身的特征优势,本文考察了教师年龄与度和集聚系数的关系,以及职称与集聚系数的关系。从集聚系数的角度出发,为科研合作网络分析提供了新的思路,给组织内科研人员的合作提供建议。

通过对北京体育大学、北京语言大学和外交学院3所院校来自不同国家的40名武术留学生的访谈得知,武术对外教材的传播现状并不理想,出现了语种单一、质量低下等现象,使得武术对外教材在“走出去”的过程中遇到了困境。

1、网络构建及其结构特性

1.1 数据获取与网络构建

图1 科研合作网络图

本文以社会网络分析方法为基础,不仅分析了网络的结构特性,还从网络结构的时间演化和部分节点的个体分析以及教师年龄与度和集聚系数的关系等多个角度出发,对一个具有培养研究生资质的科研单位科研合作状况做了考察得出以下结论:在科研合作中,科研产量高的作者必有多个合作者。由度、集聚系数与教师年龄分布图可知,年龄处于30岁至55岁的教师合作人数大多小于20,且集聚系数均对应不同的值,表明他们在网络中的合作结构较为多样;而年龄大于55岁的教师合作人数较为分散,大多分布于0到40之间,有趣的是他们的集聚系数均趋近于0,表明该年龄段的教师更倾向于和自己的学生分别合作发表文章。集聚系数与教师职称分布图可知,职称越高,科研合作形式越单一,猜测是因为更加享受科研过程而不是结果。

1.2 度和文章数的分布特性

另外,我们又考察了职称与集聚系数的关系。如图4所示,职称为讲师、副教授和教授分别对应不同的集聚系数范围。讲师的集聚系数较为均匀地分布在0至0.4之间,副教授的集聚系数则集中在0至0.2之间,教授的集聚系数会更加集中在0至0.1之间。职称越高,集聚系数分布越集中,且数值越小。显然,教授更愿意和不同的人分别合作从事科研活动,也可以这么说,大多数人更愿意和拥有教授职称的人一起实践科研过程。职称越高,科研合作形式越单一,猜测是因为更加享受科研过程而不是结果。

图2 作者度分布和发文数分布图

2、网络结构的时间演化分析

那么,如何把理念转化为实践落地?韩光曙认为,无论优质、研究型,还是人文医院,最终的落脚点是人,应把人放在核心的位置上。

网络中节点的集聚系数可以反映节点邻居间的紧密程度,科研合作网络中节点的集聚系数能够解释科研人员相互之间的合作形式。基于集聚系数的特征,我们考察了教师的年龄与度及集聚系数的关系。其中教师的年龄与度的分布图如图3(a)所示,明显看出年龄处于30岁至55岁之间的教师,他们的度即合作人数大多数小于20,但度最大的教师处于该年龄阶段;而年龄处于55岁以上的教师人数较少,他们的度多分布在0到40之间,分布较为分散。教师年龄与集聚系数的分布图如图3(b)所示,明显地,年龄在30岁到50岁之间的教师均可对应不同的集聚系数,系数值的变化范围从0到1逐渐向下收紧,表明他们在网络中的合作结构多样,既有典型的师生两两合作,也有师生多人合作情况。而且集聚系数为1的教师均处于该年龄阶段。有趣的是作者年龄在55岁以上的集聚系数均趋近于0,这从另一方面反映该年龄段的教师更加倾向于和自己的学生分别合作发表文章。

表1 科研合作网络特征指标的演化

3、年龄职称与集聚系数

表1中<k>,<c>,<l>,r,N分别代表各年子网络的平均度,平均集聚系数,平均路径长度,度相关系数以及子网络数目。由表1可知,各年平均度、集聚系数及子网络数目相对稳定。平均路径长度[6]为网络中任意两个节点之间距离的平均值,其实质是网络传递所需要经过中间节点的平均个数,反映了网络的全局性质。平均路径长度小,说明网络的易达性好,网络运行效率高。在科研合作网络中,平均路径长度是连接网络内两个作者之间最短关系链中作者的平均人数。从表中可以看出,2013年至2015年任意两个作者建立关系平均需要3.5步,2016、2017年则平均需要5.5步。这表明2013年至2015年网络联系较2016年和2017年更紧密。度相关性也即同配性,是为了度量网络中不同的度的节点间的合作状况。从一般的角度看,同配就是指属性相近的节点倾向于互相连接。科研合作网络中的属性指的是节点的度。一个网络中的同配系数r∈[-1,1]。如果r >0,则网络是同配的;如果网络r <0,则网络是异配的。|r|的大小反应了网络同配或异配的强弱程度。从这些数值我们看出,网络整体是异配的,但是异配的强度较弱。观察网络图可知,因为大量的子网络节点数不多,图形简单且往往呈现星形结构,加之网络中存在为数不少的“两点一线”结构。前面一种呈现出异配性,后面一种则呈中性,同配系数为0,大量此类结构使得网络呈现出弱异配性。

图3 度及集聚系数与作者年龄分布图

在科研合作中,一个作者可能与多个科研工作者合作,但没有高产出(本文仅以论文数认定科研产出),有高产出的作者未必有多个合作者。其中任何一种情况都不能凸显作者在科研合作的地位。度,指的是一个节点在网络中与其他节点联系的数目,是刻画单个节点属性最简单又最重要的概念之一。科研合作关系网络中一个节点的度可以定义为与某一科研人员对应的节点相连的节点数目,节点度越大意味着与该节点相对应的科研主体合作所发表的研究成果数量越多,该科研主体在关系网络中的地位越重要。本文将节点度数和全部节点个人所发文章数分别放入双对数坐标中得到如图2所示。从图中可以看到,图2(a)节点度数与作者数(即节点数)在双对数坐标图中呈幂率递减,说明整个合作网的度分布呈现无标度网络特征,且发文数和度数的分布局部可以取得较好的拟合效果,拟合斜率分别为-1.86和-1.65,拟合误差分别为0.091和0.078。这表明在科研合作中,与作者合作发文的人数和其发文章数目成正比,即高产出作者必有多个合作者。

科研合作网络是高度动态的,网络中的节点和边随着研究人员的加入以及合作关系的建立不断增长和变化。网络结构的时间演化分析能够帮助我们深入理解网络的特性,进而构建演化模型,捕捉其形成机制,并模仿真实网络行为。

图4 集聚系数与职称分布图

4、总结与展望

本文收集某科研单位在期刊及会议上发表文章的作者、作者单位等信息,以中国期刊全文数据库(CNKI)作为数据检索平台,对该单位2013-2017年共计5年的论文分别进行检索收集。整个数据集包含2013年至2017年五年间3099位研究人员,4002篇科研论文,将数据导入Gephi软件,绘制五年科研合作网络图(如图1所示)。将每个科研人员用网络中的一个节点表示,合作过文章的两人之间存在一条连边,连边权重取决于两人合作文章的数量,以连边粗细表示。作者度的大小用表示该作者节点的颜色和大小表示。作者度越大,则节点颜色越深,尺寸越大。本文在构建科研合作网络时,并不考虑时间范围内没有发表论文的科研人员,以防止产生孤立节点。另外,为保护科研人员隐私,本文在数据预处理过程中将所有科研人员进行匿名化处理并统一编号。

本文对网络结构的时间演化只是做了趋势分析,没有建立演化模型来模拟合作的产生以及预测未来的合作关系,接下来的工作将会围绕这两方面展开。由于署名和单位表达多元的原因,并未对SCI的文章进行统计,虽不影响整体结论,但一定程度上影响了结论的精确度,在后续的文章中将逐步完善。

参考文献:

[1] Price D J, Solla D. Little Science, Big Science [M].New York: Columbia University Press, 1963.

[2] Newman M E J. Newman, M. E. J. Scientific collaboration networks. I. Network construction and fundamental results. Phys. Rev. E 64, 016131[J].Physical Review E, 2001, 64(1 Pt 2):016131.

[3] Newman M E. Scientific collaboration networks. II.Shortest paths, weighted networks, and centrality[J].Physical Review E Statistical Nonlinear & Soft Matter Physics, 2001, 64(2):016132. Newman M E. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality[J].Physical Review E Statistical Nonlinear & Soft Matter Physics, 2001, 64(2):016132.

[4] Newman M E J. Who is the best connected scientist?A study of scientific coauthorship networks.Complex Networks: Lecture Notes in Physics,2004,650 ( 1) :337-370.

[5] 刘云,常青.中国基础研究国际合作的科学计量测度与评价[J].管理科学学报,2001(1):37-47.

[6] 汪小帆,李翔,陈关荣.《网络科学导论》[ M ].北京:高等教育出版社,2012.4.

[7] Wasserman S. Social network analysis: Methods and applications [M].Cambridge University press, 1994.

[8] 岳天强, 岳增慧.高校科研合作网络结构研究[J].农业图书情报学刊,2013, 25(11):5-10.

[9] 刘杰,陆君安.一个小型科研合作复杂网络及其分析[J].复杂系统与复杂性科学, 2004,1(3):56-61.

[10] 李进,刘瑞璟,于伟,等.作者科研合作网络构建及影响分析——以《复杂系统与复杂性科学》期刊为例[J].复杂系统与复杂性科学,2014,11(3):86-93.

[11] 郭崇慧,王佳嘉.“985工程”高校校际科研合作网络研究[J].科研管理,2013, 34(S1):211-220.

[12] 庞秀丽,姜维,李媛,等.某大学经管学院合著网络构建与分析[J].黑龙江大学自然科学学报,2013(5):582-588.

[13] 张心悦,宋伟,宋晓燕.我国科研机构国际合作网络的演化分析——以SCI 中创新管理领域的科技论文为例[J].中国高校科技,2015(7):12-17.

[14] Zhou J, Zeng A, Fan Y, et al. Identifying important scholars via directed scientific collaboration networks[J]. Scientometrics, 2018, 114(3): 1327-1343.

★基金项目: 本文系国家自然科学基金资助项目(项目编号:61773248,71771152);上海市东方学者特聘教授和上海市“曙光学者”项目(项目编号:14SG42)。

作者简介:

陈丽伟,上海理工大学硕士生,研究方向为社会网络分析;

郭强,博士,教授,现就职于上海理工大学管理学院,主要研究方向为网络科学、科学知识图谱分析;

另外,含水层的破坏对当地供水产生一定不利影响,可造成供水量不足的现象,如影响矿体周边人类工程活动和工农业供水需水量。水质和水位的变化对地表植被生态系统也会产生不良影响,因此前5年开采矿体V-04、V-38、VI-09、VI-11、VI-16对地下含水层影响较大。

刘建国,博士,教授,现就职于上海财经大学金融科技研究院,主要研究方向为商务智能、在线用户行为分析。

标签:;  ;  ;  ;  ;  ;  

组织内科研合作网络的实证分析研究论文
下载Doc文档

猜你喜欢