学术机构引证中的中介关系,本文主要内容关键词为:中介论文,学术论文,关系论文,机构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2015-11-28 分类号G250 学术机构是科学创新的主体,其学术产出对推动科学发展起到重要作用。优秀的学术机构不仅掌握先进的研究方法和学术成果,还应在与其他学术机构组成的科学共同体之间发挥桥梁作用,承担促进信息沟通和知识交流的中介角色。学术领域的知识交流通常以引证网络作为表征,节点表示知识单元,引证关系表示有向的知识流动[1]。目前,已有大量的以文献作为引证网络节点的知识交流研究,学术机构则较少被作为引证网络中的知识单元进行分析,机构在知识交流过程中发挥了怎样的中介作用则更不明确。对于网络节点中介属性的研究,最初来源于社会学中从“关系”角度对权力的定量分析[2]。针对个体网而言,结构洞(Structural Holes)和中间人(Brokerage Roles)是比较重要的两种中介属性,两者描述的均是三方关系结构内部的非冗余联系[3]。中间人处于结构洞的中心位置,往往掌控着多个群体之间的知识流向,因其区分了节点在网络中相对于子群体的从属范围,从而体现了节点在网络中的代理特性。从机构节点的代理特性出发,通过机构引证网络考察机构间知识交流的路径和模式,识别机构在网络中的中介活动,是把握机构中介特征的一个新颖而有意义的角度。本文选取Journal of Informetrics数据,以信息计量领域为例,构建机构引证网络,探讨知识交流过程中,学术机构作为中间人参与的中介路径和中介模式问题。 1 相关研究回顾 机构是研究主题集中、研究领域稳定的知识单元。机构引证网络中,机构作为知识交流的基本单元具有两方面的特性:一方面,机构被引反映的是机构中作者群体的学术成果集合的被引情况,因此机构引证与文献引证及作者引证具有对应性,可以根据文献引证网络构建机构引证网络;另一方面,机构之间具有学术实力、研究主题和地理位置等多种属性区别,对应每一类型的属性差异,可以对机构进行基于相应属性的分区,从而研究不同分区之间的知识交流特点。现有以机构为对象的研究多数从机构合作的角度出发,针对机构引证关系的研究以基于机构发文量和被引量的实力评估为主,主要涉及各类引文指标的统计和比较,其最直接的应用是产生了不同指标体系下的机构实力排名[4]。部分学者进行基于机构引证关系的网络研究,对高被引机构及其发表文章进行分析,被引机构和施引机构之间的互动情况可类比于生产者和消费者之间的关系[5]。部分学者对机构的引证活动从物理距离、主题距离、从属国别、机构类型、合作强度、引证频次等方面进行测度[6]。关于机构引证的评价指标,按照产生的时间顺序,包括篇均被引、影响因子等标准化指数[7-8],以皇冠指数为代表的相关性指数[9],以h指数、g指数为代表的h型指数[10],以及后续基于引文分布的相对性指数[11]等。 目前对引证网络节点中介属性的考察,多数从整体网的视角出发,以统计节点的中介中心度为主[12]。而考察节点之间具有互动性的中介关系时,则应该从节点个体网的视角展开。中间人分析是典型的个体网属性分析,从中间人的角度研究引证网络中的中介关系是一个比较新的研究视角,但中间人研究的方法论已十分成熟,其概念最初产生于社会学领域,由Burt[13]提出。Burt以及另一组作者Galaskiewicz和Krohn[14]先后将中间人定义为:从一个位置得到资源,并向另一个位置发送资源的行动者。近些年,中间人研究已不仅局限于社会学,其方法论在涉及关系网络的各个学科领域均有相关应用[15-I8]。然而现有的中间人研究主要是针对不同类型的网络进行中间人的角色分析,包括期刊互引网络[19]、微博关注关系网络[20]、产业结构网络[21]、组织创新网络[22]和虚拟社区社会网络[23]等。这些研究除进行中间人角色的定量统计之外,并未指出这种由中间人维系的纽带关系究竟代表了什么,是否具有规律性的路径倾向和中介模式。 2 研究设计 2.1 数据获取与处理 本文构建学术机构引证网络,识别中间人,并对以中间人为纽带的中介关系进行相关的路径和模式分析。选取信息计量领域作为研究对象,数据来源为Journal of Informetrics期刊。信息计量学是情报学的下属分支,以定量方法研究信息的生产、传播和应用过程,20世纪90年代以来发展迅速,形成了完善的方法论和学科体系架构[24]。信息计量学领域规模适中,机构间交流频繁,引证行为活跃,是研究机构引证中介关系的适宜对象。Journal of Informetrics是信息计量领域的顶级期刊,代表了该领域最先进的研究进展,选取该刊作为数据来源具有代表性。 Journal of Informetrics于2007年开始发行。通过Web of Science数据库获取该刊2007~2014年的数据,检索时间为2015年7月7日,共检索并下载文章510篇,使用Python进行数据处理和引证网络构建,过程如图1所示。 图1 数据处理流程 步骤“统一机构名”主要处理以下两种情况:①相同机构具有不同写法,如:Adm Headquarters Max Planck Soc和Max Planck Soc是同一机构“马克斯·普朗克学会”,统一为Max Planck Soc。②“通信作者地址”(RP)字段提供的地址与作者所属机构不一致,如:文章A Stochastic Approach to the Relation Between the Impact Factor and the Uncitedness Factor,通过检索原文,可知作者Burrell Q L的所属机构为比利时的Katholieke Univ Leuven,但题录数据中通信地址给出的是“119 Friary Pk,Ballabeg IM94EX,Man,England”,此种情况下,应依照原文中给出的信息判断作者的所属机构。此例中,将作者Burrell Q L的所属机构统一为Kathoieke Univ Leuven。 按照“参考文献”(CR)字段的格式,即“第一作者,年份,期刊,卷,页,DOI”,对每一篇文章进行格式化,生成文章列表。将文章列表和统一名称之后的机构列表以“ISI标识号”(UT)字段作为主键,进行自然连接,从而将文章与所属机构进行匹配,获得“文章—机构”对应表。基于文章(施引文献)与参考文献之间的直接引证关系构建文章引证网络。根据“文章—机构”对应表,将构建好的文章引证网络中的文章节点,替换为相应的机构节点,即可得到总计188个机构之间的直接引证关系网络。 2.2 中介关系获取 本文中介关系获取的实质是抽取网络中无冗余联系的三方组(见图2),无冗余联系的含义是,A有一个指向B的关系,B有一个指向C的关系,但是A没有指向C的关系,也就是说,A需要通过B才能与C取得联系,此时B就是中间人。 图2 B为中间人的三方关系示意图 获取上述由中间人沟通的三方关系,分两步执行:首先识别符合中间人特征的机构节点;其次,获取由中间人机构直接沟通的路径两端的端点对。程序流程图如图3所示。初始输入为机构引证关系矩阵,A、B、C表示机构节点,A、B、C的相对位置与图2一致,输出分为两部分:①中间人机构列表及其担当中间人的次数;②对应每一个中间人机构,由其直接沟通的所有路径。 图3 中介关系获取程序流程图 2.3 中介关系分析 中介关系分析分为两个步骤:首先是对中间人机构中介能力的判断,本文使用“中间人得分”[3,22]表征中间人机构中介作用的发挥程度。“中间人得分”是最直观且应用最广泛的中间人能力测度指标,中间人研究中普遍使用这一指标进行中间人测度,它的含义是一个机构担当中间人角色的总次数。 本文基于中间人机构节点及其沟通路径所做的中介关系分析涉及两个机构群体,其一为由所有担当过中间人的机构组成的“全机构”群体,其二为由高得分的中间人机构组成的“高得分机构”群体。分析“全机构”群体的目的是从全局的角度把握中介关系的总体态势;根据中间人得分选定部分高得分机构进行单独考察,是出于对中介关系的细致分析的考虑,要求研究对象的选取具有代表性。 根据中间人得分确定中间人机构节点之后,中介关系分析的下一步是探索一个合适的角度识别关系中所蕴含的规律性路径和中介模式。本文引入机构分级思想,将中间人机构以及路径两端的机构按照统一的原则进行分类,该原则需要能够在很大程度上代表机构的学术实力,分类完成后,每一条路径将对应一种不同分区之间的交流。发文量和被引量是机构学术产出的最直接指标,本文机构之间的知识流动和中介作用由施引关系和被引关系反映,因此选取的机构分级依据最好能够将机构发文量和被引量结合起来。从发文量和被引量相结合的角度出发,首先考虑篇均被引量,该指标的主要弊端是会造成发文量较大的机构反而排名靠后。其次考虑h指数,经实验发现,在本文情境下,使用h指数对机构的区分度过低,主要原因是h指数是一个截止值,无法考察截止值之前的被引情况。如表1所示,机构58和机构53的h指数均为5,从h指数来看,两者实力相当,然而从具体文章的被引量来看,机构58明显领先于机构53。 最终本文选取的是由荷兰莱顿大学开发并维护的Leiden Ranking中的P(Top 10%)指数[25-26](以下简称P指数)作为机构分级的依据。P指数的含义是:一个机构发表的文章中,进入高被引文章前10%的文章数。举例说明:假设共有100篇文章,其中90篇文章被引1次,7篇文章被引2次,3篇文章被引5次。那么被引1次以上(不含1次)的文章即入选高被引前10%文章。这时,假设机构A发表的文章中有6篇被引1次以上,则机构A的P指数为6。 在全部的188个机构中,P指数大于1的机构有9个,等于1的机构有25个,其余机构的P指数等于0。我们根据P指数大于1、等于1、等于0将机构划分为三个实力等级区域,依次命名为“强”“中”“弱”,如表2所示,以此作为本文机构分类的依据。 3 结果分析 在188个机构中,担当过中间人角色的机构有90个,其中,得分高于或等于45的机构有20个,累积得分覆盖率达到82%,具有代表性。根据2.3节“中介关系分析”中的研究设计,本文分别对由90个中间人机构组成的“全机构”群体和得分高于45的20个高得分机构组成的群体进行中介关系分析,高得分机构信息如表3所示。 高得分机构来自12个不同的国家,来自荷兰的机构数量为4,居首位,且荷兰莱顿大学的中间人得分最高;来自西班牙的机构有3个,比利时、德国和中国各2个,其余国家各有1个机构。从机构的国家分布来看,欧洲处于绝对优势,12个国家中,有9个是欧洲国家,且中间人得分名列前茅的机构也均来自欧洲,荷兰的表现最为突出。除欧洲外,美国的印第安纳大学得分最高。 3.1 中介路径 根据2.2节的中介关系获取原则,获取中间人机构沟通的所有路径,以及路径两端的机构对情况,被沟通机构总计163个,沟通路径4 269条。其中,由高得分机构沟通的路径有3 508条,被沟通机构128个,情况如表4所示。中间人机构按照P指数降序排列,“强”等级标注深色,“中”等级标注浅色,其余为“弱”等级。需要特别说明的是,引证方向与知识流动方向相反,因此引证方向由A经中间人B指向C的路径,实际知识流动方向为由C经中间人B指向A,我们把C定义为知识流动的始端,A定义为知识流动的末端。 经由中间人机构得以沟通的从始端到末端的机构知识交流路径共有9类,表4给出了每一类路径由最左列的相应中间人中介的路径条数,每一类别以始端和末端的机构所属等级来组成命名,例如:“2→3”对应“中→弱”路径,知识从等级为“中”的机构起始,经由中间人,流向等级为“弱”的机构;“中→弱”路径对应机构3的数值为174,表示经由机构3沟通的“中→弱”路径有174条。为分析规律性的路径倾向,根据“全机构”群体沟通的知识交流路径和表4中高得分机构沟通的知识交流路径情况,绘制热图,如图4所示。 图4以行数据作为颜色渐变基准,图中方格由蓝(低频)变白再变红(高频),红色越深表示出现频次越高,而蓝色越深则表示出现频次越低。可以明显区分出三条经由中间人中介的机构知识流动路径,其中最明显的是“中→弱”路径,其次为“弱→弱”,再次为“强→弱”。我们发现了两个现象:①三条路径的末端机构,也即知识接收端,均为“弱”等级机构,也就是说,中间人机构主要提供流向“弱”等级机构的知识流动路径。“弱”等级机构更多地依靠中间人机构,获取“强”“中”“弱”三类机构输出的知识。相比之下,“中”等级和“强”等级机构则较少依靠中间人完成知识接收,而更倾向于不经过中间人的直接知识交流。②三条路径的始端机构,也即知识输出端,最多依靠中间人的中介作用输出知识的为“中”等级机构,因此“中→弱”路径为图4中红色出现频次最多,且颜色最深的一条。 综上所述,中间人主要沟通的机构等级为“中”等和“弱”等,“弱”等级机构更多依赖中间人完成知识接收,主要沟通路径为由“中”等级机构向“弱”等级机构的知识流动。 图4 机构知识交流路径热图 3.2 中介模式 为获取中间人机构的中介模式,现分析“强→弱”“中→弱”“弱→弱”三条路径主要由属于哪个等级的中间人机构来作为中介进行沟通。将“全机构”知识交流路径中的“强→弱”“中→弱”“弱→弱”三条路径数据按照中间人机构的等级分别加和,得到表5,每列对应一条路径。以表5中第1行第1列为例,数值403的含义是,中间人等级为“强”的机构沟通“强→弱”路径403次。 表5数据显示,对于三条路径的沟通,每个等级的中间人机构都承担了相当一部分的中介作用,数值分布比较均衡。“强”等级和“弱”等级机构偏向于中介“中→弱”“弱→弱”路径,“中”等级机构偏向于中介“中→弱”“强→弱”路径。三条路径中,虽然“强”等级机构的群体规模最小,机构数量最少,但其承担了最多的中间人中介作用。“中”等级机构与“弱”等级机构总体的中介作用发挥程度相差不大,在“中→弱”路径的沟通上,“弱”等级机构稍逊于“中”等级机构,但在“弱→弱”路径的沟通方面,“弱”等级机构的中介作用则比较突出。 为深入研究表5的结果,进一步分析“强→弱”“中→弱”“弱→弱”三条路径的中间人机构分布,以“全机构”群体和“高得分机构”群体中“强→弱”“中→弱”“弱→弱”三列的列数据作为颜色渐变基准,绘制热图,如图5所示。在此强调,图4的热图是以行数据作为颜色渐变基准,目的是针对由中间人直接沟通的两端机构从知识交流始端到末端的路径分析;此处的分析目的是中间人机构的中介模式,因此以列数据作为颜色渐变基准。 图5 机构中介模式热图 值得注意的是,“高得分机构”热图并不等同于“全机构”热图的上半部分放大之后的情况;高得分机构根据中间人得分选取,而热图根据P指数排列;“全机构”热图的上半部分(前20行)由全部的“强”等级机构和部分“中”等级机构组成,而高得分机构在“强”“中”“弱”三个等级中均有分布。 图5(a)中表现突出的机构在图5(b)中均有体现,分别是等级为“强”的4个机构,以及等级为“中”的机构127。从单一机构的角度来看,无论是“全机构”方面,或者“高得分机构”方面,中介作用表现突出的中间人均主要集中在“强”等级机构当中。观察图5(b)中的“强”等级机构,其对三条路径的中介程度没有明显的偏向性,在各条路径上发挥的中介作用比较均衡。 综合图5和表5的结果可知,无论是单一机构方面,或是机构群体方面,发挥主导中介作用的中间人均为“强”等级机构。虽然“强”等级群体包含机构数量少,但因普遍高被引的特点,使其中间人的作用突出。由图5可知,单一的“中”等级和“弱”等级机构的中介作用并不突出,但由于“中”“弱”等级在群体上具有一定的规模,因此从群体的角度来看,弥补了单一机构被引量不足的劣势,从而在群体层面也承担了相当一部分的中介沟通作用。 4 讨论 4.1 主要知识交流路径的形成原因 本节对三条主要知识交流路径的形成原因进行分析讨论。各等级机构的发文情况与不同被引量分区下所包含的文章数如表6所示。“弱”等级机构的数量占大多数,因此有一定的发文量积累,这也是流向“弱”等级机构的知识交流路径较多的主要原因。但“弱”等级机构的被引量普遍较低,尤其缺乏高被引文献,因此更多地处于知识交流的末端进行知识接收,而较少作为知识交流的始端进行知识输出。 各等级之间的直接交流与中介交流关系数如表7所示。根据各路径直接知识交流与中介知识交流关系的数值比(表7第4列)可知,“强”等级机构之间显著倾向于直接交流,“强→强”路径上的中介交流则相应较少。由表6分析可知,“弱”等级机构较少进行知识输出,又因“强”等级机构对于直接交流的倾向性,因此在中介交流的始端,“中”等级机构的作用凸显,因此“中→弱”路径最为明显。由于“弱”等级机构数量多,且依赖中介交流,是知识输出端的主要沟通对象,因此居于“中→弱”路径之后,“弱→弱”“强→弱”路径也比较明显。图4中能够明显区分出的三条路径,在表7中均排名靠后,“弱”等级机构不论是在知识输出,或在知识接收方面,均是以中介交流为主。“弱”等级机构普遍低被引,在知识输出端不占优势,因此中介路径中以“弱”等级机构作为始端的“弱→强”“弱→中”路径均不明显。 4.2 显著路径挖掘 路径分析的目的是辅助知识发现,显著路径的两端具体沟通了哪些机构,哪些机构之间更多地依靠中间人进行知识交流,本节对以上问题进行讨论。将“全机构”群体中,各中间人沟通的相同路径进行累加,路径出现次数的频次分布如图6所示。在中间人机构沟通的4 269条路径中,包含不重复的路径2 958条,路径分布较为不均匀,大部分路径仅出现1次。 图6 中间人沟通的路径分布 出现6次以上的路径有7条,如表8所示。路径方向依然按照从知识流动的始端到末端的顺序,即与引证方向相反。表8所反映信息的一个推论是:表中的末端机构与对应始端机构在研究主题和研究方向上多有重合,具有潜在的知识交流需求,但目前更多的是依靠中间人机构进行的间接知识交流。在与始端机构重合的研究方向上,末端机构可尝试加强双方之间的学术交流,推进双方在相关领域的学术合作。另外,从中间人的国家分布来看,欧洲国家是中间人作用的主要承担者,欧洲机构之间的中介交流,倾向于由同样属于欧洲的中间人机构来中介;欧洲机构与中国机构的中介交流,其中间人则分散于欧美和中国之间。在非欧洲机构中,台湾大学、中国科学技术信息研究所和美国的印第安纳大学表现活跃。 5 结语 本文构建学术机构直接引证网络,通过识别中间人及其沟通的知识交流路径,结合依据P指数排定的机构实力等级,从个体网的角度考察机构引证中的中介关系,主要包括中介路径分析和中介模式分析。 研究发现,中间人主要以“弱”等级机构作为知识接收端,重点沟通由“中”等级机构发起,向“弱”等级机构传递的知识流动路径。“强”等级中间人在单一机构和机构群体方面均发挥主要的中间人中介作用。根据显著路径挖掘所得的机构信息,建议知识交流末端机构加强与对应始端机构的学术合作与直接知识交流。 本文以识别引证网络中的中间人作为切入点,将机构节点分区原则引入中介关系分析,在考察个体网视角下的引证网络中介关系方面做出创新性尝试,取得了一定的成果,后续研究可以从以下三个方面进行拓展。 (1)数据适用性验证。本文选取数据来源为信息计量学领域的权威国际期刊,发文水平较高且数据量有限,对数据适用性的验证可以从扩大样本量和改变获取数据的学科领域等方面着手,以检验本文所得结论是否具有推广性。 (2)使用不同的机构分区规则进行分析。本文以P指数作为机构等级分区依据,后续可尝试其他分区规则,例如机构所属的学科子领域等,或可得到多样化的机构知识交流关系。 (3)中介属性对比分析。中介属性的考察还可以从其他角度进行,代表性指标例如从整体网角度出发的中介中心性。中间人得分与其他中介性指标、与h指数等引文指标是否具有相关性尚待考察。寻找一个适当的角度将中间人得分与经典指标结合起来以加强网络分析效果,将是一个有意义的研究方向。学术机构引文中的中介关系_群体行为论文
学术机构引文中的中介关系_群体行为论文
下载Doc文档