基于引文的知识扩散研究综述_专利管理论文

基于引文的知识扩散研究评述,本文主要内容关键词为:引文论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1924年,卡耐基基金会的William Setchel Learned在《美国公共图书馆与知识扩散》一书中首次对知识扩散进行了研究[1]。随着知识经济的发展,知识扩散这一主题目前已成为多个学科的研究焦点。从引文分析的视角看,知识扩散(knowledge diffusion)是指知识在科学文献与专利中的传承[2]。这种传承通过引用得以实现,因此,这种知识扩散的视角被称为“基于引文的知识扩散”(knowledge diffusion through citations)。知识扩散的其他研究视角包括量化分析科技创新[3-5]和知识扩散对公共政策与经济增长的意义[6-8]。论文在基于引文的知识扩散的国内外文献的基础上,评述该领域的研究主题并分析研究趋势。

知识扩散也被称为“知识交流”(knowledge exchange)[9]或“知识流动”(knowledge flow)[10-11]。从国内外已发表或出版的文献来看,基于引文的知识扩散的研究主题包括:(1)以期刊、作者、学科、专利等为基本单元,分析知识扩散的特征;(2)设计知识扩散的测度指标;(3)构建知识扩散模型。

1 知识扩散的单元

基于引文的知识扩散的最基本单元是单篇文献,如期刊论文、专利等。如果文献A引用了文献B,那么B中的知识就扩散到了A。基于一组文献的共同特征,如属于同一作者、同一期刊或同一学科,则可以以作者、期刊、学科为知识扩散的单元。知识扩散的方向与引用的方向相反,以单篇文献为单元的知识扩散是单向的,而以作者、期刊、学科为单元的知识扩散可以是双向的。

1.1 作者

以作者为单元的知识扩散研究可以发现作者在知识传承过程中的角色。例如,张勤等人以中国引文数据库(CCD)中的知识管理类论文为数据来源,通过作者之间的引用分析作者之间的知识交流关系,研究发现:高被引作者的互引网络密度较低,知识传播的距离较远,容易产生信息失真或曲解的现象;作者之间的知识交流不够活跃、频繁[9]。此外,张勤等人还将从事知识管理研究的学者划分为四个流派:图书情报学派、管理学派、信息系统学派与综合学派,并分析了学派之间的知识扩散特征。邱均平等人选取Scientometrics上的1484位第一作者,通过引用关系分析作者之间的知识扩散特征,发现Schubert A、Glanzel W、Vinkler P等居于引用网络的核心,Garfieid E、Schubert A、Braun T等位于被引网络的核心[12]。

1.2 期刊

以期刊为单元的知识扩散研究可以发现期刊在学科范围内的地位与影响。例如,Pieters和Baumgartner分析了经济学及相关学科学术期刊之间的引证关系,发现经济学知识在源源不断地向其他社会科学以及跨学科研究扩散[13]。岳洪江选取CNKI中18种影响因子相对较高的管理科学期刊作为数据来源,通过引用关系分析期刊之间的知识扩散,发现随着时间的推移,管理科学期刊的知识交流更加直接和开放,学科分支领域在趋于融合;期刊引证间存在“无形学院”,即存在期刊共同体[14]。宋歌等以CSSCI数据库2006—2007年图书情报学来源期刊为数据源分析期刊之间的知识扩散,将期刊分为“知识源”、“中转站”和“储备库”三种角色[15]。陈亦佳等人以SSCI中的LIS期刊为数据来源分析了图书情报学的知识交流情况,发现Journal of American Society for Information Science和Technology等期刊位于知识交流的核心位置[16]。金碧辉等人对2001年SCI与CSCD均收录的36种期刊进行分析,分别绘制了引用网络与被引网络,分析了中国科技期刊在国际引文网络中的“主群”现象与“孤岛”现象[17]。周萍等人在比较了国内外的社会科学期刊引文网络之后,认为参考文献较少导致国内社会科学引文网络稀疏,所以知识扩散速度缓慢[18]。

1.3 学科

学科之间的知识扩散现象越来越普遍。以学科为单元的知识扩散研究可以发现学科的独立性与跨学科研究的强度。例如,Van Leeuwen和Tijssen基于ISI的学科分类,对ISI数据库中2314个期刊的引文进行分析,发现,69%的引用都是跨学科的[19]。一方面,这种知识扩散可以反映学科之间的知识关联;另一方面,可以采用量化的指标揭示跨学科行为特征,如跨学科引用指数(Citations Outside Categories)[20]、Brillouin指数(Brillouin's Index)[21]等。Chang和Huang针对ISI数据库中LIS领域的跨学科引用,分析发现:在图书馆学领域,来自教育学的参考文献量呈现增长趋势,而来自计算机科学的参考文献在情报学领域呈现增长趋势[22]。赵星等人基于CNKI的82个文科领域在2001—2010年间积累的文献之间形成的引文网络,分析了我国文科知识领域扩散的特征,发现经济、教育、政治和管理学等领域是知识扩散的主要来源,图书情报学在文科领域引文网络中处于核心节点的位置,表现出良好的学术活力[23]。邱均平等人以JCR中图书情报类影响因子大于2的期刊为例,分析了跨学科知识扩散的特征,发现图书情报学的知识来源于自身学科,其次是计算机科学、管理学、医疗保健与服务[24]。Yu等人研究了纳米科学与技术与其他学科之间的知识扩散情况[25]。Urata以日本的人文与社会科学论文为数据来源,以学科为单元,研究了学科之间知识的扩散,根据学科的独立性(引用其他学科知识的比例越低独立性越强)将所选的学科划分为四组:[哲学、心理学、历史学、语言学]>[经济学]>[统计学、人类学]>[教育学、社会学][26]。

不同数据库中的不同学科分类使得研究结果之间难以比较。有学者对数据库的学科分类体系并不认同,例如,Leydesdorff和Probst认为ISI的学科划分较宽泛,不利于科学评估[27];也有学者采用数据库以外的学科分类体系,例如,Chang和Huang在参照美国国会图书馆分类法的21个学科分类的基础上提出30个学科分类的学科体系[22]。

1.4 专利

以专利为单元的知识扩散常见于“技术扩散”(technology diffusion)研究。技术扩散是一项技术从首次商业化应用,经过大力推广、普遍采用阶段,直至最后因落后而被淘汰的过程[28]。大量关于技术扩散的实证研究表明:新技术的扩散过程可以用S型曲线描述[29]。技术扩散的模式决定着技术前沿与技术变迁的模式。2004年,Jaffe[30]首先提出借助专利引文追踪技术扩散。Ji与Wang基于汤森路透的专利引文索引DII(Derwent Innovation Index)发现:受距离、语言、技术相似性等因素的影响,知识扩散的区域化特征非常明显。此外,专利族(Patent Family)对于知识扩散的过程也起着重要作用[31]。Sorenson与Fleming确定三个专利数据集:(1)引用经过同行评议的学术文献的专利,(2)引用非学术的商业文献的专利,(3)引用既非学术文献也非商业文献的专利。通过比较引用这三个数据集中专利的特征发现:引用学术文献与商业文献的专利的知识扩散在时间与空间上均更快,因而获得了明显更高的被引次数[32]。该文作者据此认为:文献(学术的或商业的)是加速技术创新的重要手段。Chen和Hicks提出一种新的方法,这种方法将复杂网络理论、网络可视化、专利引文分析相结合,用于分析科学与科学、科学与技术、技术与技术之间的知识扩散[33]。

对于基于引文的知识扩散而言,引文网络是知识扩散的路径。根据扩散单元的类型可将引文网络划分为:论文引文网络、作者引文网络、期刊引文网络、学科引文网络、机构引文网络等。对于知识扩散路径,常用的分析方法包括:图论、复杂网络分析、社会网络分析等,常用的指标包括:密度(Density)、连通性(Connectivity)、中心性(Centrality)、小团体(Clique)、度分布(Degree Distribution)、特征路径长度(Characteristic Path Length)、聚类系数(Clustering Coefficiet)、h度等指标[34-36]。

2 知识扩散的指标

2.1 知识扩散广度

“广度”是从覆盖范围的角度对扩散进行描述,即覆盖范围越大,则广度越大。2002年,Rowlands以期刊为知识扩散的单元,提出了期刊扩散指数(Journal Diffusion Factor,JDF)[37]:在指定时间范围内,对某期刊的每100次施引涉及的不同期刊的数量即为该期刊的扩散因子,即JDF=U*100/Cit,其中U为施引涉及的不同期刊的数量,Cit为被引次数。作者计算了ISI数据库中LIS领域(Library & Information Science)1998年的42个期刊的扩散因子,并与期刊影响因子(Journal Impact Factor)比较后发现,期刊扩散因子与期刊影响因子之间无正相关关系,在某些学科内呈负相关关系。该指标被中国科技信息研究所的《中国科技期刊引证报告》采用。同时,该报告还采用了“学科扩散指标”用于比较同一学科内的期刊被引用情况,该指标指:在统计源期刊范围内,引用该刊的期刊数量与其所在学科全部期刊数量之比。理论上,学科扩散指标值越大,则该期刊在该学科范围内的扩散范围越广[38]。

在指定时间段内,某经济学期刊A被引用1000次,涉及100个施引期刊,因此该期刊的扩散因子为10;另一个经济学期刊B在相同时间段内被引用10 000次,若要与A有相同的扩散因子则必须涉及1000个施引期刊,ISI数据库总共只有166个经济学期刊(2004年数据),要想被1000种期刊引用不太可能,结果期刊B的被引次数较高(载文量与A相差不大的情况下,影响因子也较高),期刊扩散指数相反却较低。据此,Frandsen认为Rowlands的指标并不适用于评价期刊,并提出修正指标“新JDF”[39]:指定时间范围内,某期刊刊载的论文中平均每篇涉及的不同施引期刊的数量即为该期刊的扩散因子,即JDF=U/Pub,其中U为对该期刊施引涉及的不同期刊的数量,Pub为载文量。“新JDF”与JIF比较后发现两者呈显著正相关性。

Egghe从数学的角度推导了Rowlands提出的JDF和Frandsen修正的JDF之间的关系。前者的JDF为RJDF=U/Cit,后者的JDF为FJDF=U/Pub,若两年为时间窗口,则有:RJDF/FJDF=Cit/Pub=JIF,即二者的商为期刊影响因子[40]。Frandsen从历时与同步(Diachronous & Synchronous)两个角度对RJDF和FJDF进行分析,认为扩散因子有助于揭示知识扩散过程,也有助于深入理解引文数据,可以将该指标用于单篇论文、作者、团队、学科以及国家地区等单元[41]。Mahbuba和Rousseau基于扩散因子的思路修正了h指数,除了测度发文量与被引次数之外,同时还测度学者的知识扩散速度。Liu等人基于ESI的学科分类定义了“学科扩散广度”(Field Diffusion Breadth,FDB):对于指定的一组论文,施引的论文所属的ESI学科数量就是这组论文的学科扩散广度[42]。

2.2 知识扩散强度

“强度”是从在指定路径上的频次的角度对扩散进行描述,即在指定路径上的扩散次数越多,则强度越大。Liu和Rousseau基于ESI的学科分类定义了“学科扩散强度”(Field Diffusion Intensity,DINT):对于指定的一组论文,某个ESI学科范围内的施引论文的数量就是这组论文在该ESI学科范围内的扩散强度[42]。知识扩散强度与知识扩散广度的关系如下:

其中,T指总被引次数。同一篇论文中,Liu以同济大学的数学类论文为例,发现这组论文扩散强度最大的5个学科依次是:数学、物理学、工程、计算机科学、化学。邱均平等人研究发现CSSCI数据库图书情报与档案管理学科的知识扩散强度最大的学科分别为:计算机科学与技术、管理学、新闻传播学;CSTPCD(中国科技论文与引文数据库)中图书情报与档案管理学科的知识扩散强度最大的学科分别为:自动化技术与计算机技术、农业科学、科研管理[43]。

2.3 知识扩散速度

“速度”是从单位时间里运动距离的角度对扩散进行描述,对于指定的扩散目标,所耗时间越短,则扩散速度越快。2005年,Rousseau提出“平均扩散速度”(Average Diffusion Speed,ADS)指标用于测度Fairthorne的一篇经典论文[44]在信息计量学领域的影响力[45]。该指标定义为:一篇论文发表之后,引用该论文的(去重)期刊数量与该论文年龄的比值。知识扩散速度与知识扩散广度之间的关系如下:

其中,指文献年龄。2010年,Liu与Rousseau将平均扩散速度定义为:一篇论文发表之后,引用该论文的(去重)ESI学科数量与该论文年龄的比值[42]。二者的区别在于:前者的分子是施引的期刊数量,后者的分子是施引的学科数量,统计单元不同。Liu与Rousseau统计同济大学每年发表的数学类论文的平均扩散速度,发现自1993年以来,该指标数值呈指数增长趋势[42]。邱均平等人对CSSCI的20种图书情报学期刊在2001—2010年间的平均扩散速度进行线性拟合,发现平均扩散速度呈线性上升趋势[43]。

Rousseau提出的平均扩散速度与施引期刊的数量成正比,与论文的年龄成反比。该指标无法揭示微观的知识扩散速度。微观的知识扩散是指知识从一篇论文扩散到另一篇论文的过程,即后者引用前者。汤易兵等人提出“引文滞后”(Time Lag of Citation)指标反映知识扩散速度,该指标是用施引论文的发表时间减去被引论文发表时间所得的时间差[46]。该指标实际上是一次知识扩散(引用)的耗时,用速度的概念来描述,即单位时间内的被引次数。引用时间差越短,则知识扩散速度越快。某一期刊(即一组论文)向另一期刊扩散时,可用平均引文滞后揭示知识扩散速度,即期刊的平均引文滞后反映期刊的知识扩散速度。期刊的被引半衰期(Cited Half-life)是该期刊在指定时间段内所有论文被引用的平均引文滞后的中值。因此,笔者认为,作为测度文献老化的指标可以反映文献通过引文进行知识扩散的速度。

基于上述关于知识扩散测度指标,笔者将国内外知识扩散测度的指标体系概括为如图1所示。

3 知识扩散模型

知识扩散也是一个重要的社会过程,在这个过程中,观点在人与人之间转移。这一过程与人群中疾病的扩散过程颇为相似。基于此,有学者借助流行病学模型来研究科学文献中的知识扩散过程。例如,Bettencourt等人将科研主题数量的增长(表现为发文数量的增长或作者数量的增长)视为观点的扩散,然后利用流行病学模型量化分析观点的扩散过程[3,47]。他们发现实际数据与模型数据之间有很好的匹配,但这种模型无法体现个体在知识扩散过程中的差异。Kiss等人在Bettencourt等人研究不足的基础上,提出一个基于个体的有向的、加权的知识扩散模型,用于描述研究主题在ISI学科之间引用的网络结构中扩散的过程[48]。

Gao与Guan提出一种知识扩散网络模型——基于引文的时间序列网络模型[49],这种模型综合了社会网络分析、网络可视化、引文分析的方法。该模型的创新包括两个方面:(1)模型中以引用作为知识扩散的路径;(2)从网络结构的视角解释知识扩散的过程。他们认为网络结构视角的扩散过程与传染病的扩散过程相似,首先,有一些节点接收了新的知识,这些节点的数量增长相对较快;然后,接收知识的节点的总数快速增长的同时,增长率下降;最后,新增接收者的数量快速减少,扩散过程慢慢结束。这种扩散模式可以画作一条逻辑S形扩散曲线。他们以h指数相关论文为例,分析了关于h指数的观点在这些论文之间的扩散状况,基于S形扩散曲线和路径分析法找到了知识扩散过程中的主干论文。

4 结语

基于引文的知识扩散研究的基本单元还可以更广,除了可以作者、期刊、学者、专利等为单元,还可以机构、国家/区域等对象为单元;分析扩散特征时,还可以设计其他视角的测度指标。例如,某知识源同时向多个学科领域扩散时,可以设计“多维度的知识扩散速度”指标,同时反映速度与方向的特征。

我国哲学社会科学研究“十五”规划、“十一五”规划、“十二五”规划中均提出要加强与鼓励跨学科研究以及学科之间的交叉融合。跨学科引用是跨学科研究的必然产物。在这种背景下,跨学科知识扩散越来越普遍,研究跨学科知识扩散规律有助于了解学科之间交叉的模式,也有助于促进跨学科研究。因此,笔者认为“跨学科知识扩散的规律”(即以学科为单元的知识扩散)将成为知识扩散领域的研究热点之一。此外,当前对知识扩散测度指标的研究较少,测度指标的效果有待进一步论证,针对当前指标的缺陷提出修正指标,或设计全新的测度指标将成为知识扩散的另一个研究热点。

标签:;  

基于引文的知识扩散研究综述_专利管理论文
下载Doc文档

猜你喜欢