图书馆学情报学高影响力论文特征及所反映的学科差异分析,本文主要内容关键词为:情报学论文,图书馆学论文,学科论文,影响力论文,差异论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 研究背景和问题的提出
近年来,图书馆学情报学引文数据分析法得到了广泛应用,其原因主要有三个方面:①数据库引文数据的广泛可用性;②可视化分析工具的广泛可用性;③数据密集型分析方法在科学文献中大量出现。本文采用引文分析法对学科高影响力论文的特征及其反映出来的学科差异加以分析。
1.1 高被引文献和高影响力文献研究
(1)高影响力论文的概念
目前学界对高影响力论文概念的理解不十分统一。有些是宽泛的,有些是严格的;有些是定性的,有些是增加了定量要求的;有些是简单的,有些是综合考虑的。
有学者简单将高影响力论文等同于高被引论文;也有学者认为优秀的科研论文被引用频次往往相对较高,而且引用周期也较长,这类论文就是高影响力论文[1]。
综合考虑的实例如:2000年美国信息科学研究所(ISI)在北京表彰中国大陆1980-1998年间47篇高影响力论文的124位作者,其选择标准是以高被引为基础,再考虑学科间引用差异、论文发表时间长短等因素[2]。《科学日报》上刊登的定义为:高影响力论文是指高被引论文、热点论文、发表在世界三大名刊上的论文和发表在各学科顶尖期刊上的论文,反映了一国的科技进步以及对世界科学事业贡献的一个重要侧面[3]。
定量考虑的例子如:汤森路透公司对高影响力论文给出具体的测度范围,定义为:以十年作为统计时间段来计算所有论文的被引次数,高被引论文是指引用次数排在各学科前1%的论文,而热点论文是最近两年发表的论文在同时间段内被引次数排在各学科前0.1%的论文[4]。
(2)高影响力论文的研究现状
对于高影响力论文的研究主要有四个方面:一是对高影响力论文作用的研究;二是对高被引论文所体现的特点和规律的研究;三是对高被引论文优势和局限性的研究;四是高影响力论文数据的分析和利用。
国内外学者认为高影响力论文的作用和主要应用领域有:①作为科研影响力的评价标准。近年来,以高影响力论文作为科研水平评价指标在国际上普遍被采纳[5-6],刊载高影响力论文的期刊也具有较高的影响力[7]。②作为竞争力分析指标[8]。被引数据作为来源常常被用来做比较研究,特别是在竞争力比较方面用途较大。如2008年美国兰德公司发布著名的研究报告《美国科技竞争力》就将一个国家的高被引论文数据作为其中一个评价指标,比较美国与其他国家的科技竞争力[9]。国内学者对大学科技竞争力的评估研究,以及对优势专业和优势学科的比较分析都采用被引数据作为重要指标[10]。③揭示学科或学科领域的研究历史、研究现状和发展趋势。比如对国内灾害医学救援学科发展现状的学术热点分析[11]、对中国眼科学的研究现状分析[12]、对教育科学研究方法的分析[13],等等。
国内外学者对高影响力论文自身所体现的特点和规律进行研究,主要内容有:①研究高被引论文被引时间的规律、论文合著规律。有研究通过对心理学、管理科学、教育学、数学统计、理论物理、化学领域的数据分析,表明合著论文的平均被引次数高于单一作者论文[8]。②研究高被引论文的老化速度是否比普通论文要慢。Aversa提出高被引论文的老化特征为[14]:被引次数较多的文章,得到引用的速度较慢,老化速度也较慢;被引次数较少的文章,得到引用的速度较快,老化速度也较快。③研究高被引论文的类型特点。有学者发现,优势学科的论文多,探究研究热点的文章多,高影响力文献总量偏少,研究性论文数量偏少[15]。
国内外学者对高被引论文的优势和局限性也颇为关注,特别是对其作为科学评价指标方面的优劣势十分重视。有学者通过实证研究发现,高品质的论文不是最高被引论文,但是被引量都高于学科平均被引,最高被引论文的品质不能肯定最优,但一般具有广泛影响[16]。也有学者认为,引文的学术评价包括肯定性评价、否定性评价和商榷性评价三种类型,无论是哪种评价,都体现了所引用文献内容的学术价值[17]。最具说服力的例子是对诺贝尔奖金获得者的论文在获奖前被引情况的考察结果,国外学者研究表明美国1961-1971年间发表论文的诺贝尔奖获得者在获奖前每年平均被引222次;相同时间段内,即将被选入美国科学院的学者,平均被引次数为99次;《科学引文索引》中具有代表性的学者,平均被引次数为6.1次[18]。也有一些学者不支持简单以高被引量来评价论文和刊物的做法,他们对医学论文十年间期刊分布的研究发现,高影响力医学论文多刊登在国家最权威的核心期刊上,但有不少核心期刊没有一篇高影响力论文,而个别非核心期刊的高影响力论文多达数十篇[19]。总体看,大多数学者是肯定高被引论文价值的,认为尽管高被引指标有不完善之处,但其客观公正性是同行评议无法相比的,采用高影响力指标作为评价论文质量的标准之一是可取的。
关于高影响力论文数据的分析和利用,目前研究主要集中在对高被引论文作者分布、期刊分布、被引频次分布、产出地分布、机构分布、时间分布、与基金项目关系、与期刊关系以及中外比较研究等方面。在挖掘核心作者、核心期刊、重要论文等方面有众多成果,其中统计分析工具和可视化分析工具近年来得到了广泛应用,对此类研究做出了较大贡献。
1.2 问题提出
通过CNKI数据库检索结果可以看到,图书馆学情报学对本领域高被引文献的研究成果普遍多于其他学科领域,而且从内容看,相关研究成果的质量也要高于其他学科的同类研究,这也许是因为引文分析的方法来源于本学科,更能够得到专业人士合理有效的使用,也许是因为高被引现象作为一种信息现象更容易受到图书馆学者和情报学者的注意。
尽管很多学者对高被引论文现象和规律进行了研究,但高被引现象的深层原因和表现特征仍然有许多值得深入分析和研究的问题。此外,从大量引文提供的大容量数据中寻找科学规律的探索尚有很大的发展空间。有鉴于此,本文的研究任务是分别以图书馆学情报学两个学科的高被引学术论文数据为基础,首先分析高被引论文本身体现的外部特征和内容特征,目的是揭示高被引论文的共性及高被引的原因;其次,通过比较两个学科的被引数据,分析图书馆学和情报学高被引论文的异同,说明图书馆学和情报学存在的联系和学科差异。
2 数据来源和研究方法
2.1 数据采集
本文以CNKI数据库的“中国学术期刊网络出版总库”为数据源,分别选择“情报学、情报工作”和“图书馆学、图书馆事业”两个学科领域,不设检索条件加以检索,检索结果按照被引频次递减排序,剔除通告、通知等非学术文献和不相关文献,分别得到情报学和图书馆学被引频次最高的论文各100篇①,下文中分别将两组文献称之为“情报学百篇高影响力论文”和“图书馆学百篇高影响力论文”。限于篇幅,正文中省略了两组数据表和一些分析结果数据表。
2.2 研究方法
首先分别对百篇高被引文献的外部特征进行分析,包括对发表年代、发表刊物、被引频次、响应时间进行统计,其中年代、刊物和被引三个数据直接可以获得。对于引用响应时间,本文定义为:某论文发表后至首次被引用所经历的时间。本文获取响应时间的办法是从每篇论文在CNKI知网节的引证文献中人工查找最早一次被引时间并记录,由于《情报学报》2003年之后的论文未在知网节中,其中几篇文献的响应时间数据是通过万方数据库的引文记录补充的。
其次,分别对百篇论文进行内容特征分析,主要有两方面:一是采用UCINET软件进行关键词聚类,获取百篇高被引论文主题分布情况;二是采用内容分析法,研读百篇论文的内容,分析高被引论文在选题和写作上的特征。为确定高被引论文的选题时间分布特征,本文提出了论文新颖度概念,某论文主题的新颖度用该论文所研究的问题在国内学术期刊上最先发表的时间到该论文发表时所经历的时间长短来衡量。如时间为0,表示该文是最先发表该研究主题的论文,是新颖度高的论文;时间为1~5年时,表示该论文所研究的主题已有其他论文发表了1~5年的时间,属于新颖度较高的论文;6~10年则被认为是新颖度不高的论文,以此类推。时间的具体获取方法为:首先通过内容分析分别确定高被引百篇论文核心研究内容或研究对象的主题词,在CNKI数据库中进行查询,确定该研究内容在研究论文中出现的最早时间,然后与高被引论文的发表时间进行比对并记录。
第三,由于对高影响力论文的分析都是分图书馆学和情报学两个学科完成的,根据数据可以分析和比较两门学科的特征和异同。
3 数据分析
3.1 图书馆学情报学高影响力论文外部特征分析
3.1.1 关于被引频次和高影响力的确定
本文所采集的高频被引文献的情况为:情报学100篇文献,总被引次数为7993,平均被引为79.93次,最高被引282次,最低被引51次;图书馆学100篇文献,总被引次数为15987,平均被引159.87次,最高被引762次,最低被引104次。
仅从被引频次看,图书馆学论文的被引远远高于情报学。但从论文基数来看,图书馆学高被引论文是从26万多篇文献中选取的,情报学高被引论文是从3万多篇论文中选取,可以看出图书馆学的研究队伍比较庞大,发表的论文数量较多,论文的绝对被引次数高于情报学是必然的。
此外,所获取的情报学百篇文献是按引用频次排序后取最高的前约0.29%,而图书馆学百篇文献是按引用频次排序后的前约0.04%。根据前文中高影响力论文的定义分析,所取论文完全符合高影响力论文需要占被引频次前1%的要求,因此能够将两组百篇文献定义为高影响力论文。
3.1.2 关于机构分布
情报学百篇高影响力论文中,作者来自57个机构,被引两次以上的机构有10个,排名前五位的分别是武汉大学信息管理学院、南京大学信息管理系、国家科学图书馆、北京大学信息管理系、南开大学信息资源管理系。研究机构以高校相关院系教学单位为主要研究力量,除信息管理学院(系),信息资源管理学院(系)等对口院系以外,还包含了计算机系、电子商务系、电子信息系等相关学科院系,共有22个;高校图书馆和公共图书馆次之,有17个;其次是高校或社会的相关研究所,有14个,其中除了不同的科技信息研究所外,还有一些评价中心、计算机和智能研究所、语言处理中心等;此外还有3个期刊编辑部,由于他们容易掌握期刊的相关统计数据,可以在文献计量学方面有所贡献,因此也在情报学的相关机构中占有一席之地;最后还有个别的相关企业也出现在列表中。
机构分布数据说明了情报学研究机构分布的广泛性、多元性,也体现了情报学研究具有内容广泛性和综合性的特质。图1左侧为百篇情报学高影响力论文的机构类型分布图。
图1 情报学(左)图书馆学(右)高被引研究机构分布对照
图书馆学百篇高影响力论文中,作者所属机构共有48个,被引两次以上的有14个,被引排名前五位的分别是武汉大学信息管理学院、国家科学图书馆、华东师范大学信息学系、上海图书馆、北京大学信息管理系。其中公共和高校图书馆为34个,占研究机构70%以上;其次为高校相关院系,有12个;相关的研究所主要有中国社会科学院文献信息中心和国家科技图书文献中心。
从机构分布数据可以看到,图书馆学的主要研究力量是高校图书馆、公共图书馆和高校信息资源管理学院(系)。图1右侧为百篇图书馆学高影响力论文的机构类型分布图。
图书馆学和情报学相比较,在高影响力研究论文方面所体现出来的特征是:图书馆学的研究力量较情报学更为集中和单一,图书馆的工作人员和研究人员已然成为图书馆学研究的主力军,高校图书馆、公共图书馆和高校信息管理院系是最主要的研究力量。情报学领域高校院系与图书馆是主要研究力量,两方面基本可达到平分秋色的状态。并且由于高校的院系中涉及计算机、电子商务、电子信息等多个领域,也有语言学方面的研究力量加入,使情报学的研究队伍更加多元化、综合化。图书馆学研究对象更为集中地反映图书馆的问题,而情报学的研究对象更为广泛,说明两个学科虽然存在关联性,但还是有一定的差异。
3.1.3 关于刊物分布
情报学百篇高影响力论文分布在20种期刊上,《情报学报》是其中最突出的刊物,占了近30%。图书馆学百篇高影响力论文主要发表在16种期刊上,主要是图书馆学和情报学的期刊,《中国图书馆学报》是其中的佼佼者,占了35%。
情报学百篇高影响力论文除了在情报学、图书馆学的相关期刊上发表外,还在中文、管理科学与工程等相关学科的期刊上发表,图书馆学百篇高影响力论文主要发表在图书情报期刊上,这在一定程度上反映了图书馆学情报学具有紧密的关系,同时又说明了情报学研究范围比较广泛,其研究内容具有一定的跨学科性。
3.1.4 关于年代分布
从图书馆学情报学百篇高影响力论文发表的年代分布可以看出(图2,图3),高被引文献发表时间集中在1998-2004年间。情报学百篇高影响力论文的跨度时间较长,最早发表时间为1983年,时间跨度27年,其中80年代发表的论文有两篇;图书馆学百篇高影响力论文最早发表时间为1996年,时间跨度只有14年。
上述数据说明距现在5~10年前发表的论文能够得到更多的引用,这是因为论文引用既受到累积效应的影响,即发表时间越长,看的人越多,引用的可能性越大;又受到创新效应的影响,即人人都愿意学习最先进、最新颖的知识,新发表的论文更可能受到关注。但是,经典著作或者具有时代标志性的、具有方法指导意义的著作还是能够得到长期关注的。
相比较而言,情报学的论文更注重方法论研究,具有持久的效应;图书馆学强调实践,更关注应用性的内容。上述数据所反映的被引老化趋势,是否能够证明图书馆学与情报学的文献老化有所不同,还有待进一步验证。
3.1.5 关于被引响应时间分析
论文发表后多长时间能够得到引用?从图书馆学情报学百篇高影响力论文的数据中看到,图书馆学高影响力文献平均响应时间为5.75个月,情报学的平均响应时间是11.13个月。数据显示,绝大多数论文在发表后3~14个月得到首次被引,也有不少论文在发表一年多以后才首次得到引用。
3.2 图书馆学情报学高影响力论文内容特征分析
3.2.1 研究主题的新颖度和时间特征分析
我们常常注意到这样一个现象:即一些高被引论文的研究对象和研究内容往往是非常新的主题,有些高被引论文就是因为最早提出某个问题、现象,提出新的研究内容和研究领域。这是否是高被引论文的普遍现象呢?为了说明这个问题,我们设计了主题新颖度的测度方法:第一步,分别对图书馆学情报学百篇高影响力论文所研究的内容主题进行提炼;第二步,到CNKI期刊网上查询该主题最早出现的时间;第三步,将这个时间与高影响力论文的发表时间进行对照。采用该方法观察某项研究内容在提出之后多久才出现高影响力论文,由统计结果得到了高影响力论文的研究内容主题出现的时间分布数据(见表2)。其中数值为0,表示论文所研究的内容主题是本文最先涉及的;数值为1~5年,表示论文所研究的内容主题在本文发表前1~5年已在学术论文上出现,依此类推。
从表1看出,情报学高被引论文的平均响应时间明显大于图书馆学,说明图书馆学论文发表后更快得到引用,而情报学论文发表之后不被很快引用的几率大于图书馆学,这又一次说明了情报学的论文影响力延续时间稍长,可能更具有方法论上的持久性。
从图书馆学情报学上述统计数据中可以看到,不到10%的高影响力论文是最先提出某些新的研究主题或研究内容的,大约1/3左右的高影响力论文所研究的内容是在论文发表前1~5年内有其他学者研究过该问题,即研究的是新颖度较高的内容。研究发现:将近一半的高影响力论文所研究的问题是本学科新颖度较高的内容。
3.2.2 基于关键词共现分析的研究主题聚类和分布分析
(1)关键词聚类
情报学百篇高影响力论文共有251个关键词,图书馆学百篇高影响力论文共有294个关键词,采用关键词共现的分析方法,根据关键词间的关系来确定图书馆学和情报学的各自研究主题。首先通过EXCEL对所收集到的关键词进行统计,形成关键词矩阵;其次,通过UCINET软件中自带的关系距离测量分析算法,对情报学和图书馆学关键词进行自动聚类分析。
通过实验测试发现:情报学方面,当自动聚类分为11个小团体时,其相关聚类指数最高,为180.06;图书馆学方面,当自动聚类分为8个小团体时,其相关聚类指数最高,为186。因此上述结果为最优化的聚类,分别以各自聚类团体中中心度最高的关键词为各自聚类的组名,其结果如图4、图5所示。
图4 情报学百篇高影响力论文关键词UCINET自动聚类结果
图5 图书馆学百篇高影响力论文关键词UCINET自动聚类结果
(2)基于关键词被引频次的主题分布分析
在对图书馆学和情报学分别自动聚类的基础上,将各个类中关键词组进行相应的被引频次统计,得出情报学和图书馆学研究主题被引分布情况(见图6)。
图6 情报学(左)图书馆学(右)研究主题被引频次分布
情报学方面,首先,情报学最受关注的主题是信息检索,所占被引频次比例为25%以上,在一定程度上反映了情报学的核心领域仍是以信息检索为主;信息检索这一聚类中所包含的关键词最多,大约占到所有关键词的20%以上,在一定程度上说明其研究内容的覆盖面较大。分析百篇高影响力文献的研究内容发现,“信息检索”所涉及的研究内容主要包括:信息检索的基本理论和模式,信息检索方法、工具和技术的应用,特别是搜索引擎的开发与研究,用户需求和行为研究,信息检索的评价研究,此外还涉及对语义检索和概念检索的相关理论研究等。其次,“情报学、竞争情报、知识管理、文献计量”等也是占据主要地位的研究主题。“情报学”主要涉及其理论体系、研究方法和发展方向的探讨,还有一些在关键词聚类后未能充分体现出来,而被引频次相对较高的研究领域,如知识服务、信息构建等。“竞争情报”涉及其基本理论、分析方法、具体应用等。“知识管理”涉及其相关的理论和范式,但侧重于对方法和技术的研究,如知识管理系统、知识发现、知识地图等。“文献计量”主要涉及基本原理和应用,如科学评价等,另外还包括文献计量学在网络信息环境中的应用等。第三,“信息资源”和“网络信息资源”所强调的侧重点不同,前者研究内容多是从资源的广义出发,对信息资源的概念、配置以及相应的管理机制进行探讨,后者则主要从网络技术环境下的信息资源出发,探讨其特点和管理技术,二者论文比例占到10%以上,体现出信息资源开发和利用在情报学研究中所占的重要地位。最后,“个性化(信息服务)”主要侧重于对个性化信息服务模式和技术的研究;“信息组织”涉及对象和技术的研究;“元数据”涉及数字资源描述和保存的研究;“期刊评价”也是情报学所关注的领域,涉及评价方法和指标体系的研究。从关键词网络中也可以发现,以上几个研究主题都与其他研究主题紧密相关,其中还有不少存在交叉和重合。
图书馆学方面,“图书馆服务”是最受关注的研究主题,结合已有关键词和百篇高影响力论文的内容,可以发现主要涉及图书馆服务的特点及发展方向,重点是对图书馆服务中所包含服务形式的研究,如信息服务、参考咨询服务等,此外还包括对读者行为和个性化需求的研究。“图书馆”这一研究领域也涉及很多方面,主要包括:图书馆的职能、图书馆的发展和改革、图书馆的组织管理、业务建设等,其中还包括图书馆学理论基础和学科发展等内容。“数字图书馆”涉及数字图书馆的定义、特征及相应的技术,如个性化推荐系统、Mylibrary等。“资源建设”和“资源共享”两个研究领域主要是围绕信息资源展开的。“资源建设”涉及文献和网络信息资源的开发与管理,还有对图书馆人力资源、基础设施等资源的建设和管理;“资源共享”主要对各种信息资源进行共享模式和对策的研究,对图书馆联盟建立和发展的研究。“元数据”研究与情报学中的基本内容保持一致。“网络环境”则重点围绕网络发展对图书馆的影响进行研究,其中包括对图书馆2.0和 Web2.0的研究,通过关键词共现网络来看,该研究主题中的许多内容与其他主题存在关联与融合。“图书馆精神”涉及对图书馆职业道德、人文精神等方面的研究。
对比发现,情报学与图书馆学的研究内容和对象分布既存在着较大的差异性,也具有紧密的联系。图书馆学主要从图书馆这一实体机构出发,以图书馆的职能、图书馆所提供的服务以及相关技术资源的建设、数字图书馆等为主要研究内容。情报学的研究内容主要围绕“信息、情报、知识”展开,研究的范围更加宽泛,研究内容体现了学科的综合性,如知识管理、竞争情报等都是多学科共同关注的对象。此外,从研究主题也可以发现图书馆学情报学之间的紧密联系,如元数据、信息资源等是两个学科共同关注的主题。
4 研究结论
4.1 图书馆学情报学学科特征差异
通过对图书馆学情报学百篇高影响力论文进行分析,验证并发现了一些图书馆学和情报学的学科特征差异:
(1)从CNKI收录的图书馆学情报学两类文献数量看,图书馆学比情报学文献数量多出7倍多;从上述高影响力论文的机构分布、研究队伍和研究力量组成、刊物分布、主题聚类等多个方面进行考察,结论为:图书馆学有着庞大的研究队伍,研究内容相对集中,由于其研究对象更多是围绕着图书馆这个核心,所涉及的相关学科和研究内容比情报学的研究范围要窄;而情报学有着较小的研究队伍,但队伍组成更为多元,由于其研究内容围绕着数据、信息和知识展开,所涉猎的学科更多,研究内容分布更广,跨学科的性质更为明显。
(2)从图书馆学情报学所关注的主题看,两个学科都是以应用为主的学科,但情报学更多体现出纯科学的特征,图书馆学的实践性特征更为明显。
(3)从高影响力论文的时间跨度分布看,情报学为27年,图书馆学为14年;从高影响力论文被引的响应时间看,情报学为11.13个月,图书馆学为5.75个月,据此推断,情报学文献的被引老化时间要长于图书馆学。有学者曾经对1972年发表的400篇高被引自然科学文献的老化曲线进行分析,结果是:被引次数较多的文章,得到引用的速度较慢,老化速度也较慢;被引次数较少的文章,得到引用的速度较快,老化速度也较快。由此得到单篇文献被引老化的曲线特征是“快速上升,快速下降”和“缓慢上升,缓慢下降”[19]。本研究的数据只是简单地显示了以下特征:比较而言,图书馆学高被引文献有“快速上升和快速下降”的特征,情报学的高被引文献则有“缓慢上升和缓慢下降”的特征,但这是否能够证明两个学科整体的引用老化特征,还要通过更多的数据来证明。
(4)图书馆学情报学共同关注一些研究问题,对有些问题的研究思路也比较相似,但在大多数情况下,两个学科围绕同一研究内容分析的角度并不相同。图书馆学更多在图书馆服务、图书馆应用、图书馆发展的角度上考察问题,而情报学更多从信息组织、检索和利用的角度上考察问题。比如用户,在图书馆学中考虑最多的是作为图书馆服务对象的用户,而在情报学中考虑的是信息用户,可以是在任何环境和条件下的信息用户。
4.2 高被引文献的特征
通过对图书馆学情报学高影响力论文外部特征和内容进行分析得出的数据,发现高被引文献的特征:
(1)数据显示,在发表后5~10年间的论文得到引用的频次相对较高,与两个学科的差异关系不大。
从高被引论文的新颖度统计数据看,论文被引频次高并不仅仅因为其最先发表了某些新内容或某个新的研究主题,但是被引频次高的论文很多都关注了前沿和热点问题,大多数也是新颖度比较高的论文;反过来看,发表最新内容的论文并不一定能够得到高被引频次。论文新颖度方面,图书馆学和情报学的高被引论文之间差异不大。结论是,高被引论文不完全因为有很多最新的研究内容,除了占据内容先机之外,其引用率还是受论文写作质量的影响。
(2)具有指导性、方法论价值的论文更有高被引的可能。
从图书馆学情报学百篇高影响力文献的写作特征看,具有指导性、前沿性、创新性、方法引领性和体现实操过程的论文能够得到高被引,这是因为它们带来了新领域的信息,指导读者对方法工具的应用,引导读者关注新的趋势,提示读者考察不同对象之间的关系,可能带来更多的后续研究,因而能引起大家的关注和引用。
(3)探索问题广泛、细致、深入的综述性论文更有高被引的可能。
从百篇论文的内容考察看,大多数论文对内容的叙述都深入、细致、广泛,其中一些论文首先提出最新的研究内容,不是浅尝辄止的简陋之作,而是全面、细致地分析了具体内容。很多论文由于深入剖析了原理和方法的来源、理论和实践的内容而受到关注和引用。
4.3 被引频次在学术评价中的应用与建议
由于高被引论文的学术质量总体比较高,所以被引数据可以作为学术评价的标准,但应该综合考虑多个因素,不能绝对进行数量多少的比较。首先,被引频次多少与多个因素相关,学科不同便有明显的差异;其次,高被引论文大多数可以看做是高影响力论文和高质量论文,但高影响力论文和高质量论文不一定是被引最高的论文,不能用简单比较频次多少的方式来直接确定论文的质量。
笔者建议:
(1)可以确定分领域和分时段的前1%被引频次高的论文具有高关注度程度和高影响力,因为有很多人引用直接可以反映其受关注程度和影响力,不管这种关注和影响的原因如何。
(2)将被引频次指标结合期刊的权威性、结合同行评议来对期刊论文的学术质量进行评价具有很高的可信度。
(3)采用被引频次的相对指标而不是绝对指标来对不同类型论文进行学术评价。比如,可以考虑用本学科被引频次的前10%来考察被引文献,比直接用被引频次数据考察要科学。
(4)采用被引频次的区间来考察而不是直接用被引频次多少来考察,因为被引频次能更好地反映统计意义上的规律,而不是简单数字上的规律,确定一个区间比简单确定多少更科学合理。
5 研究局限性和展望
首先,本研究所采用的数据来源于CNKI数据库,根据其对图书馆学或情报学论文的分类来确定被引数据测定的样本,如果CNKI数据库对专业论文属于图书馆学还是情报学的分类标准不是十分科学,便会使选取的高被引论文的样本存在一些误差。
第二,在分析文献的新颖度时,需要确定论文研究的内容并用合适的概念表达,再到数据库中全文查找相关内容是否以前出现过,但论文研究内容、主题和领域的确定有一定的主观性,个别文献新颖度的确定可能会有一定误差。
第三,CNKI数据库中没有收录2003年后《情报学报》高影响力论文的被引数据,笔者从万方数据库中补充了这些论文的被引数据,如果两个数据库的收录内容有差异,这部分论文的被引响应时间就有一定误差。
尽管可能存在上述误差,但本研究考察的多数是统计指标,分析结果反映的是大趋势,所以对分析结果的影响不大。
以后的研究可以进一步扩大研究的样本数据量,对相关问题进行实证。还可在本文提出的思路基础上,对图书馆学和情报学两个学科文献引用老化趋势作曲线分析,考察两个学科文献引用老化趋势所遵循的规律是否符合前述推断。
收稿日期:2012-03-03;修回日期:2012-03-17
通讯作者:周晓英,Email:xyzhou@263.net
注释:
①检索时间:2012年2月14日。