中国核心期刊评价指标体系：演进#183；问题#183；建议_评价指标体系论文

中文核心期刊评价指标体系：演进#183;问题#183;建议，本文主要内容关键词为：指标体系论文,中文论文,核心期刊论文,评价论文,建议论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

最早提出核心期刊的概念可以追溯到1934年英国著名文献计量学家Bradford对文献集中和分散规律的研究[1]，后来人们把他发现的这一规律称为布拉德福定律，把核心区的期刊称为核心期刊[2-3]。Bradford定义的核心区期刊完全是按照期刊发表论文数量而确定的。现阶段，国际、国内科学评价越来越重视期刊质量和影响力评价，不再单纯考虑发表论文的多少；因此，Bradford提出的原始的核心期刊概念已经不能适应当前国内学术期刊评价的需要，但是Bradford文献集中分散定律一直是核心期刊评价的理论基础[4-8]。目前，普遍认可的核心期刊的概念是，刊载某学科(或专业)论文较多，能够反映该学科最新成果和前沿动态，使用率(包括被引率、文摘率、流通率等)较高，学术影响力较大，受该学科或专业读者重视的期刊[9]。

我国的核心期刊研究始于20世纪70年代，经过20年的研究逐渐成型[10]，而成型的标志是1992年第1版《中文核心期刊要目总览》[11](以下简称《总览》)的问世。《总览》的问世，结束了长期以来人为的、主观的期刊评价和科学评价的历史，开创了用文献计量学方法进行期刊评价和科研绩效评价的先河，是科学技术发展到一定阶段的必然产物。正如文献[12]所说：《中文核心期刊要目总览》因其学科核心期刊表具有较好的客观性、科学性和实用性，在学术界奠定了作为重要参考工具的地位，并已形成了一定的权威性；同时，也因其在核心期刊评价理论和评价方法方面的研究进展而积极推动了我国文献计量学研究的发展。

20年来，中文核心期刊逐渐应用于国内科学评价的各个领域，其积极作用是毋庸置疑的；但批评的声音也不绝于耳，主要是针对核心期刊评价指标的选取及指标权重的设置[13-15]和不恰当的应用[16-18]，而更多的是对完善核心期刊遴选提出了建议[19-21]。

下面笔者对中文核心期刊评价指标体系的演进及其存在问题作一阐述，并提出改进建议。

1 《中文核心期刊要目总览》的演进

1.1 指标体系既相对稳定，又与时俱进《总览》第1版于1992年出版，是国内首次开展的大规模核心期刊评价的成果，当时所用评价指标仅有3个，即载文量、文摘量和被引量。2011年第6版《总览》所用评价指标增加到9个。各版次《总览》评价指标构成见表1[9]。

由表1可以看出，从第1版到第6版，核心期刊评价指标体系既相对稳定，又体现了与时俱进。下一版次与上一版次评价指标有较强的延续性，第2版和第3版、第5版与第6版评价指标构成完全相同(指标权重和内涵稍有调整)，体现了评价指标体系的相对稳定。

随着社会的进步，科学技术的不断发展，文献信息技术水平的提高，各类文献数据库不断创立、功能不断完善，期刊数字化、网络化发展和国内科学评价制度的变化，核心期刊评价指标也必然需要完善，评价指标不断增加，体现了评价指标体系的与时俱进。

1.2 指标体系公开透明，入选标准和遴选过程客观公正国内期刊评价系统种类繁多，其中较有影响的有《中文核心期刊要目总览》、中文社会科学引文索引(CSSCI)、中国科学引文数据库(CSCD)、中国科技期刊引证报告(中国科技论文统计源期刊、中国科技核心期刊)。这几大期刊评价系统均定期向社会公布所收录期刊的主要文献计量学指标，如《总览》每一版都公布其研究报告，明确遴选核心期刊所用指标、指标来源及统计方法、各指标所占权重等，严格按照期刊综合得分排序，公布入选核心区的期刊，供各学科具有正高级专业技术职称的专家进行同行评议，进而确定各专业核心期刊。核心期刊评价指标体系公开透明，具有可操作性和可重复性，入选标准和遴选过程客观公正。

笔者所在的《眼科新进展》杂志被1992年版选为核心期刊，而被1996、2000和2004年版剔除，2008年在编辑部全体人员毫不知情的情况下，凭借期刊质量的提高、影响力的不断提升重新入选核心期刊。

1.3 指标体系不断完善，由重数量评价转向重质量和影响力评价核心期刊评价指标体系不断完善表现在以下4个方面。

1)指标数量不断增加，由1992年第1版的3个指标增加到2011年第6版的9个指标。

2)指标内涵更加丰富，更能反映期刊质量和影响力的全貌：不但有反映期刊规模和容量的指标(如载文量、被摘量、被索量)，还有反映期刊质量和影响力的指标(如影响因子、被引量、他引量、基金论文比、Web下载量)；既有绝对量指标(如被索量、被摘量、被引量、他引量、Web下载量)，又有相对量指标(如影响因子、被摘率、基金论文比)；既有引证指标(如被引量、他引量、影响因子)，又有网络传播指标(如Web下载量)，还有信息资源管理指标(如被索量、被摘量、被摘率)。

3)数据来源更加可靠，数据获取手段更加进步，统计数据更加准确、全面。随着国内文献数据库建设的不断发展和完善，核心期刊评价指标基本实现了由完全手工统计逐步过渡到完全从数据库自动获取。

4)及时取消了载文量，适时增加了影响因子等指标。第2版和第3版增加了影响因子及被摘率，增强了对论文学术质量的评价作用，相应降低了发文量的作用。第4版取消了载文量指标，进一步降低了载文量在核心期刊评价中所起的作用，同时增加了他引量指标，适当降低了不恰当自引的作用[12]。第5版又增加了基金论文比和Web下载量。

评价指标体系的演进轨迹基本上体现了中文核心期刊由重数量评价过渡到重质量和学术影响力评价这一评价理念的变化，恰恰适应了目前国内科学评价与期刊评价的需要。如果核心期刊筛选仅仅是为图书情报管理工作者提供期刊订阅的参考，那么它绝对不可能引起学术界如此广泛的关注。我国科学技术发展呼唤科学、合理的学术评价，特殊的国情、民情、社会关系决定了现阶段我国学术评价必须以文献计量学评价为主，同行评议为辅；因此，学术界赋予核心期刊科学评价的功能，是一种无奈而必然的选择，所谓核心期刊功能“异化”[22-25]也同样是无奈和必然的选择。

1.4 评价周期体现了时效性与稳定性的统一根据马太效应“成功产生成功”的原理，学术期刊的品牌和影响力一旦形成将会不断得到强化，如《Nature》(2012年JCR影响因子38.597)和《Science》(2012年JCR影响因子31.027)等国际权威期刊，无论其影响因子是高是低、是升是降，其在国际、国内学术界的地位和影响力是不容易动摇的，国内高水平期刊也是一样，其学术水平具有较强的继承性和延续性。如果评价周期过短，新版核心期刊目录和上一版目录变化很小，势必导致核心期刊评价成本上扬，无谓浪费人力、物力和财力；如果评价周期过长，不能及时捕捉部分期刊质量和影响力的滑坡，其时效性将大打折扣。《总览》自1992年问世到2008年第5版出版，每4年修订1次。4年为一个评价周期，其时效性稍显不足；2年为一个评价周期，又显得修订过于频繁，缺乏稳定性。因此，2011年版修订周期改为3年，既能体现核心期刊的稳定性，又兼顾了核心期刊评价的时效性，体现了核心期刊评价的时效性与稳定性的统一。

2 《中文核心期刊要目总览》存在的问题与改进建议

2.1 关于期刊被引指标自Garfield博士[26]于1963年创办《科学引文索引》(SCI)和创立引证分析理论以来，期刊和论文的引证分析在全球科学评价领域发挥了越来越重要的作用，因此，核心期刊评价中赋予被引量指标较大的权重是完全合理的；但也存在下述问题。

1)部分论文被引量重复计算。自1992年开始，被引量始终是评价核心期刊的重要指标之一，1996年增加了影响因子，2004年又增加了他引量指标，目前中文核心期刊评价指标体系中有3个属于期刊被引指标，其中，他引量重复计算2次(被引量指标中完全包含了他引量)。

2)被引量和影响因子的分子部分没有剔除自引。由于评价指标体系中3个被引指标占有非常大的权重(2011年版医学类核心期刊评价指标体系中，被引量权重为0.10、他引量0.36、影响因子0.30，共0.76)。这3个指标中的被引频次均来源于CSCD数据库，如果不剔除期刊自引量，必将导致核心期刊评价过分依赖于CSCD数据库；因为，只有CSCD数据库来源期刊的自引才可能统计在内，其他期刊的自引无效。张建合等[27]对综合性科技核心期刊的研究结果表明，入选2007—2008年CSCD数据库的75种综合性科技类大学学报全部入选2008年版《总览》。如果再不剔除期刊自引，那么CSCD数据库来源期刊的自引将更加普遍，对其入选核心期刊也必将发挥更大的非正常作用。

3)始终缺少被引率指标。理论上讲，如果某期刊在任何一个核心期刊评价周期内都能发表一两篇被引频次极高的论文，哪怕其他论文都没有被引用，那么该刊仍然可能始终是核心期刊。就像SCI数据库收录的《Cancer Journal for Clinicians》(临床医师癌症杂志)，自2005年以来其影响因子一直排在第1位，原因就在于该刊每个影响因子计算周期内均有两三篇极高被引论文。2013年6月19日发布的该刊2012年影响因子高达153.5。对该刊影响因子贡献被引量最多的仅有3篇论文[28-30]，这3篇论文2012年被引频次分别为2314、1688和667，为该刊贡献影响因子达126.189，被引频次排在第4位的论文，其被引频次仅为107次。美国汤森路透科技信息集团2011年创办的专门用于科学评价的又一引文分析工具InCites数据库就引入了论文被引率[31]。增加论文被引率指标有利于遏制部分期刊“以量取胜”恶性发表论文的倾向。

4)增加博士、硕士论文引用量非常必要，而统计会议论文引用频次实属多余。2011年版评价指标体系中，被引量的计算增加了期刊被博士、硕士论文和会议论文引用的数量。被博士和硕士论文引用，能够反映期刊的学术水平；而被会议论文引用则比较复杂，一是国内学术会议过多、过滥，引用文献过于随意，二是高水平会议论文大多会在期刊上发表。如果核心期刊评价计入会议论文引用频次，那么会议交流的论文再在期刊发表，其引文将重复计算。

建议改进措施如下：1)取消被引量，保留他引量和影响因子，增补被引率指标；2)取消会议论文引用量，保留博士、硕士论文引用量；3)所有被引指标(被引率和影响因子)中的被引频次均剔除期刊自引，即以他引影响因子代替现有的影响因子，被引率只计算被其他期刊的引用率(被他引率)。

2.2 关于绝对量指标与相对量指标绝对量指标是指某项目的直接统计量，而相对量指标指2个指标相除所得的商数。相对量指标的最大优点是便于比较分析，便于表明统计对象的相互联系和发展程度[32]。现有的9个评价指标中，被索量、被摘量、被引量、他引量、Web下载量、获奖或被重要检索工具收录等均属绝对量指标，相对量指标仅有被摘率、影响因子和基金论文比。可以看出，该指标体系中绝对量指标过多，相对量指标过少。虽然绝对量指标在揭示期刊学术影响力方面也有重要作用，但要评价期刊的学术质量还是应该多用相对量指标，而少用绝对量指标。绝对量指标过多是某些学术质量一般甚至很差的期刊得以入选核心期刊的主要原因(这些期刊的普遍特征是载文量非常大，论文录用率非常高，录用和发表非常及时，收取版面费较高)。

建议改进措施如下：1)尽量减少绝对量指标，以相对量指标替代某些绝对量指标，如以被索引率替代被索量，被摘率替换被摘量；2)取消“获奖或被重要检索工具收录”，原因是“获奖”所指的国家期刊奖已不再举办，其他奖项又缺乏可比性，而“被检索工具收录”所涉及的内容在期刊的被引量、被引率和影响因子等指标已有反映，再作为一个独立的评价指标是不恰当的。

2.3 关于期刊下载量指标刘雪立等[33]的研究结果表明，下载量与被引频次相比能够更早地反映期刊和论文的学术价值，使得论文下载次数能够作为论文价值的快速反映。国内学者已经建立的下载量指标包括文献[34]提出的下载量即年指标，文献[35]提出的下载量半衰期和文献[36]提出的下载频次h指数等。

今后的核心期刊评价应该合理地反映信息资源载体和信息资源获取手段发展变化规律，合理反映下载量相关指标在学术期刊质量和影响力评价中的作用；因此建议再增补一个下载量相关指标，如论文篇均下载量(Web即年下载率)，或者直接用Web即年下载率代替Web即年下载量。

2.4 其他被引量相关指标权重过大，下载量相关指标权重太小；因此，建议适当降低被引指标权重，提高下载量相关指标权重，这将在一定程度上纠正应用性和技术性较强的期刊(这类期刊往往因其较高的应用价值容易获得较高的下载量，而不容易获得较高的被引量)不易入选核心期刊的不当倾向。不同学科领域各指标权重不尽相同，因此，建议根据各学科领域的特点作出适当调整。但是，下载量一旦成为重要的评价指标，其人为操纵将更加容易，而且隐蔽性也更强；所以，只能是适当增加下载量相关指标权重。

建议明确一些“一票否决”标准。经过对提交专家评价的部分学科核心期刊和最终确定的核心期刊名单的简单对比，笔者认为中文核心期刊评价过程中一定有相应否决的标准，只是研制报告中未明确说明而已。建议今后修订时，明确提出一些“一票否决”标准，如发现较严重政治性差错者、严重违反出版管理条例及相关法律、法规者，严重违规收费或收取高额版面费者，载文量高得离奇者，比如超过本学科其他期刊载文量均数加2个标准差。

2013-09-23修回

标签：评价指标体系论文; 影响因子论文; 中文核心期刊论文; 中文核心期刊要目总览论文;

中国核心期刊评价指标体系：演进#183；问题#183；建议_评价指标体系论文

猜你喜欢