图情领域h指数计量工具比较分析,本文主要内容关键词为:指数论文,领域论文,工具论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
自2005年美国物理学家乔治·赫希[1]首次提出h指数以来,国际科学界就给予了广泛的关注,很快成为信息计量学和学术评价研究的前沿领域之一。不仅Nature和Science对h指数有所报道,而且信息计量学专家和情报学专家纷纷撰文,对h指数进行了多方面和多层次的理论研究和应用研究。但由于国内外h指数计量工具所收录数据、检索途径和检索功能各不相同,对同一学者使用不同数据库,h指数的测算结果存在较大差异。因此,有必要明确国内外h指数主要计量工具的适用范围、准确度及便利度,以便能更好地将h指数应用到图情领域的评价中去。笔者详尽搜集各计量工具的信息,结合具体检索数据综合分析比较各计量工具的特点,以便用户在使用时能有一个客观的选择。
1 图情领域h指数计量工具简介
1.1 国内数据库
●中国引文数据库
中国引文数据库(Chinese Citation Database,简称CCD),由中国学术期刊电子杂志社开发制作,是国内唯一可以进行所有学科专业引文检索的综合性数据库。
●中文社会科学引文索引
中文社会科学引文索引(Chinese Social Sciences Citation Index,简称CSSCI),由南京大学研制,是我国第一个人文社会科学引文数据库。
●中文科技期刊引文数据库
中文科技期刊数据库引文版(以下简称CQVIP)由重庆万正医网有限公司以全文版为基础开发而成,是目前国内检索期刊种类最多的引文数据库。
●万方数据知识服务平台期刊子系统
万方数据知识服务平台期刊子系统(以下简称WF),是万方数据知识服务平台的重要组成部分。
1.2 国外数据库
●SSCI数据库
SSCI(Social Sciences Citation Index,社会科学引文索引)是美国科技情报所(ISI)编辑出版的三大引文索引之一,是国际上社会科学领域期刊最重要的检索与评价系统。
●SCOPUS数据库
Scopus数据库是著名的Elsevier公司于2004年底推出的一个独具特色的多学科文献信息数据库,其核心在于它是目前全世界最大的摘要和引文数据库。
1.3 网络学术搜索
●期刊界学术搜索
期刊界(以下简称AJ)由北京勤云公司开发,号称是全球第一期刊垂直搜索网站。
●Google学术搜索
Google Scholar(以下简称GS)是Google公司推出的世界上第一个针对学术期刊、论文、著作、摘要的免费学术搜索引擎。
●QuadSearch科学搜索
QuadSearch搜索引擎是一个元搜索引擎,由塞萨洛尼基亚里士多德大学数据工程实验室Raptor网络服务商主持。
2 图情领域h指数计量工具比较
2.1 h指数计量工具收录数据比较
收录数据是数据库检索的基础,是保证h指数测算准确性的资料来源。作为引文检索工具应该有丰富的统计源,如果来源数据过少,那么编入该计量工具的引文款目也少,用户能够查找到的引用情况就不全面,这将直接影响到h指数测算的可靠程度。这九个h指数计量工具所收录图情文献在期刊种类、文献类型、更新周期等方面各具特色。见表1。
由表1可以看出:
①CCD、CQVIP、WF、SCOPUS、AJ、GS和QS综合收录所有期刊,CSSCI和SSCI则只收录社科类学术期刊。可见图情领域h指数计量工具的性质主要是综合类数据库或社科类数据库,这是由图书情报学的学科性质决定的。h指数计量工具性质的不同直接或间接地影响了图情类文献的查全率、被引频次,从而导致h指数的测算结果存在差异。
②各计量工具对图情类文献收录时间存在着明显的差异。国内数据库CCD收录了1979年以后的数据,CQVIP则收录了1989年以后的数据,而CSSCI和WF仅有1998年以来的资料;国外数据库SSCI收录了1956年以后的数据,而SCOPUS则只收录了1996年以后的资料;AJ、GS和QS几个学术搜索引擎收录数据的时间范围基本不限。由此可见,如果要评价青年学者的学术成就,各计量工具基本上都可满足其h指数测算的要求,而要综合评价杰出学者的学术成就时则应选择收录图情类文献时间跨度较大的CCD、CQVIP、SSCI、AJ、GS和QS。
③国内数据库中,CSSCI对来源期刊选择最为严格,2008年收录图情类期刊18种,且来源期刊有效期为1年。国外数据库中,图书馆学情报学是SSCI收录的一个重要学科,其图情类期刊收录量一直稳定在55-60种左右。用户在进行图情领域h指数测算时,若想结果具有权威性,则选CSSCI和SSCI;若要结果具有全面性,则用CCD、CQVIP、WF、SCOPUS、AJ、GS和QS。条件许可时,不妨结合使用两类数据库,对检索结果会互有补充,这样测算出来的h指数也更加准确。
④就图情领域而言,除期刊论文外,图书也十分重要,且被引次数往往超过期刊论文。但就目前收录图情类图书较多的几个计量工具来看,只有CCD和CSSCI表现颇佳,而GS和QS则存在着查全率不高的问题,使得图书类图情文献的影响力在h指数的计算中并没有得到充分展示。至于CCD、CSSCI、SSCI和SCOPUS中所收录的会议论文和学位论文类图情文献在h指数的测算中更是几乎不产生任何影响。因此目前测算一个图情学者的h指数,期刊类图情文献是其最主要的测算依据,但对杰出学者来说,其他类型图情文献对h指数计算有时影响却很大。
⑤国内数据库CCD、CSSCI、CQVIP和WF以及学术搜索引擎GS、QS和AJ可用于中国图情领域h指数的测算,而要测算国外图情领域的h指数则要选择国外数据库SSCI和SCOPUS以及学术搜索引擎GS和QS。可见只有学术搜索引擎GS和QS能同时测算国内外图情领域的h指数。
⑥计量工具数据更新的周期直接关系能否查检到最新的引文数据,从而对h指数的测算产生影响。就国内图情领域h指数的测算而言,CCD数据及时日更新而优于其他年更新、周更新的数据库;而SCOPUS数据及时日更新的特点可以作为选择国外图情领域h指数计量工具优先考虑的一个重要因素。
2.2 h指数计量工具检索途径比较
h指数计量工具如果能够提供多种检索途径,有利于用户进行多方位的检索,则不仅能使h指数测算的准确性及便利性得到提高,而且大大拓展了h指数在图情领域的适用范围。见表2。
由表2可以看出:
①CCD提供31个检索字段,其中来源文献提供了18个检索字段,被引文献提供了13个检索字段;CSSCI提供23条检索字段,来源文献提供了16个检索字段,被引文献提供了7个检索字段;CQVIP共有14个检索字段,来源文献提供了10个检索字段,被引文献提供了4个检索字段;WF共有21个检索字段,来源文献提供了12个检索字段,被引文献提供了9个检索字段;SSCI提供33个检索字段,来源文献提供了17个检索字段,被引文献提供了16个检索字段;SCOPUS提供40个检索字段,来源文献提供了21个检索字段,被引文献提供了19个检索字段;AJ提供33个检索字段,来源文献提供了20个检索字段,被引文献提供了13个检索字段;GS提供15个检索字段,来源文献提供了8个检索字段,被引文献提供了7个检索字段;QS提供13个检索字段,来源文献提供了7个检索字段,被引文献提供了6个检索字段。可以看出,在国内图情领域h指数的计量工具中,引文文献检索字段较多的是CCD和AJ,而SSCI和SCOPUS是引文文献检索字段最多的国外图情领域h指数计量工具。
②h指数计量工具引文文献检索途径的多样化对于h指数的测算很重要,不仅可以通过组配检索使得h指数的测算更加准确方便,而且可以大大拓展h指数的应用领域。既可以测算作者的h指数,还可以测算期刊、机构、地区、出版者、基金、研究热点等更多类型的h指数。因此,引文文献检索途径较多的CCD、SSCI、SCOPUS和AJ可测算的h指数的类型也更多。但引文文献检索途径较少的CSSCI、CQVIP、WF、GS和QS对某种类型的h指数测算仍具有各自的优势。
③可用于测算国内图情领域h指数的计量工具中,CCD和AJ提供的引文文献检索途径最多,因此CCD和AJ是测算国内图情领域h指数类型最多的两个计量工具;可用于测算国外图情领域h指数的计量工具中,SSCI和SCOPUS提供的引文文献检索途径最多,因此SCOPUS和SSCI是测算国外图情领域h指数类型最多的两个计量工具。
④Hirsch对h指数的定义,并没有明确测算的是作者h指数还是第一作者h指数。就图情领域学者的个人成就评价而言,随着图书情报学研究与其他学科之间合作的日益密切,作者h指数究竟能在多大程度上体现第一作者的h指数还需大量的实证研究。目前,能进行图情领域第一作者h指数测算的计量工具只有CCD和SCOPUS,其它计量工具进行第一作者h指数的测算需手工排除非第一作者的文章,有时工作量较大。
⑤CSSCI、CQVIP、SCOPUS、AJ、GS和QS引文文献检索都有任意字段检索入口,可以通过文献全文中的任意一个检索字段来进行检索,因此在理论上可以测算更多类型的h指数。但是在测算某些类型的h指数时,存在着数据量过大、查准率不高的缺点,h指数测算过程较为繁琐,准确性和可靠性也大大降低。
2.3 h指数计量工具检索功能比较
为了保证数据库的检索效率,数据库一般都提供较周全的检索功能。检索功能是否全面对消除各种影响因素对h指数测算的不良干扰有着重要意义,会大大提高h指数测算的便利性及准确性。表3从检索方式、检索限定、检索结果、检索结果排序、检索结果保存等方面对h指数计量工具进行比较。
由表3可以看出:
①各计量工具不仅都提供初级检索和高级检索两种检索方式,有的还提供学科导航。CCD、CQVIP、SSCI、SCOPUS、GS和QS都支持布尔逻辑中的“与”、“或”、“非”的关系,而CSSCI、WF和AJ只支持“与”、“或”的关系;CSSCI、CQVIP、WF、SSCI和SCOPUS都支持二次检索,而CCD、CQVIP、WF、SSCI、SCOPUS、GS和QS提供了对检索结果的文献类型、学科、时间等的限定性检索;CSSCI、SSCI、SCOPUS和QS还提供字典检索功能用以提高查全率和查准率。作者的重名问题严重影响了h指数的测算,而各计量工具所提供的布尔逻辑检索、二次检索、字典检索等检索功能很好地减少了重名问题对于作者h指数的影响,大大提高了h指数测算的准确性和便利性。
②对图情领域的杰出学者而言,由于其学术产出质量和学术影响力都已相对稳定,自引次数排除与否对其h指数值影响不大。但对处在学术上升期的青年学者而言,h指数值受自引次数的影响比较大[2]。同时,如果对特定文献施加自引,更容易影响h指数[3]。因此自引仍是我们评价图书情报学学者学术成就时不得不考虑的重要因素之一。各计量工具中能自动排除自引只有CSSCI、SSCI、SCOPUS和AJ,而CCD、CQVIP、WF、GS和QS则需手动排除自引,在进行h指数测算时比较费时费力。
③Rousseau继Hirsch之后给出了h指数的操作定义:将某学者的论文按照被引次数从高到低的顺序排列,相同被引次数的论文具有不同的序列号,当且仅当排序前h篇论文每篇论文的被引次数至少为h,同时排序第h+1篇论文的被引次数小于h+1时,该学者的h指数为h[4]。可见,如果计量工具能直接给出某学者论文的篇被引次数并能按被引次数排序的话,将给h指数的测算带来很大便利。CCD、CSSCI、WF、SSCI、SCOPUS、AJ、GS和QS都能自动统计某学者论文篇被引次数并能按被引次数排序。而CQVIP不能自动统计篇被引次数,只能根据其引用文献的详细信息人工计算其被引次数,工作量相当大。
④国内引文库CCD在论文与引文统计分析和评价功能方面表现颇佳,其统计报告提供作者、期刊、机构、专题、基金和出版者的各种统计指标和作者、期刊、机构等h指数值及h指数名次;国外引文库SSCI的引文报告和SCOPUS的引用跟踪功能则给出了引文的某些统计指标和h指数值;而网络学术搜索引擎QS也具有提供常用统计指标和h指数值、g指数值的功能。
⑤计量工具的检索结果一次可保存多条记录,能提供多种输出格式,甚至可保存到参考文献管理软件,这给h指数的测算带来了较大的便利。CCD、SSCI和SCOPUS的结果保存功能最为全面。
3 结论
通过对图情领域九大h指数计量工具的比较分析及笔者的检索实践,可以得出以下结论:
①这九个计量工具都具有文献与引文的检索功能,是目前图情领域h指数测算中不可或缺的重要工具。表4给出了图情领域h指数计量工具的主要适用性分类。由表可见,CCD、CSSCI和AJ是测算国内图情领域h指数首选的计量工具,而要测算国外图情领域的h指数,SSCI和SCOPUS则是最好的选择。但是各计量工具相互之间没有包含与被包含、替代与被替代的关系,在收录数据上互有补充,在检索途径上各有特色,在检索功能上可相互借鉴,在检索效果上各有优缺点。因此对测算图情领域某种类型的h指数究竟哪个计量工具最好还要视具体情况而定,本研究仅提供综合评价供参考。
②CCD、SSCI、SCOPUS和QS都直接提供h指数,h指数已成为其常用的统计指标之一。自引、重名、合作、可访问数据的回溯深度、选择的入库时间等因素直接影响了其提供的h指数值的准确性。因此如果把各计量工具直接提供的h指数值来作为评价某学者学术成就的标准时,则应慎重考虑。
③对于任何一组有意义的最小值为零的数据来说,都可以计算其h指数,并且在某种意义上,h指数的分值都可以与自然排序进行比较[6]。正是由于这种普遍性,h指数同样可以在图情领域获得更多的应用。CSSCI、CQVIP、GS和QS主要用于测算图情领域作者、期刊的h指数,CCD、WF、SSCI、SCOPUS和AJ除了可测算作者、期刊的h指数外,还可测算图情领域机构、研究热点、基金等的h指数。
④CCD、CSSCI、CQVIP和WF是目前中文图情期刊引文文献检索中的重要引文数据库,但与国外大型检索工具SSCI和SCOPUS相比,检索功能上仍存在一定的差距,将不利于消除影响h指数值的诸多不利因素。各中文引文数据库若能在检索功能上努力与SSCI和SCOPUS接轨,将会有助于提高测算国内图情领域h指数的准确性和便利性。
⑤为了解决h指数的缺点,人们提出了众多的h指数变体,其中包括a指数、g指数、r指数、ar指数等。Bornmann认为诸多改进型h指数可以分为两种基本类型:能够更好地反映核心作品集质量的指数和能够更好地反映核心作品集的影响力的指数。评价学者成就的最佳办法就是从每一类别中选择一个指数同时综合使用[5]。目前基于Google学术搜索引擎名为Harzing’s Publish or Perish的软件已尝试将g指数、e指数等改进型h指数作为常用统计指标提供给用户。但正如Bornmann所说,更少的h指数变体是必要的,利用各种计量工具进行图情领域大规模的实证研究以发现最佳的改进型h指数组合,这也许正是今后图情领域h指数研究需要努力发展的方向。