机构知识库的计量服务研究:AltMetics与WOS的集成_机构知识库论文

机构知识库的计量服务研究:Altmetrics与WOS的集成,本文主要内容关键词为:知识库论文,机构论文,WOS论文,Altmetrics论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      DOI:10.13663/j.cnki.lj.2015.10.013

      2014年5月15日国家自然科学基金委员会和中国科学院联合发布了其各自的开放获取政策[1-2],要求接受公共资助和自然科学基金资助的项目所产生的论文必须强制性开放获取,在论文发表时需要将同行评议后录用的最终版本论文存储到国家自然科学基金委员会或中科院所属机构的知识库中,并不晚于发表后12个月内进行开放获取。这个强制性的政策将国内开放获取运动推向了高潮,标志国内开放获取运动取得实质性进展。

      目前各高校机构知识库建设时遇到的主要问题之一就是全文获取的问题,很多高校采用元数据公开访问,而全文以DOI方式链接到全文数据库或者限制只在校园IP范围内进行访问来解决全文获取的问题[3],这大大降低了机构库的效益,也违背了开放获取的精神。自然科学基金委员会和中科院的强制性开放获取政策的实施解决了困扰机构库发展的全文获取问题,将大大推进高校机构知识库的深入发展。

      高校机构知识库建设过程中碰到的另一个问题是可持续发展问题。随着前几年开放获取运动在国内的发展,各高校大多都建立了机构知识库,但是很多机构知识库建设工作断断续续,还停留在初期阶段,缺乏持续推进的措施和政策。为了解决机构知识库建设的可持续发展问题,全球机构知识库联盟(Confederation of Open Access Repositories,COAR)调查并总结了全世界受欢迎机构知识库在这方面的措施和实践,为其他机构知识库建设提供参考和借鉴。COAR从八个方面总结了全世界机构知识库可持续发展的措施[4]:宣传、机构强制、计量、收集与存储服务、研究档案、机构档案、出版商协议和直接存储等。解决机构可持续发展的问题是一个复杂的过程,本文主要关注的是计量方面的实践。本文将主要探讨Altmetrics指标与WOS服务在国外机构知识库中的应用和实践情况,为国内机构知识库的可持续发展提供借鉴和参考。

      1 Altmetrics指标在国外机构知识库的应用实践

      1.1 Altmetrics与机构知识库

      Altmetrics指标主要是用来衡量网络环境下学术研究的影响力。Altmetrics扩展了传统意义上对学术影响力的理解,为学术研究的影响力提供一个新的视角[5]。传统意义上被经常用来衡量学术研究影响力的指标是引用次数,如文献或作者的被引频次、期刊影响因子等。基于引文的评价机制存在很多问题:如时间滞后、自引、负面引用等,并不能全面反映学术研究的影响力。Altmetrics指标所反映的影响力不仅包括引用次数,还包括被其他社交平台的收藏、分享、提及等行为所反映的影响力[6]。Altmetrics这个词是北卡罗来纳州大学教堂山分校的图书情报博士生Priem Jason于2010年在其Twitter上首次提出的[7]。

      机构知识库建设的目的之一就是增加文献的可见性,从而提高文献的被利用的几率,进而促进研究人员向机构库提交更多的学术作品。目前机构库经常使用点击次数和下载次数来反映文献的被利用的程度。通过向研究人员和管理机构展示文献的使用统计情况来说明机构知识库建设的意义和价值。近年来,随着新的计量方式Altmetrics的兴起,国外越来越多的机构将Altmetrics指标集成到现有的机构知识库中以补充目前使用统计数据的不足。对于机构库来说,Altmetrics指标反映了文献在网络环境下被利用的情况和价值,这对传统的使用统计是一种补充。在2014年由西班牙国家研究委员会下属的网络计量学实验室(Cybermetrics Lab)发布的全世界机构知识库排名中也加入了Altmetrics指标[8]。

      1.2 Altmetrics嵌入机构知识库的实例

      根据笔者对有关文献的调研,发现目前已有大学的机构知识库使用了Altmetrics指标,如表1所示。从表1可知,Altmetrics指标可以集成在目前主流的机构知识库平台上,包括DSpace、EPrints、Fedora、Digital Commons等软件平台。与机构库进行集成的Altmetrics工具主要是Altmetric.com[9],少部分机构库使用了Altmetrics计量工具:plumx[10]。目前Altmetric.com和Plum Analytics的集成都是文献级别的,都显示在机构库文献的详细信息页面。图1~3分别显示了昆士兰大学机构库[11]和匹兹堡大学机构库[12]集成Altmetric.com和Plum Analytics的效果。卧龙岗大学的机构知识库[13]则集成了Altmetric.com和Plum Analytics两个工具,不过Plum Analytics目前还没有在其页面上显示。

      

      

      图1 昆士兰大学机构知识库集成Altmetrics计量工具:Altmetric.com

      

      图2 机构库上点击Altmetric按钮后显示该文献的影响力(Altmetric.com工具)

      1.3 Altmetrics嵌入机构知识库的技术实现

      从表1可以看出,在机构库中集成Altmetrics的工具主要是Altmetrics.com和Plum Analytics。此外,还有两个比较常用的Altmetrics工具是:Impactstory[14]和PLOS[15]。可能由于Impactstory的技术文档少并且主要针对研究学者,所以很少机构库集成Impactstory计量工具。PLOS则是开放获取期刊的先驱,它首次提出针对文献级别的计量(Article-Level Metrics)并开放所有文献的影响力原始数据,有详细的API和技术指导文件,不过它只针对PLOS的文献。一个机构库中包含PLOS的文献比例较低,所以将其集成的意义不大。本文主要研究Altmetrics.com和Plum Analytics的集成。

      1.3.1 Altmetrics.com工具的集成

      Altmetric.com将其影响力指标分为四类[16]:①社交媒体影响力;②在线文献管理软件的下载数据;③主流新闻媒体的数据;④出版商的下载数据。每类下面都有不同的计算指标,从不同的数据源收集数据,包括Twitter,Facebook,Google+,Sina Weibo,LinkedIn groups,Mendeley,CiteULike,Blogs,news等。这里需要注意的是,Altmetric.com是一个计量Altmetrics的商业化的公司,只是Altmetrics工具的一种,并不是一个权威的标准的Altmetrics计量工具。Altmetric.com虽然是一个商业的公司,但是其公开了API并在非商业使用的情况下是免费的。

      Altmetric.com提供了两种途径将其与机构知识库进行整合[17],这两种途径在非商业使用的情况下是免费的。一种途径是通过其API调用的方式进行,另一种是通过图标嵌入(Altmetric Badges)的方式。在机构库中集成API是免费的,但是需要向其公司进行申请API Keys。通过图标嵌入的方式则无需申请API Keys,并且实施也相对简单,只需要在相关页面加上一段Javascript脚本即可。印第安纳大学就是利用图标嵌入的方式将Altmetric.com集成到其机构库中,并且在其图书馆的Wiki上面还详细展示了嵌入时需要修改的DSpace代码、配置文件以及注意事项,为其他机构提供了可操作性的示例。图标嵌入需要在文献信息显示页面包含一个唯一标识符,如DOI(Digital Object Identifier,数字对象标识符),arXiv ID,Handle,PubMed ID,Altmetric ID等。Altmetric.com集成后的效果如图1和图2所示。

      1.3.2 Plum Analytics工具的集成

      Plum Analytics的影响力指标主要分为五类[10]:①使用影响力;②捕获影响力;③提及影响力;④社交媒体影响力;⑤引文影响力。每个分类下面都包含不同数据来源的计算指标,Plum Analytics网站详细列出了这五个影响力分类下各个计算指标以及数据来源。Plum Analytics公司2014年被数据库商EBSCO收购,因此Plum Analytics的指标也包含了来自EBSCO数据库的使用数据。

      Plum Analytics也提供了两种方式来集成文献级别的计量[18]:一种是API,另一种是组件嵌入(PlumX Widgets),其中,API是收费的,组件嵌入是不收费的。组件嵌入方式相对较简单,Plum Analytics网站详细列出了组件嵌入的方法和代码。组件嵌入方式也需要匹配文献唯一标识符,包括DOI,arxiv id,pmid等。匹兹堡大学机构库嵌入了Plum Analytics计量工具,效果如图3所示。

      

      图3 匹兹堡大学机构库集成Altmetrics计量工具:Plum Analytics

      2 WOS服务在机构知识库中的应用实践

      2.1 机构知识库嵌入被引频次指标

      除了点击次数、下载次数、Altmetrics指标外,衡量机构知识库中文献影响力的另一个指标就是被引频次,这也是目前普遍得到认可的评价指标,尽管这个指标也存在一些缺点。通过将被引频次集成到机构知识库中,一方面方便作者及时了解文献的被引情况,另一方面帮助用户筛选高质量的文献。已有研究表明,将文献开放获取可以增加文献的被引频次。在机构库中增加被引频次可以让作者更加清楚地了解到文献的利用情况,促进更多学者将学术文献存入机构知识库中。同时也方便管理者了解机构库的影响力,增加机构库的价值,持续推动机构知识库的发展。

      在表1的基础上,笔者对这些大学机构库的被引频次服务进行了调研,结果如表2所示。昆士兰科技大学[19]、昆士兰大学[20]和香港科技大学[21]的机构库嵌入三大索引数据库的效果如图4~6所示。调研结果发现美国高校的机构库很少集成被引频次,即使那些集成Altmetrics的高校机构库也是很少展示文献的被引频次,而澳大利亚两所著名的高校不仅嵌入了Altmetrics指标,而且还嵌入了被引频次服务。中国的香港科技大学和香港大学的机构库也嵌入了文献被引频次。澳大利亚和中国香港的机构知识库集成被引频次的较多,美国高校集成的较少,也许是因为在这些地区高校的评价体系中,被引频次占的比重比较大,研究人员对这些指标较为关注,而在美国高校的评价体系中同行评议的比重较大。

      

      

      图4 昆士兰科技大学机构库集成三大索引数据库

      

      图5 昆士兰大学机构库集成三大索引数据库

      

      图6 香港科技大学机构知识库集成被引频次

      

      2.2 WOS服务嵌入机构知识库的技术实现

      目前提供文献被引频次服务且被普遍认可的索引数据库主要有三个:汤森路透的Web of Science(WOS)、爱思唯尔的Scopus以及Google Scholar。由于目前中国大陆订购Scopus数据库的高校较少,使用Scopus API必须订购其Scopus数据库,所以本文不讨论Scopus在机构库中的集成。Google Scholar目前并不提供单独获取被引频次的API,因此只能通过URL构造的方式来集成,用户需要点击Google Scholar按钮来跳转到Google Scholar的检索结果页面来查看文献被Goolge Scholar引用的情况,这种集成方式比较简单。中国大陆常用Web of Science来作为评价工具,而且订购该数据库的用户较多,因此本文将讨论在机构库中嵌入Web of Science的实现方式。本部分的内容主要参考了汤森路透的两个技术文档:Web of Knowledge Web Services Lite v.3.0和Thomson Reuters Links Article Match Retrieval Service Version 1.5,当这两个服务得到授权后,这两个文档才能通过用户名和密码获取,因此无法提供链接地址,特此说明。

      汤森路透对购买Web of Science产品的用户免费提供Web Services和API服务[22-23],不过这两项服务需要申请才能使用。申请时需要填写一个校园范围内的IP地址,并且只能通过该IP地址的服务器来访问其Web Services服务和API服务。Web of Science提供的Web Services主要是用于检索SCI、SSCI等索引数据库中的数据,检索结果以XML格式进行返回,并且每次请求返回的检索结果不超过一百篇文献。在返回的结果集中包含了文献的基本信息,如题名、来源出版物、作者、卷期页、出版时间、关键词、ISSN、DOI等,不包含被引频次和该文献在Web of Science中的链接地址等信息。而对于机构知识库来说,最重要的是能够获取文献在WOS中的被引频次。因此,不能使用Web of Science的Web Services服务来实现WOS服务在机构库的集成。

      除了Web Services外,Web of Science还提供链接文献匹配检索服务(Links Article Match Retrieval Service,Links AMR),该服务是通过API来获取Web of Science核心集合和JCR中的相关数据,检索结果也是以XML的格式返回,并且每次请求返回的文献数量不能超过五十篇。文献匹配检索服务能够实时获取Web of Science中文献的书目数据,包括被引频次、DOI、链接URL、引用该文献的URL和相关文献URL等信息,具体返回的数据元素如表3所示。因此在机构库中集成WOS服务,展示文献被WOS引用的次数,链接到Web of Science文献信息显示页面,必须使用文献匹配检索服务。

      在实现机构库中集成WOS服务的过程中,要想获得表3中的数据,必须向Web of Science发送一个HTTPS post请求,并且在请求中包含想要查询文献的必要信息,请求需要提供的数据元素如表4所示。表4将发送请求的元素分为两类:一类是标识符元素,另一类是书目数据。在发送的每次请求中一般至少包含一个标识符元素,书目数据元素是可选的。当一个请求中不包含任何标识符元素时,为了确定唯一文献,则必须包含四个书目数据:期刊题名+卷+期+开始页码或者文献号码。对于机构库来说,一般使用DOI来获取文献在Web of Science中的被引频次和相关链接地址。文献匹配检索服务能实时返回检索结果,这样就可以及时获得最新的文献被引频次数据。为了避免因频繁地向Web of Science服务器发送请求而造成服务器拒绝请求响应的情况发生,最好在机构库本地数据库存储如表3所列出的文献信息中。在本地表中存储被引频次等信息既可以减少请求被拒等错误的发生,也可以提高机构库获取被引频次等信息的速度,提高机构库的用户体验。因为Web of Science中文献被引频次是每周五进行更新,所以本地被引频次等信息的存储表只需要每周更新一次即可。

      

      3 总结

      随着国家强制性开放获取政策的实施,为解决国内机构库的内容建设问题和版权问题提供新的契机,国内机构知识库将迎来新的发展阶段。促进和维持知识库的可持续发展问题将是国内机构库需要重点解决的问题,本文介绍了机构知识库在计量方面的增值问题,探讨了新计量方式Altmetrics和Web of Science在机构库的集成,以期能为相关机构提供参考。

标签:;  ;  ;  ;  ;  

机构知识库的计量服务研究:AltMetics与WOS的集成_机构知识库论文
下载Doc文档

猜你喜欢