我国图论与形势领域测高学研究的回顾与展望_用户研究论文

我国图情领域Altmetrics研究评述及展望,本文主要内容关键词为:领域论文,国图论文,Altmetrics论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       中图分类号 G350 文献标识码 A 文章编号 1002-1965(2016)04-0131-06

       DOI 10.3969/j.issa.1002-1965.2016.04.024

       0 引言

       随着数字化时代的到来,科学研究事业的发展正在呈现出两大趋势:“在线”和“开放”,即科研活动不再局限于相对封闭的线下模式,越来越多的研究人员和服务机构加入到在线科学交流活动中来,通过在线工具/平台检索、获取、管理和利用学术资源已成为实现价值的另一条重要途径。Web2.0时代的在线科学交流模式拓展了研究成果传播的广度和深度,提高了研究成果利用的速率和效率,也为以人为中心的学术生态系统注入了新的活力元素[1]。随之而来的一个现实问题激发了学界的研究兴趣,传统的文献计量指标已经难以满足日益增长的科研评价需求,以引用指标为黄金准则的单一评估制也遭到了部分学者的质疑。虽然新的指标不断被提出,但无一能够真正突破影响力评价的传统逻辑。2010年,Altmetrics应时而生,全新的概念迅速吸引各界的关注目光,短期内即升级为学术前沿并于2011年舶入国内。为了总结现状,启迪创新,将相关研究引向深入,本文将通过文献调研和内容分析等方法对国内Altmetrics研究进展进行深入的解读与分析并在此基础上提出几点研究展望。

       1 理论研究

       1.1 译名之争及其界定 作为新生事物,Altmertics自诞生至今不过5年多的时间,但其学术张力早已显现,在学界和业界的共同关心、支持和推动之下,Altmetrics迅速发展成为国际图书情报学、科学计量学以及相关学科的研究热点与前沿,在国内,研究成果高度集中于图情领域。为了避免歧义和消除误解,有必要对Altmetrics的中文名称做出分析和界定。在译名方面,国内学者对Altmetrics的认知和解读主要存在三种代表性观点。以论文的投稿时间为分界点,刘春丽是最早将Altmetrics概念引入国内并阐述其理论意义的学者,也是选择性计量学的首倡者[2]。仅过了1年多的时间,国内便涌现出两种不同观点。顾立平认为Altmetrics可译作替代计量或另类计量(后被舍弃)并辅以案例说明[3],由庆斌和汤珊红主张补充计量学为最佳译名并分析其研究意义和应用前景[4],余厚强和邱均平则力推替代计量学为合理称谓并剖析其提出过程与研究进展[5]。Altmetrics由Alt和Metrics组合而成是学界共识,词根Alt代表Alternative,是备选、另类(非传统)、替代的意思,也有补充的引申含义。依惯例,**计量学中的**应为研究对象,如Webometrics、Informetrics等,试图从名称上强调这是一门计量信息活动方法论的学科,但Altmetrics显然不符合这种命名规律,从功能来看,也不是去替代原有的评价体系,而是作为Web2.0环境下影响力测量的合理补充,是一组指标的统称,可见,译为补充性计量指标较妥当。

       1.2 优势特征及其表现 期刊影响因子(JIF)和同行评议是主流的文献信息过滤机制,引文分析也被奉为经典法则,对科研评价与管理等诸多领域产生深远影响,牵动着科研工作的各路神经。随着科学研究的深入发展和外部环境的变迁,传统的科研评价机制逐渐暴露出固有的顽疾:时效性较弱、评价维度单一、存在马太效应和目的性引用行为等。Altmetrics的优势特征主要表现在以下方面:a.近乎实时的更新速度[6]。传统方式的评价结果需要等待N年(N∈[2,5])才能公之于众,而基于Altmetrics的评价方法摆脱了长周期的约束,利用大数据、云计算等技术可以实时捕捉研究成果传播的广度和深度,实现动态更新和及时查阅,极大地增强了评价结果的时效性。b.丰富多样的评价指标。引用指标是传统评价方式的黄金标准,而在Altmetrics评价体系中,浏览、下载、注释、引用、转发、评论、书签等均被视为反映研究成果影响力的可用指标,有力地拓展并完善了影响力内涵,评价结果也更加客观、全面和公正[7]。c.开放透明的评价过程。传统的评价过程仅限于学术圈,公众的参与度较低。基于Altmetrics的评价机制是网络化、分布式的开放过程,主流工具服务商公开自己的指标体系,并搭建在线科学交流平台以供用户参与、监督和反馈,有利于不断优化评价机制,提高评价质量。

       2 工具与指标研究

       2.1 工具的主要特征比较 Altmetrics对工具的依赖性较强,工具能够为学术资源的过滤、遴选与分析提供支撑。自Altmetrics诞生以来,部分服务商抓住其中蕴含的潜在机遇,相继开发出各具特色的计量工具,数量至少在10种以上,但有的官网已经打不开,有的则不再更新或停止维护。从发展成熟度和使用广泛性来看,目前主流的四款工具分别是:Altmetric.com、ImpactStory、Plum Analytics和PLoS Impact Explorer,四款Altmetrics计量工具的主要特征见表1所示。

      

       由于每种工具的数据处理策略和指标体系结构存在差异,因此测量结果肯定不同,对于评价主体而言,如何甄别出符合自身需求的计量工具将是一个不小的“选择困难症”。从Altmetrics元年(2010)至今,计量工具虽然发展很快但成熟度较低,但是至今尚未形成一致认可的、标准化或权威性的评价指标体系。以下从三个方面分析四款工具的功能特色及其实践限度,客观揭示其优势和不足,以期为工具的维护、改进和完善提供借鉴与参考。

       2.2 数据采集与处理 数据来源的可靠性、全面性与客观性将直接影响到评价结果的质量水平,四款工具在数据采集策略方面都下足了工夫,但仍有值得改进之处。从属性划分,数据来源主要包括在线社交平台、文献管理平台、新闻媒体、数据库、政府文件以及工具自身的用户数据5大类[8],但需要指出的是,四款工具并不是全部都能采集到前述分类中的所有数据。例如:只有ImpactStory采集PLoS研究数据,只有PLoS Impact Explorer收集《自然》(Nature)杂志的博客数据,Altmetric.com的数据来源范围最广,但也最具颠覆性,即不包含任何基于引文的数据,Plum Analytics覆盖的底层数据最多,数据收集能力也最强。在四款工具中,只有ImpactStory收集自家平台上的用户数据,而实践证明,它的局限性也很突出,每次所能分析的数据量偏少(≤250条),运行速度较慢且无法识别模糊指代的标识符(如作者、篇名等)[9]。在数据处理方面,四款工具均采用细粒度聚类算法,降低计算复杂性,利用数字对象唯一标识符(DOI)来标记对象,提供数据跨平台链接并允许用户利用开放的接口收割DOI、元数据和URL等信息[10],周期缩短至天或周以内,提高了数据处理的效率。

       2.3 指标分类与组织 与传统的文献计量指标相比,Altmetrics的数据来源、平台、属性、内涵等要素均表现出差异化特征,四款工具的指标体系及其分类结构各不相同,即使同属一个分类层次,指标的数据来源也不一样,有的甚至差别很大,见表2所示,表中内容均以英文原词填充以便于展现指标的原生态信息。限于篇幅,不再赘列四款工具各项指标具体的数据来源名称。

       通过比较各项指标的数据来源信息可知,PLoS Impact Explorer是最早提出将论文层面指标(ALMs)分为5个维度的工具服务商,表2中所列指标为官网最新的分类体系,而其早期的版本正是表中ImpactStory的指标结构。事实上,这样的调整非但没有带来更加完美的逻辑,反而失去了连贯性的比较优势,这样的局限性也存在于Plum Analytics指标体系中,因为以数据来源为分类规则会产生不同名称但意义相近的重复交叉或冗余,导致指标存在偏差。ImpactStory将指标分为学术和公共两类进行排名和评级,但也存在交叉情况,如将引用指标Mentions与Citations归并为同类并纳入到“被引用”(Cited)的指标范畴[11]。为了建构层次清晰、结构明朗的评价体系,有必要对纷杂的指标进行规范化分类与组织,有学者以学术成果影响力产生模型为依据,对Altmetrics的分层与聚合进行理论探讨,如文献[12]将Altmetrics划分为传播、获取和利用三个由浅入深的递进层次,并根据数据来源的权威性程度赋予指标不同的权重进行聚合。文献[13]结合成本—收益的经济学分析框架,提出新的分类层次:感知层、社交媒体层和应用层,进一步明确了不同分组指标之间的逻辑关系,揭示了特定指标之间的转化关系。但从指标的可信度和清晰度来看,两文仍存在不足之处:一是没有对指标的分类依据作出说明,前后两文的指标结构变化较大;二是没有对指标分类的有效性和可靠性进行验证,指标的稳定性和转化率会对评估质量产生影响。为此,建议工具服务商增强其指标体系的科学性,公开评价策略和验证模型,包括权重分配机制。

      

       2.4 服务内容与方式 服务是工具研发与应用的终极目标,四款工具在服务的内容和方式上各具优势,也有值得改进和优化的地方。在四款工具中,ImpactStory的服务功能相对较弱,而其他三种工具均支持数据报告、信息推送和结果可视化等服务项目,在筛选前沿信息和热门主题方面发挥过滤器的作用,能够及时监测和评估不同对象的影响力,而用户通过可视化数据能够直观地掌握影响力结构,丰富了情报分析的效果。其中,Altmetric.com的可视化分析功能相对强大,能够展示分区域和时间段的动态变化,可爱的“甜甜圈”是其标志性形象。用户获取这些服务内容的方式主要有API认证、URL映射、徽章嵌入3种,四款工具的输出格式和呈现形态则见表1所示。在信息检索方面,只有Altmelric.com提供布尔查询和过滤功能并提供基于语境的计量服务,有助于用户了解评价对象的相对影响力。从局限性来看,在语言支持方面,四款工具均不提供(或支持)中文版本的服务,也没有实质性地将Web2.0环境下的中文社交平台、数据库等纳入其指标数据来源;在可拓展性方面,PLoS ImpactExplorer只能用于评价自己出版的论文,应用范围较小,ImpactStory支持数据分析的能力不足,这可能与其发展模式有关,而其他三款工具均有商业机构注资。总结来看,工具发展既要注重系统开发与功能建设,也要加强合作与协同,注重提升用户的体验感和工具的实用性。

       3 实证研究

       作为研究成果产出的最主要形式,论文一直是科研评价的重要对象,Altmetrics实证研究也大都是从论文层面展开的(极个别涉及编辑材料等)。为了深入探究Altmetrics在科研评价中的适用性、可信度和有效性,学者们从不同视角展开实证研究,各项方案共性与差异性共存。如在数据来源、指标遴选、样本总量、时间跨度、所属领域等方面各不相同,互为补充;而在研究过程和方法方面,基本遵循较为一致的路径,不同版本的SPSS是分析的必备软件,所有的样本均不符合正态分布,相关性检验只能选用Spearman法。从研究的具体内容来看,实证研究主要由相关关系和结构维度构成,以下分而述之。

       3.1 相关关系 据统计,侧重于反映研究成果社会影响力的新型指标多达20种,若都纳入评价指标体系,则会导致冗余,需要进行检验,去粗存精,构建客观、公正、全面的影响力评价指标体系。相关性分析主要包括以下内容:a.引用指标与Altmetrics的相关性。两类指标之间的相关性呈现差异化特征并且波动幅度较大,如文献[14]研究发现:只有被引量与Mendeley中的标签数相关性较强(R=0.843,P=0.05),而被引量与其他Altmetrics的相关性偏弱(R<0.40);文献[15]研究显示:Mendeley中的阅读量与文献引证数据高度相关,但与高被引文献相关性较低;文献[16]也表明:使用指标、社交媒体指标、提及指标与引用指标之间的相关性强弱程度不一,差距较为显著;文献[17]的研究表明:Altmetrics的排名与被引频次的分布趋势一致性较弱且相关程度不高。b.Altmetrics之间的相关关系及属性。不同Altmetrics的可用性和适用性差异较大,如文献[18]揭示20种Altmetrics的聚类情况并指出:浏览、下载和引用等属于常用指标,报道、评论、书签和排名等是甄选高影响力论文的异质性指标。文献[19]显示:F1000的Ffa因子与Mendeley中读者数的相关性较弱(R=0.237,P=0.05),明显低于这两组指标与Google Scholar中被引量之间的相关强度,还证实这三组指标对同一论文集合的影响力评价结果具有一致性。c.相关强度的影响因素。不同类型指标之间的相关性有所差别,如文献[20]研究认为:Altmetrics表征的社会影响力与引用指标反映的学术影响力之间存在正相关关系,但不同的数据来源会使论文的二维影响力发生偏移,Altmetric公司的评分策略也存在偏差;文献[21]进一步的研究发现:阅读数、标签数与引用指标之间的相关性较弱,文献的出版时间、类型及作者H-指数对相关性验证结果产生影响。

       3.2 结构维度 Altmetrics是由众多不同类型、属性和来源的指标“交织”在一起的集合体,面对繁杂的指标,评价主体必须厘清这些指标之间的层次结构,而不能“大杂烩”。在指标的维度划分策略上,实证研究的结论较为一致,3分法是学者一致认可的可行方案。如文献[22]利用主成分分析法(PCA)从28个不重复变量中提取3个主成分并分别命名为:引用维、利用维与共享维,同时发现不同学科的科研评价维度存在差异;文献[23]将4种Altmetrics与传统的文献计量指标进行对比,进一步印证了Altmetrics的多维性,同时揭示出自然科学与社会科学的评价结构有所不同;文献[24]利用PCA从与被引量相关性较高的7个指标中提取出3个主成分,构建主成分评价模型并将评价结果与被引量进行对比,发现两个模型对高学术影响力论文的评价具有一定的一致性;文献[25]引入“公平性测试”方法以消除时间窗口的影响,分析发现:Altmetrics和被引指标反映的是读者对论文的不同关注方向,高Altmetrics值可视为论文预期获得高被引的风向标;文献[26]研究发现:Mendeley和Twitter的文献覆盖率较高(93%),前者适合于学术影响力维度的评价,后者倾向于社会影响力维度的评价,而其他指标则不具备普遍的适用性。综前所述,主成分分析能够揭示研究成果影响力的多维性,每个维度传递的信息不具重复性,具有相对独立的意义,但不管怎样,引用指标仍是科研评价的重要维度,不可轻视,科研评价的指标体系构建应当建立在多维原则基础上。

       4 应用研究

       4.1 影响力评价 Altmetrics的最原始初衷是对科研论文进行评价,而后又有研究人员将其拓展至其他类型研究成果的评价,因此,影响力评价是Altmetrics应用的首要功能。自从加菲尔德(Eugene Garfield)提出引文分析理论以来,基于引用的指标一直是科研评价的黄金准则,在科研评价生态体系中占据压倒性的优势地位。但随着在线科学交流的兴起和开放存取运动的发展,研究成果产出形成更加多样,影响力也逐渐向社会公众开放,从引证关系来考察研究成果的影响力已经不能客观、全面地反映其内在的学术价值和社会效用。Altmetrics应用于影响力评价的主要特色是将影响力的测量维度一分为二:学术影响力与社会影响力,形成影响力二维分析框架[27],能够有效满足Web2.0环境下更真(True)、更全(Full)的科研评价要求,而且科学发现与评估也应是Aitmetrics最具潜力的应用领域。在应用范围上,Altmetrics还可用于非论文层面的影响力,包括图书、代码、数据集、软件、演示文稿、学位论文、政策文件、专利和临床指南等等。在优势特征上,相比传统的文献计量指标,Altmetrics具有及时更新、过程开放、范围广泛、指标多样等特点,引导影响力评价的多元化发展方向。

       4.2 图书馆服务 作为信息中心,图书馆在科学交流生态系统中一直担当着重要的角色并发挥不可替代的作用,Altmetrics应用于图书馆服务的功能主要体现在提高文献检索效率、改善文献评价机制和增强文献推荐精度3个方面[28]。图书馆具备Altmetrics研究和应用的天然优势,应积极承担起Altmetrics教育者、研究者、推广者和实践者的角色,服务内容包括:促进馆藏评价,优化馆藏结构;展示影响力,促进机构仓储建设;加强宣传推广,推动在线学术交流;开展深层信息服务,提升用户使用体验[29]。与图书馆的传统服务相比,融合Altmetrics的服务新模式具备四大特点:化被动为主动、由静态向动态演进、由单点向网络升级、由知识的提供者向交流者转型,在个性化与智慧化服务、改善科学交流环境、提高科学交流效率方面具有显著优势[30]。挑战与机遇并存,图书馆还应做好Altmetrics的营销推广工作,利用在线社交媒体、学术研讨、讲座和课堂教学等机会,使得研究成果利益相关者认识到Altmetrics应用的价值,同时,加强与工具提供商、数据库公司以及用户之间的沟通,促进协同发展。

       4.3 机构知识库建设 随着在线科学交流的兴起以及IR与社交网络的跨界融合,传统的计量手段已经无法满足IR评价的现实需求,将Altmetrics引入IR,可以帮助管理者有效控制储备知识资源的质量,更加贴近用户原始需求,更好地发挥IR促进学术交流的功能;彰显发布者的个人能力和学术水平,扩大社会知名度[31]。引入Altmetrics的IR计量服务主要有四种模式:一是自制评价指标体系,二是集成Altmetrics工具,三是嵌入Altmetrics应用,四是共享对象元数据[32]。第一种模式要求管理者熟知评价方法及其应用,后三种模式的准入门槛较低且互操作性较强。目前主流的IR平台(如DSpace、Eprints等)均可以集成或嵌入Altmetrics工具(如前文提到的四款工具),技术实现方案分为API调用、图标嵌入(Altmetric.com)和组件嵌入(PlumX)三种,集成API通常是免费的,但需要向工具提供商申请专用密钥[33]。需要注意的是,不同工具的使用规则、指标结构和服务策略存在差异,IR管理者应当选择合适的工具并以成功范例作为参照,提高Altmetrics工具在IR本土化建设中的适用性。

       5 展望

       计量研究至今已有百余年的成长史,每一次重要演进都与外部环境的变迁密不可分。作为Web2.0环境下的计量研究,Altmetrics是伴随着社交网络和开放存取的发展而兴起的新课题,在研究对象、对待JIF的态度、数据获取、发生时间、同行评审以及产生的影响力等方面与传统计量学存在本质差异[34]。Altmetrics理论与方法的引入,有望打破二元制(JIF+同行评议)科研评价的固有格局,促使研究成果的影响力评价机制日臻完善。Altmetrics的发展仍处于初级阶段,能否成为科研评价与管理的“明日之星”尚需实践和时间的检验。为了实现与既有的计量研究的融合与超越,并努力使Altmetrics能够在本土生根发芽,未来之研究应当重点加强数据保障、工具优化、指标组织、应用拓展等方面的深化探索与实践。

       a.数据保障。与引文分析相比,Altmetrics的来源数据规模庞大且结构复杂,产生于不同的社交平台,分布在不同的网络空间,网络“水军”的存在使得数据的人为操纵问题更为严峻,对Altmetrics的广泛适用性、数据客观性和数据整合提出了挑战[35]。为了确保验证结果的可靠性和有效性,必须对来源数据进行深度挖掘与标准化规范,这是数据保障研究的核心议题。主要内容包括:一是研发针对自动生成型数据的采集与清洗系统,旨在提高多源型数据的可获取性、机器的可读性和人工的易用性;二是构建面向多媒体数据源的监测与跟踪体系,目的是增加传统的新闻媒体数据的链接,便于监测和跟踪主流媒体数据的累积态势;三是建立论文及其他评价对象的不同标识符的转换机制,以便于在测量过程中保证评价对象“来源地”的真实唯一,从而提高来源数据的质量;四是探索基于语境的计量方法,因为有些情况下对论文的提及、讨论、注释、转发等行为产生的数据并不能表现其正负涵义,即使是“喜欢”,不同的语境会产生差异化的效果[36],有必要从语境的角度解析来源数据。

       b.工具优化。与传统的相对成熟的计量工具(如Web of Science、CrossRef、Scopus、CSSCI)相比,Altmetrics计量工具仍处于发展的初级阶段,在用户可操作性、模块功能化、工具专使度和语言覆盖面等方面有待改进与突破[37]。具体而言,工具研究的突破点主要涵盖以下方面:一是优化界面操作和开发利用机制。包括:为用户提供便捷的注册和使用引导指南,提供灵活、实用的个性化插件;拓展检索、保存、管理和利用等模块的人性化功能,提高工具在数据的深度挖掘与分析方面的可拓展性;支持用户在遵守许可协议的原则下将功能模块集成、嵌入或链接到非商业性用途。二是注重培育核心竞争力。为了节省时间和精力,工具服务商可能会从其他在线工具或网络平台获取信息,这样的“捷径”易受限于第三方而弱化自身的行业地位和发展潜力,因此,工具服务商更应当在系统建设与优化功能方面下工夫。三是突破语言障碍,重视发展中国家的研究成果。在语言版本的转换方面,技术不是问题,而是要消除歧视性理念与思维,国外工具服务商应当提供更多的语言支持;在自主创新方面,我国有能力构建基于中文的Altmetrics计量工具,增强科研评价的国际话语权。

       c.指标组织。既有研究的结果和结论充分表明:Altmetrics只能从某个侧面或维度反映研究成果的影响力,不同的指标体系产生差异性的评价效果,Altmetrics的实质是对传统文献计量指标的合理补充而非全盘替代[38]。Altmetrics是一个相对复杂的指标集合体,有些变量的作用微弱,而有些变量产生的冗余度较大。后续研究需要厘清以下问题:一是分类指标的适用范围。对已有的指标进行分类与排序,剔除同类指标中的不稳定和无关性指标,将影响力测度分解为学术影响力和社会影响力两个层级,遴选出与之相匹配的指标,从而构建更加精细化和针对性的评价体系和验证模型。二是甄别指标偏差的影响因素及形成机理。可能的影响因素包括样本量级、地域性差异、用户的行为习惯和不同工具的普及度等,需要对指标数据的时效性、累积态势及演化规律等进行研判,并在大样本环境中进行验证。三是从影响力等级的维度对指标进行合理的组织,即对浏览、下载、保存、讨论、推荐、使用、引用等具体行为所产生的影响进行等级评定,针对不同学科领域、区域差异等特点,预设值分级的阈值标准和指标融合的权重因子,构建新的评价体系并测试其效果以资改进。

       d.应用拓展。Altmetrics的研究不应局限在科研评价领域,依靠Web2.0环境,如何利用这些相关的指标和工具为图书馆用户提供相应的服务也值得深度研究。目前很多研究成果比较推崇它的优势,但在实际的科研评价、信息推荐等过程中如何落地是一个非常现实的问题。Altmetrics应用的拓展应以用户需求为导向,以解决实际问题为目标,至少有4个值得重点关注的方向和趋势:一是面向特定用户和课题需求的知识发现系统构建,主要是为提高检索效率和效果提供解决方案,涉及元数据存储、搜索引擎优化、关联数据技术、需求语义网络模型等;二是Altmetrics嵌入个人学术履历(CVs),塑造更加完美的职业形象,增强研究者在学术生态网络中的话语权,涉及基于在线平台的信息过滤与数据融合、统计结果嵌入与展示、分时同步更新等具体细节;三是精准化的情报分析服务,重点在于有针对性及时跟踪和锁定在线学术交流的主要环节,如针对推荐、注释和讨论等活动,挖掘其有价值的信息内容;四是引入国际标准和范例开展定制服务,如为有关机构或个人提供科研竞争力分析,嵌入科研团队,捕捉最新研究动态、预测并推送前沿信息、支持科学实验等。

       引用格式 刘丽敏,王晴.我国图情领域Altmetrics研究评述及展望[J].情报杂志,2016,35(4):131-135,124.

标签:;  ;  ;  ;  ;  ;  ;  

我国图论与形势领域测高学研究的回顾与展望_用户研究论文
下载Doc文档

猜你喜欢