不同学科高被引论文的Altmetrics指标特征分析论文

不同学科高被引论文的Altmetrics指标特征分析*

● 黄 晓1,高嘉慧1,吴 江1,2

(1.武汉大学信息管理学院,湖北 武汉 430072;2.武汉大学电子商务研究与发展中心,湖北 武汉 430072)

摘 要: [目的/意义]通过研究高被引论文中不同学科的Altmetrics指标特征,Altmetrics指标覆盖率以及Altmetrics指标与被引频次指标的相关性,来探究高被引论文在社交媒体中的使用情况以及高被引论文的Altmetrics指标可用性,为后续的研究者提供实践基础。[方法/过程]选取ESI数据库中22个学科的热点论文以及被引频次高的论文作为研究对象,探讨不同学科文献的Altmetrics指标大小、Altmetrics指标覆盖率以及传统被引频次指标之间的关系,数据获取时间为2018年5月15日。[结果/结论]不同学科之间的Altmetrics指标特征存在相似性,Altmetrics得分、Mendeley读者数量及被引频次都很大,新闻、博客、Facebook对高被引论文提及最多;医学相关的学科中Altmetrics覆盖率较高,而计算机及数学相关的学科中Altmetrics覆盖率较低。

关键词: Altmetrics;高被引论文;指标特征;被引频次

传统学术论文影响力评价体系由于其评价方法的延时性与片面性,越来越不能对科研成果进行及时与客观的评价[1]。随着Web 2.0时代的发展,社交网络媒体中的信息越来越被关注。J.Priem由此提出了Altmetrics一词,旨在开发一些新的评价指标,例如社交媒体的转发与评论等,用以弥补传统科研成果评价体系的不足[2]。实际上,由于各类社交媒体中的信息良莠不齐,即使Altmetrics评价方法被提出,不同学者与机构对于新评价方法的认知与定义也不统一。各类学术机构通过不同的方法收集科研成果在各种网站、媒体中的引用、提及等数据,并构建一定的算法计算出这些成果的影响力等指标,目前比较常见的Altmetrics工具有Altmetric.com,PLOS ALT,Plum Analytics。由于学者们对Altmetrics的定义并不统一,J.Priem与Altmetrics的支持者提出统一Altmetrics的研究内容,包括论文层面计量(Article-Level Metrics)、科研成果计量(Eurekometrics)、科研发现计量(Erevnametrics)、科学计量学2.0(Scientometrics 2.0)[3]

2.2 各指标与血浆纤维蛋白原的相关性分析 统计结果显示,BMI、空腹血糖、总胆固醇、三酰甘油、低密度脂蛋白-胆固醇水平与孕中期GDM患者血浆纤维蛋白原水平存在显著正相关关系,与高密度脂蛋白-胆固醇水平存在显著负相关关系(均P<0.05)。见表2。

论文层面计量是以单篇论文作为计量对象,重点关注论文的被引与其在社交媒体中的提及与引用。被引频次高的论文具有较高的学术影响力,被称之为高被引论文;它们一直是学者关注的重点,许多学者关注高被引论文的成因、影响与评价[4-5]。ESI(Essential Science Indicators,基本科学指标数据库)是知名的高被引论文数据库。世界著名的学术信息出版机构美国科技信息研究所(ISI)对SCIE、SSCI库中近10年的论文数据进行统计,按被引频次的高低分别排出居世界前1%的研究机构、科学家、研究论文和居前0.1%的热点论文,从而构成ESI数据库,其中的相关指标是当今学术机构与高校进行学术水平与影响力评价的重要参考。ESI数据库有包括计算机科学、地球科学、数学、空间科学等在内的共22个学科。

高被引论文的Altmetrics指标特征能够反映高被引论文在社交媒体中的提及与引用情况,同时这些特征能够决定这些指标在论文学术评价时的可用程度,不同学科的Altmetrics指标特征是否存在差异与规律也不得而知。通过对高被引论文集合所有学科的Altmetrics指标进行特征分析,同时与被引频次进行对比分析,有助于完善学术界对于高被引论文的全面了解。然而截至目前并没有研究以高被引论文为分析对象,对高被引论文的Altmetrics指标特征进行分析。本研究将以ESI数据库中22个学科的高被引论文(包括被引频次高的论文与热点论文)为研究对象,结合其他学者在研究Altmetrics指标特征时的分析方法,对高被引论文的Altmetrics指标进行特征分析与发现,并与被引频次这一传统指标进行对比分析,最终明确高被引论文在社交媒体中的使用情况与高被引论文的Altmetrics指标的可用性,为后续的研究者提供基础。

1 研究综述

自从2010年J.Priem在Twitter上提出Altmetrics以来,Altmetrics便受到文献计量领域研究者们的广泛关注,Altmetrics的指标特征及其同传统指标的对比研究是其中的重点研究方向。对于Altmetrics的指标特征,学者们关注其指标覆盖率与学科差异性等问题。Hammarfelt研究2012年瑞典大学相关的文献发现,对于人文类论文而言,除了Mendeley及Twitter指标外,其他Altmetrics指标覆盖率都很低[6]。Barthel发现不同学科的Altmetrics指标的覆盖率不同,对于计算机科学而言Citeulike指标的覆盖率较高,对于社会科学而言Twitter指标的覆盖率较高[7]。Erdt等发现医药、生物、化学等领域中Altmetrics指标的覆盖率最高[8]。刘晓娟和余梦霞研究了不同的学科、出版年份、来源期刊、国语以及语种等因素对Altmetrics覆盖率的影响,结果发现不同的Altmetrics指标的覆盖率不同,以上提出的5种因素都会导致指标覆盖率的不同[9]。还有学者对某一特殊的Altmetrics指标进行单独分析。余厚强等研究发现新浪微博Altmetrics指标覆盖率不到1%,且微博用户更关注论文的趣味性和实用性[10]。此外,余厚强等还研究了政策文件指标的特征,结果发现该指标的覆盖率只有1.7%,且及时性较弱,政策文件更偏爱提及医学类的学术论文[11]

Altmetrics指标与论文被引的对比研究也是学者们常常关注的重点,并且多集中在覆盖率较高的指标Twitter与Mendeley中。Shuai等研究了arXiv.org上的4606篇文章的3种状态:从arXiv.org上下载、在推特上被提及以及在早期出版后被引用,结果发现相比于下载而言,推特上的时间跨度更短,文章会更早地在推特上被提及,并且文章在推特上被提及的次数与下载量及预印本早期出版后就被引用的数量是正向相关的[12]。S.Haustein等在2014年,选取了大规模论文的Twitter提及数与被引频次进行对比,发现Twitter提及数与文章早期的被引数存在正向相关关系,而与文章后期的引文量没有任何关系[13]。后续研究也佐证了这一结论,Zhang等发现高Twitter提及数文献与高被引文献集合并无明显重合,Twitter提及与被引频次并无显著关系[14]。也有很多学者关注Medeley提及数这一指标,不同研究中其与被引频次的关系结果大多类似,相关系数为0.4~0.6之间[15-17]。而E.Mohammadi按照不同学科探究了Mendeley读者数与WoS被引之间的相关关系,结果发现人文学科、社会学科各二级学科Mendeley读者数与WoS被引的相关性较低,在0.16~0.37之间[18]。金玮等还发现高被引论文Mendeley读者数与被引频次的相关性比一般论文相关性要低[19]

将前文所述纠偏算法录入竖井掘进机控制系统,模拟工程可能遇到的偏斜情况(表2),并进行现场试验。试验现场如图9所示。

在低温(0 ℃)条件下将3组XLPE样本分别进行为期14 d、21 d、28 d(d为天数)的加速水树老化,观测了老化XLPE样本中水树的微观形貌和水树长度,并通过电场仿真分析低温下水树生长速率变化的原因。

总的来说,已有许多学者使用大规模数据对一般论文的Altmetrics指标特征及其与被引频次进行了分析,发现除Twitter与Mendeley外,大部分Altmetrics指标的覆盖率都很低;同时发现一般论文的Twitter指标与被引频次之间并无显著关系,高被引论文Mendeley指标与被引频次的关系同一般论文不同。但目前鲜有文献以高被引论文这一重要论文集合为对象研究高被引论文的Altmetrics指标特征,不同学科的高被引论文Altmetrics指标特征关系也需要对比发现。所以,为了明确高被引论文的Altmetrics指标特征,并与高被引论文被引频次这一重要特征对比,同时通过这一重要论文集合的Altmetrics特征反映现阶段Altmetrics指标的发展情况,本文选取了不同学科的高被引论文集合为研究对象,对高被引论文的Altmetrics指标与被引频次进行研究。

三个臭皮匠,赛过诸葛亮。可贵的是,有热心的亲友在微信群里参与点评、点赞,为孩子加油,为持续创作注入了动力。

2 高被引论文的Altmetrics 指标分析

2 .1 研究数据获取

本研究对高被引论文的Altmetrics指标特征进行分析,包括Altmetrics指标的数量分析、Altmetrics指标的覆盖率分析、Altmetrics得分与被引频次的相关性分析。具体分析内容与方法如下:

2 .2 研究问题

ESI数据库一共包括22个学科的被引频次高的论文与热点论文,其中热点论文具有时效性高与被引频次高的双重属性,所以本研究将热点论文同被引频次高的论文一起作为研究对象,并统称之为高被引论文。本研究首先从ESI数据库中分别获取这22个学科的文献详情,包括文章题目、作者、国家、年份、机构、被引频次、DOI等信息;其次根据文献的DOI,Altmetrics指标工具Altmetrics.com提供的数据接口,获取这些文献的Altmetrics指标详情。以22个学科中文献数量最多的临床医学(Clinical Medicine)为例,本文首先获取了该学科25315篇高被引论文的详情,其中有DOI的论文为25026篇,289篇没有DOI;由于获取这些论文的Altmetrics指标需要依靠DOI,为了不影响覆盖率等指标的计算,将这些没有DOI的文献去掉,然后根据剩下的25026个DOI,在Altmetrics.com中获取到23483篇文献的Altmetrics指标;Altmetrics指标除了该论文在不同社交媒体中的提及与引用数量,还包括Altmetrics.com为每一篇文献计算的Altmetrics得分。数据获取时间为2018年5月15日。

分析得出,观察组患者治疗后GAS评分、ZBI评分、不良反应发生率(头沉、眩晕、胃部不适感、恶心、睡眠障碍)均明显更优,对比对照组患者,差异明显,P<0.05;2组患者治疗后PDQ-8评分对比效果不存在统计学意义,P>0.05。2组患者治疗前GAS评分、ZBI评分、PDQ-8评分对比结果不存在统计学意义,P>0.05。

2)Altmetrics指标覆盖率分析。覆盖率分析是通过统计高被引论文中Altmetrics各个指标的非0值数量,明确高被引论文在不同社交媒体的被引用、提及情况;进一步明确高被引论文的Altmetrics指标特征,反映Altmetrics指标作为评估高被引论文参考的可用程度。

3)Altmetrics指标与被引频次的相关性分析。Altmetrics指标与被引频次为代表的传统指标的异同是许多学者关注的重点。本研究将使用相关性分析方法分析高被引论文被引频次与Altmetrics指标的关系,从而最终明确高被引论文的Altmetrics指标特征,并为高被引论文的Altmetrics指标特征得出一般结论。

2 .3 指标特征分析

完成数据获取与数据预处理之后,本研究分别将不同学科的文献依照DOI完成被引频次与Altmetrics指标的匹配。本文研究的数据集包括22个学科的高被引论文,每个学科的文献数量及学科代称如表1所示,其中22个学科的文献数量为去除DOI后的文献数量,在后文的结果表中将使用1~22代称来指代22个学科。此外,本文要分析的指标数量较多,包括Altmetrics得分(1A)、新闻提及数量(2A)、博客提及数量(3A)、政策提及数量(4A)、推特提及数量(5A)、专利引用数量(6A)、同行评议数量(7A)、微博提及数量(8A)、Facebook提及数量(9A)、维基百科引用数量(10A)、Google+提及数量(11A)、LinkedIn提及数量(12A)、Reddit提及数量(13A)、Pinterest提及数量(14A)、F1000推荐数量(15A)、Q&A提及数量(16A)、视频提及数量(17A)、Syllabi提及数量(18A)、Mendeley读者数量(19A)以及被引频次,括号中是各Altmetrics指标的代称,共计20个指标。

对焊接加固的构件,施焊时生产的焊接变形对构件的承载力是有影响的,但计算时一般不予考虑,而是通过一定的施工工艺来尽量减小这种影响。一般方法是先选择一定的固定点用点焊将加固件和被加固件整体固定,然后以连续的或间断的焊缝完成加固构件的最终焊接[1]。杆件为受压杆件时,杆件不仅要满足强度验算,还要满足受力稳定性,因此在杆件加固设计时,不仅要对构件截面面积进行计算,还要对杆件的惯性矩和回转半径进行计算,验算构件的长细比。因此受压杆件加固经常采用的加固节点为上图中的b、c、d图[2]。

表1 ESI中的各学科代称及文献数量

总的来说,从指标的平均值上来看,高被引论文在推特、Facebook这两个知名的社交媒体中提及数量较高;平均值较低的许多指标可能由于其覆盖率低等特征,并不能作为高被引论文的评价指标,这需要进一步的分析;Mendeley读者数量虽然与Altmetrics得分无关,但Mendeley这一软件是学术软件,且高被引论文的Mendeley读者数量均值都较大,这一指标值得继续关注。

1)从数值大小来看,每个学科的Altmetrics得分、Mendeley读者数量、被引频次以及推特提及数量的数值都是最大的,4个指标的均值分布如图1所示。

图1 22个学科中高被引论文的指标均值(高均值指标)

2)无论是哪个学科,这些Altmetrics指标平均值排名靠前,包括新闻提及数量、博客提及数量、Facebook提及数量、专利引用数量、维基百科引用数量、Google+提及数量以及政策提及数量,7个指标的均值分布见图2。

图2 22个学科中高被引论文的指标均值(中均值指标)

以上指标特征有以下解释。第一,这些文献都是高被引论文,被引频次数值自然较大。第二,Mendeley读者数量与其他指标统计口径不一致,并且Mendeley是一款学术软件,论文的读者数量较多实属正常;其次,本文在Altmetrics指标中发现了有许多论文Mendeley读者数量较大而最终的Altmetrics得分为0的情况,这说明在计算Altmetrics得分时并未将Mendeley读者数量纳入其中。第三,从平均值的大小可以看出,社交媒体中对高被引论文提及最多的仍是推特,其次是Facebook,这两个指标说明高被引论文在社交媒体中提及多的仍然是这些用户量基数巨大的社交工具。第四,上述Altmetrics指标平均值很小可能是因为这两个因素所造成,一是高被引论文在这些社交媒体中覆盖率不够;二是高被引论文在这些媒体中覆盖率尚可而提及数量较少,这将在后续的分析中得到进一步的验证。

图3 22个学科中高被引论文的指标均值(低均值指标)

3)无论是哪个学科,以下Altmetrics指标平均值都排名靠后,且平均值很小,包括同行评议数量、微博提及数量、LinkedIn提及数量、Reddit提及数量、Pinterest提及数量、F1000推荐数量、Q&A提及数量、视频提及数量、Syllabi提及数量,9个指标的均值分布如图3所示。

2.3.1 Altmetrics指标数量分析 Altmetrics指标数量分析是对高被引论文Altmetrics指标与被引频次进行统计分析来发现高被引论文的Altmetrics指标特征,指标的平均值能够直观地反映出一些特征。根据各指标均值计算结果发现,虽然不同学科各个指标平均值大小趋势有所不同,但是不同科学指标平均值有很多相似之处,具体表现为:

2.3.2 Altmetrics指标覆盖率分析 Altmetrics指标覆盖率分析是计算社交媒体中高被引论文出现的百分比来进一步观测高被引论文的指标特征。本研究在计算Altmetrics指标覆盖率时,将表1中各个学科的高被引论文数量为分母;有的高被引论文Altmetrics得分为0,在计算Altmetrics得分覆盖率时仍然被认为有Altmetrics得分,因为这些论文Mendeley读者数量并不为0,所以本研究认为它们仍然在非学术数据库的网站中被关注;计算Altmetrics得分覆盖率以外的指标时,本研究按照该指标非0值的数量作为分子,计算它们与高被引论文数量的比值,计算结果如表2所示。

由于交叉学科只有200篇论文,所以这个学科的Altmetrics得分、Mendeley读者数量覆盖率出现100%的情况属于正常;而且该学科其他指标覆盖率也与大部分学科有较大差异,所以在分析总的Altmetrics指标趋势时暂不关注这一学科。从表2的计算数据可以分析出以下结果:

1)大部分学科Altmetrics得分的覆盖率较高。临床医学、分子生物学与遗传学、神经行为学、精神病学与心理学、免疫学、微生物学这些学科的Altmetrics得分覆盖率都超过了90%,它们都是与医学相关的学科;工程学、计算机科学、数学这三个学科的覆盖率较低,分别为37%、48%、28%,其中计算机科学与数学是较为大众的学科,覆盖率反而较低。

由于马尾松在加热1 h时,受热处理影响,导致其样品表面裂痕变深变大,整体性较差,所以粗糙度比未处理更高,而随着热处理时间的增加,其粗糙度又逐渐变小,样品表面逐渐变稳定。其样品粗糙度在2 h时与未处理材接近,4 h时则低过未处理材。若将热处理1 h、2 h、4 h进行对比,则发现随热处理时间的增加,其样品表面粗糙度变小。

2)数量分析中平均值高的Altmetrics指标覆盖率高,这些指标为Twitter提及数与Mendeley读者数量,这与综述中的结论类似。Mendeley读者数量覆盖率趋势与Altmetrics得分一致,且Mendeley读者数量的覆盖率明显高于Twitter提及数的覆盖率。

3)数量分析中平均值低的Altmetrics指标的覆盖率低,这些指标为:同行评议数量、微博提及数量、LinkedIn提及数量、Reddit提及数量、Pinterest提及数量、F1000推荐数量、Q&A提及数量、视频提及数量、Syllabi提及数量。除了综合交叉学科,同行评议数量的覆盖率最高只有8%,微博是以中文为主的社交工具,微博提及覆盖率最高只有7%,大部分学科这两个指标的覆盖率没超过2%;Reddit提及数量、Pinterest提及数量、Q&A提及数量、视频提及数量、Syllabi提及数量,这些指标的覆盖率也都较低;而F1000推荐数量却不同,虽然这一指标的平均值较低,但是在某些学科中,这个指标的覆盖率较高。

总的来说,高被引论文在Mendeley中有读者数量,该论文就有Altmetrics得分,覆盖率最高的指标是Mendeley读者数量,其次是Twitter提示数;医学相关学科的Alt-metrics得分、Mendeley读者数量覆盖率都比较高,而计算机科学、数学这两个较为大众的学科Altmetrics得分、Mendeley读者数量覆盖率反而较低。对于其他Altmetrics指标,上述分析发现许多平均值且覆盖率低的指标,说明这些指标所代表的社交媒体中学术论文的提及确实较少,所以这些指标并不能为高被引论文评价提供好的参考;这其中F1000却不一样,F1000是一个二次文献库,由许多科研机构的医学和生物学专家组织建立,为科研人员和临床医生提供快速文献评价和推荐等服务,所以F1000推荐数量这一指标在医学相关领域覆盖率较为突出属于正常。在后续分析中,除F1000推荐数量外,其他平均值低且覆盖率低的指标都不是相关性分析的对象。

表2 22个学科高被引论文Altmetrics指标的覆盖率(单位:%)

风机每时段的发电量是由风机转轴处每时段的平均风速及风机的出力特性决定的,其输出功率可根据风机生产厂家提供的网侧输出功率曲线经过多项式拟合得到,具体公式[11-12]为

从表3可以看出,被引频次跟以上绝大多数Altmetrics指标都是显著相关的,只是相关属性与程度有差别。同时,单个领域的被引频次与Altmetrics指标没有固定关系,而不同学科的相同Altmetrics指标与被引频次的关系呈现类似相关性特征。根据表3的分析结果,对Altmetrics指标逐个分析,据此对不同学科的Altmetrics指标进行归纳与分类,可以发现以下结果:

1)Altmetrics指标数量分析。数量分析是对22个学科的高被引论文的Altmetrics指标进行统计分析,计算各个学科中Altmetrics每个指标的情况,初步明确高被引论文的Altmetrics指标特征。

1)对于Altmetrics得分这个综合指标,无论哪个学科,被引频次均与其显著相关,而相关系数为负;从相关系数大小上看,被引频次与Altmetrics得分的相关系数都较小,其中17个学科的相关系数均未超过0.1;这说明被引频次与Altmetrics得分之间存在显著的弱相关关系。

2.3.3 Altmetrics指标与被引频次的相关性分析 Altmetrics指标与被引频次的相关性分析是计算各个学科高被引论文被引频次与每个Altmetrics指标的大小关系,通过与被引频次的对比来进一步明确高被引论文的Altmetrics指标特征。在进行相关性分析之前,首先要对参与相关性分析的各类数据进行正态性检验,以选取准确的相关性分析方法,本研究使用单样本Kolmogorov-Smirnov检验的方法验证各类指标的正态性。对各个学科高被引论文的每一类指标进行逐次检验,发现所有指标的检验结果都一致:渐进显著性结果均为0.000,小于0.05,所以这些指标均不符合正态分布;由于学科以及指标数量太多,检验结果不一一列出。总之,由于这些指标数据均不符合正态分布,所以本研究选用非参数检验的Spearman检验方法,计算这22个学科中高被引论文的被引频次与Altmetrics指标的相关性大小,具体结果如表3所示。

2)对于具体的Altmetrics指标,可以根据它们跟被引频次的相关关系分为三类,第一类为新闻提及数量、推文提及数量、Facebook提及数量;第二类为政策提及数量、专利提及数量、Wikipedia引用数量、F1000推荐数量、Mendeley读者数量;第三类为博客提及数量、Google+提及数量。

第一类Altmetrics指标所代表的是大众化媒体。其中新闻有广大的受众群体,Twitter与Facebook是国际上流行的社交媒体。从相关性分析结果上看,除了综合交叉学科的Facebook提及数量与被引频次不显著相关,数学的Facebook提及数量与被引频次不在置信度为 0.01 时显著相关,其他指标与被引频次都是在置信度为 0.01 时显著相关,即这些指标与被引频次是十分显著的相关关系,这与综述中Twitter与被引频次无显著相关关系结论不同。其次,显著相关的相关系数均为负值,新闻提及数量、Facebook提及数量相关系数绝对值较小,而推文提及数量这两个指标的相关关系绝对值较大,这说明高被引论文被引频次与以推文提及数量为代表的大众媒体指标呈显著的负相关,相关关系较强。

表3 被引频次与Altmetrics得分等指标的相关性分析结果

注:**表示在置信度(双测)为0.01时,相关性是显著的;*表示在置信度(双测)为0.05时,相关性是显著的。

第二类Altmetrics指标所代表的是学术化社区与非大众指标。这其中政策是少数人关心的内容,专利也是学术成果的一种,Wikipedia一般会由某个领域的研究者来编撰,其中的引用接近学术化的引用,F1000、Mendeley是专门针对研究者开发的社区与工具,所以这一类指标所代表的是归为非大众化的学术化社区。从相关性分析结果上看,除了物理的被引频次与F1000推荐数量的相关不显著外,其他学科的被引频次与这些指标的相关关系均是显著的;除了化学的被引频次与F1000推荐数量的相关系数为负,其余所有的相关系数均为正数;由于F1000是医学类学术工具,所以F1000推荐数量与少数非医学学科不显著相关是正常的,而且F1000推荐数量与医学类学科的被引频次相关系数更大;其他的指标中专利引用数量、Mendeley读者数量这两个指标的相关系数绝对值较大,剩余指标的相关系数绝对值大小一般,说明高被引论文被引频次与专利引用数量、Mendeley读者数量为代表的学术化社区指标呈显著的正相关,相关关系较强;同综述中的结论类似的是,8个学科的高被引论文中Mendeley读者数量与被引频次之间的相关系数在0.4~0.6之间,还有相当一部分学科的相关系数小于0.4,小于0.4的学科不局限于人文社会学科。

第三类Altmetrics指标所代表的是非大众化的社交媒体,博客与Google+都是曾经的大众化社交媒体,而移动互联网时代,这两个平台都不被许多人关注。从相关性分析结果上看,不同学科的这两个指标与被引频次的相关关系并无明显规律,博客被引数量、Google+提及数量中不与被引频次显著相关的学科均有6个,而且显著相关的相关系数有正有负,并无明显规律,说明这些指标在高被引论文评价时并无较好的参考价值。

总的来说,从与被引频次的相关性分析来看,不同学科高被引论文的Altmetrics指标呈现相似特征。高被引论文的被引频次与包括Twitter、Facebook、新闻这些大众媒体平台中的Altmetrics指标显著负相关,其中推文提及数量相关系数绝对值最大;高被引论文的被引频次与以专利、Mendeley、政策、Wikipedia、F1000这些学术化内容与社区中的指标显著正相关,其中专利引用数量、Mendeley读者数量相关系数绝对值最大;高被引论文的被引频次与博客、Google+这些并不流行社交媒体的相关关系并无明显规律。这同时说明,在大众化社交媒体中,即使是高被引论文集合,并不因它们被引频次高受到更多关注,反而是被引频次更低的高被引论文会在社交媒体中受到更多关注;而在参与者多是研究人员的学术化社区中,仍然是被引频次更高的高被引论文受到更多关注。

3 总结

本文以ESI数据库中22个学科的高被引论文为研究对象,对各学科中Altmetrics指标数量、Altmetrics指标覆盖率及Altmetrics与被引频次的相关性进行分析,并根据计算结果对Altmetrics指标逐步分类筛选。根据以上分析结果,得出以下研究结论。

11月16日晚间,沪深交易所正式发布实施上市公司重大违法强制退市实施办法,并修订完善相关规则办法。与此同时,深交所启动对长生生物重大违法强制退市机制,该公司停牌。

模型中,i和t分别表示不同省份和年份;C1、C2、C4分别表示投资、技术创新和人口对产业结构升级的作用效应;C3表示非老龄人口比例对产业结构升级的影响,当C3>0时,表示老龄化程度越高,越不利于产业结构升级;C5表示分配给劳动人口的资源比例对产业结构升级的影响,当C5<0时,表示分配给老龄人口的资源越多,越能促进产业结构升级。

1)许多Altmetrics指标可用于丰富高被引论文的影响力评价体系。无论是什么学科,Twitter、Facebook、新闻、专利、Mendeley、政策、Wikipedia、F1000、博客、Google+这些指标都是对高被引论文提及数量较多、覆盖率较高的指标,它们对高被引论文的影响力评价有一定的参考意义。与一般论文不同,Twitter、Facebook、新闻这些大众媒体平台中的Altmetrics指标与高被引论文的被引频次都呈显著负相关,说明大众媒体对高被引论文的关注并不直接受到被引频次的影响,这些指标适用于高被引论文的社会影响力评价。其中,专利、Mendeley、政策、Wikipedia这些学术化内容与社区中的影响与高被引论文的被引频次显著正相关,这些指标可以用于丰富高被引论文学术影响力的评价体系。

2)不同学科高被引论文的大部分Altmetrics指标呈现相似特征,而对于F1000、博客、Google+这三个对高被引论文提及数量较多、覆盖率较高的指标,不同学科有一些差异。F1000是医学类学术工具,少量非医学类学科高被引论文的被引频次与F1000中的提及并不为显著正相关,这与一般学术类工具的提及与高被引论文被引频次显著正相关的结果不同。博客、Google+这两个指标虽然提及数与覆盖率也挺高,但不同学科高被引论文的被引频次与这两个指标的相关性并不一致;然而由于博客、Google+都是已经没落的社区,其代表的Altmetrics指标特征也无需进一步关注。

3)Altmetrics指标体系需要淘汰一些指标,并开发一些新的指标。在移动设备发展迅猛的今天,许多传统的在线社区关注度已经越来越少。除了上述的Google+与博客,还有一些指标无论在哪些学科中的提及数量与覆盖率都很低,例如LinkedIn,Reddit,Pinterest,Q&A等在线社区与工具,这些Altmetrics指标可以被淘汰。其他提及数量与覆盖率都很低的指标如同行评议提及与视频提及值得进一步观察,从而决定是否被淘汰。同时,Twitter与Facebook为代表的移动端社交媒体给了Altmetrics评价体系新的发展机会,例如许多学术期刊在Twitter或Facebook中有官方账号,期刊层面的影响评价可以成为Altmetrics评价体系中的新的发展机会。

通过研究可知高被引论文与一般论文在Altmetrics指标特征方面存在较大差异,所以在对不同等级的论文进行评估时需要切实考虑到论文本身的性质,将高被引论文与一般论文进行区分,同时也要注意各指标的权重问题,如Twitter、Facebook等社交媒体需要更加受到重视,而LinkedIn、Reddit等在线社区则可以酌情减少比例。

参考文献

[1] 赵雅馨,杨志萍.研究热点探测的替代计量学方法和应用——以信息与计算科学为例[J].情报杂志,2016,35(11):39-44.

[2] PRIEM J,GROTH P,TARABORELLI D.The altmetrics collection[J].PLoS One,2012,7(11):e48753.

[3] PRIEM J,PIWOWAR H A,HEMMINGER B M.Altmetrics in the wild:using social media to explore scholarly impact[J].Computer Science,2012.

[4] CHEN S,ARSENAULT C,LARIVIRE V.Are top-cited papers more interdisciplinary?[J].Journal of Informetrics,2015,9(4):1034-1046.

[5] HU Z G,TIAN W C,XU S M,et al.Four pitfalls in normalizing citation indicators:An investigation of ESI’s selection of highly cited papers[J].Journal of Informetrics,2018,12(4):1133-1145.

[6] HAMMARFELT B.Using altmetrics for assessing research impact in the humanities[J].Scientometrics,2014,101(2):1419-1430.

[7] BALKE W T,BALKE W T,BALKE W T.What does Twitter measure?:influence of diverse user groups in Altmetrics[C].ACM/IEEE-Cs Joint Conference on Digital Libraries,2015:119-128.

[8] ERDT M,AW A S,AUNG H H,et al.Investigating singapore's altmetric landscape[J].Proceedings of the Association for Information Science & Technology,2016,53(1):1-9.

[9] 刘晓娟,余梦霞.Altmetrics覆盖率影响因素及应用分析[J].图书情报工作,2018,62(16):92-101.

[10] 余厚强,HEMMINGER B M,等.新浪微博替代计量指标特征分析[J].中国图书馆学报,2016,42(4):20-36.

[11] 余厚强,肖婷婷,王曰芬,等.政策文件替代计量指标分布特征研究[J].中国图书馆学报,2017,43(5):57-69.

[12] SHUAI X,PEPE A,BOLLEN J.How the scientific community reacts to newly submitted preprints:article downloads,Twitter mentions,and citations[J].PLoS One,2012,7(11):e47523.

[13] HAUSTEIN S,PETERS I,SUGIMOTO C R,et al.Tweeting biomedicine:An analysis of tweets and citations in the biomedical literature[J].Journal of the American Society for Information Science & Technology,2014,65(4):656-669.

[14] ZHANG L,WANG J.Why highly cited articles are not highly tweeted? A biology case[J].Scientometrics,2018,117(1):495-509.

[15] BAR-ILAN J,HAUSTEIN S,PETERS I,et al.Beyond citations:Scholars’ visibility on the social Web[J].arXiv preprint arXiv:1205.5611,2012.

[16] LI X,THELWALL M,GIUSTINI D.Validating online reference managers for scholarly impact measurement[J].Scientometrics,2011,91(2):461-471.

[17] MAFLAHI N,THELWALL M.When are readership counts as useful as citation counts? Scopus versus Mendeley for LIS journals[J].Journal of the Association for Information Science and Technology,2016,67(1):191-199.

[18] MOHAMMADI E,THELWALL M.Mendeley readership altmetrics for the social sciences and humanities:Research evaluation and knowledge flows[J].Journal of the Association for Information Science and Technology,2014,65(8):1627-1638.

[19] 金玮,赵蓉英,等.用户在社会化引文软件中的阅读数据积累程度与有效性分析——以Altmetrics指标为例[J].现代图书情报技术,2015,31(11):75-81.

Analysis on Altmetrics Indicators Characteristics of Highly Cited Papers in Different Disciplines

Abstract :[Purpose/significance] This paper explores the use of highly cited papers in social media and the availability of Altmetrics indicators of highly cited papers by studying the characteristics of Altmetrics in different disciplines of highly cited papers,the coverage rate of Altmetrics and the correlation between Altmetrics and the cited index,to provide practical basis for subsequent researchers.[Method/process] Hot papers and highly cited papers in 22 disciplines in ESI database are selected as research objects to explore the relationship of size between Altmetrics and traditional citation indicators and the relationship of coverage rate of the setwo indicators in different disciplines.The data acquisition time is May 15,2018.[Result/conclusion] The characteristics of Altmetrics are similar between different disciplines.Altmetrics score,Mendeley’s readership and citation frequency are all very large.Altmetrics has high coverage in medical-related disciplines and low coverage in computer and math.

Keywords :Altmetrics;highly-cited papers;indicators characteristic;citation frequency

DOI: 10.16353/j.cnki.1000-7490.2019.09.010

*本文为国家自然科学基金项目“创新2.0超网络中知识流动和群集交互的协同研究”(项目编号:71373194)和国家自然科学基金项目“信息不对称驱动的共享经济去中心化机制与风险的复杂性研究”(项目编号:71874131)的成果。

作者简介: 黄晓 ,男,1992年生,博士。研究方向:文献计量与科学评价。高嘉慧 ,女,1995年生,硕士生。研究方向:共享经济与在线医疗。吴江 (通讯作者),男,1978年生,博士,教授,博士生导师。研究方向:社会网络计算,大数据科学学,信息计量与信息服务。

作者贡献声明:黄晓 ,论文选题,收集、清洗和分析数据,论文写作。高嘉慧 ,文献调研,制作图表,论文写作。吴江 ,提出研究思路,论文写作指导,论文修改。

录用日期: 2019-03-27

标签:;  ;  ;  ;  ;  ;  

不同学科高被引论文的Altmetrics指标特征分析论文
下载Doc文档

猜你喜欢