基于改进的h指数的学者评价研究
熊回香1,叶佳鑫1,丁 玲2,曾 婷2
(1.华中师范大学信息管理学院,武汉 430079;2.武汉市国土资源和规划信息中心,武汉 430014)
摘 要 h指数是目前常用的科学计量指标之一,其通常被用来衡量学者的学术能力。针对h指数忽略高被引论文等问题,本文对不同h指数时论文的被引情况进行了深入分析,计算出了h指数一定时的论文平均被引数。在此基础上,提出了一个新的指标:hc 指数。该指标由hc1指数与hc2指数构成,hc1指数用来衡量学者的学术能力是否超出或低于当前h 指数下的平均数值,hc2指数用来衡量作者近年来的学术活跃程度。以数字图书馆、数字档案馆与数字博物馆领域的学者为对象进行的实证研究表明,hc指数能够较好地衡量作者的学术能力,缓解了h指数忽略高被引论文等问题,可用来发现近年来的活跃学者,并能依据不同领域的实际情况来进行评价。
关键词 学者评价;h指数;被引频次;hc指数;普赖斯定律
1 引言
学者评价是现代科研活动中重要的一环,也是科学评价的重要组成部分。一方面,不同学者间的研究水平存在着巨大的差异,在科学资源有限的情况下,只有在对学者进行评价后,才能保证学术资源的合理分配,使得有限的资源得到充分合理的利用;另一方面,学者本身也希望自身的科研成果能够被公正地评判,科研成果得到公正的认可能保证学者的学术积极性。此外,通过对学者进行评价,也可以找出某领域的带头人和活跃学者,通过观察其学术成果可以对领域的研究动态有一个清晰、准确的了解。
(1)初始化。设定初始标称值x,u;初始波动w0,x0;控制时域p,优化时域m,计算时长k;权系数Q;卡尔曼增益系数Kf。
自美国物理学家J.E.Hirsch 于2005 年提出用于评价学者个人科研水平的h 指数后,h 指数就因其公正性和简便性而被广泛应用于科学评价的各个领域。但是h 指数也存在一些不足之处,如对高被引论文的忽略、只升不降等,这些不足对h 指数的应用产生了一定的影响,为了使得h 指数能在科学评价中被更好地应用,很有必要对h 指数进行改进。
研究中所用软件版本为SPSS19.9,计量资料用(± s)表示,组间比较采用t检验,计数资料用n(%)表示,组间比较采用χ2检验,P<0.05为差异具有统计学意义。
本文在对h 指数的特征及现有的相关研究成果进行调研分析的基础上,提出了一种改进的h 指数,将其称为hc 指数,该指数的提出旨在尽可能地解决h 指数存在的不足,同时保留h 指数现有的优势,并扩充h 指数的应用多样性,使其能对学者、科研机构及其他评价对象进行更为全面细致的评价。
2 h指数
2.1 h指数的定义
h 指数作为一种科学评价指标,综合考虑了学者论文的数量与质量,J.E.Hirsch 对其的定义为,“如果一个学者总共发表的论文数为Np,其中有h 篇论文的被引次数都大于或者等于h,其他的(Np-h)篇论文被引次数都小于h,则该学者的科研水平指数就为h”[1]。
虽然J.E.Hirsch 对h 指数的定义是针对学者个人的学术评价,但h 指数也可用来对科研群体或学术期刊等进行评价[2],目前h 指数已作为评价指标被引入国内外各种数据库,在基金支持机构或学校的基金授予、人才引进等方面也发挥着不小的作用[3]。此外,也有学者将h 指数改进后应用于网页评价等其他领域中[4]。
2.2 h指数的优势
h 指数最大的优势在于其对“质”与“量”的兼顾,能对学者进行较为公正的评价;除此之外,h 指数的计算容易实现,仅仅通过简单的测量就能用单一的指标来描述学者的生产率及影响力[5]。h指数的评价方式可以有效避免学者片面地追求论文数量而忽略了论文的质量,又能有效激发学者对深层次问题进行探讨的热情[6]。同时,h 指数的提出丰富了科学计量及文献计量学的内容,使得评价方式更为多样化,推进了计量学的发展。
2.3 h指数的不足
在用hc 指数进行学者评价之前,需求得各领域中不同h 指数下的理应被引论文数。数字图书馆、数字档案馆、数字博物馆领域中各学者相关信息如表1~表3 所示。
3 h指数的改进——hc指数
3.1 国内外相关研究
为了使得h 指数能被更好地应用,目前国内外已经有很多学者对其进行了相应的扩展。根据定义及计算方法可将扩展指数分为以下四类[9]。
第一类,以h 指数为基础的扩展指数,如金碧辉等[10]提出的AR 指数、R 指数。其中AR 指数通过对被引频次大于h 的论文进行衡量来弥补h 指数只能增加不能减少的缺陷。R 指数则可用来对h 指数相同的学者进行进一步比较。
We also looked for the correlation between various clinical features and levels of tested markers in CP patients. No correlation was found between tumor size,localization and serum TGF-β1, MCP-1, s-Fr and HA levels.
第三类,用于评价不同领域学者的扩展指数,如Namazi 等[12]提出的n 指数。n 指数通过将学者的h 指数与其主要研究领域中最高的h 指数进行对比得出,n 指数能描述学者在某一领域中的学术水平,并且能进一步实现跨领域的学者学术能力对比;但是其在进行跨领域的学者对比时,将所有领域视为水平相当,未进行不同领域的差异性分析。
第四类,考虑合作关系的扩展指数,如Hirsch[1,13]提出的h-bar 指数。h-bar 指数能给独立或者较少有合作行为的学者进行加分,h-bar 指数可以识别名义上的合作,同时又不忽视真正的合作,但是存在算法过于复杂的缺点。
通过分析现有的扩展方法可以发现,目前对h指数的扩展主要是从一些特定的方面进行,扩展后的指数通常只能对h 指数1~2 处不足进行弥补,很少有扩展指数能对h 指数进行较为全面的改进。本文提出的hc 指数旨在对h 指数存在的高被引频次论文及被引频次小于h 的论文的忽略、只升不降、不同学科领域的评价、灵敏度缺乏等问题进行改进,以对h 指数进行较为全面的扩展。
3.2 hc指数的定义及计算方式
在进行hc 指数的计算前,本文对学者的h 指数与论文被引总数进行回归分析,通过回归函数计算出不同h 指数对应的论文被引总数并将其称为论文理应被引总数。论文理应被引总数能反映出h 指数一定时的论文被引数的均值,将其与学者的实际论文被引数进行对比能得出学者与当前h 指数的匹配程度。
在计算出论文理应被引数的基础上,本文将学者的论文被引次数与当前h 指数下的论文理应被引次数进行对比分析,以此衡量学者与当前h 指数的关系,并将其称为学者的被引程度;被引程度高的学者其学术能力超过当前h 指数,被引程度低的学者其学术能力低于当前h 指数。同时,参考普赖斯指数用来描述文献老化程度的方法,将学者近5 年论文被引次数与当前h 指数下近5 年论文理应被引次数进行对比分析,将其称为学者的活跃程度;活跃程度用来反映学者的学术潜力,活跃程度高的学者其学术能力有较大可能提升,活跃程度低的学者其学术能力有较大可能降低。
基于以上论述,本文将hc 指数分为hc1指数与hc2指数两部分,hc1指数用来描述被引程度,hc2指数用来描述活跃程度。hc1指数定义为,h 指数为n 的学者其论文被引总次数与h 指数为n 的学者论文理应被引总次数的比值。hc2指数定义为,h 指数为n 的学者其5 年间论文被引总次数与h 指数为n 的学者5 年间论文理应被引总次数的比值。将hc1指数与hc2指数进行整合,随后与原h 指数结合对其进行相应调整即可得到hc 指数。
hc1指数、hc2指数与hc 指数的计算公式为
其中,C S为论文被引总数,C T为h 指数一定时的论文理应被引总数,两者的比值可用来描述学者与当前h 指数的匹配程度。数值大于1,则说明该学者的学术能力强于该h 指数;数值等于1,说明该学者的学术能力等于该h 指数;数值小于1,则说明该学者的学术能力弱于该h 指数,强于或弱于h 指数的程度与比值的大小相关。C FS为5 年间论文被引总次数,C FT为5 年间h 指数一定时的论文理应被引总数,两者的比值可用来描述学者近5 年来的学术活跃程度。数值大于1,说明该学者的活跃程度强于该h 指数;数值等于1,说明该学者的活跃程度等于该h 指数;数值小于1,则说明该学者的活跃程度弱于该h 指数。强于或弱于h 指数的程度与比值的大小相关。n 1为hc1指数对hc 指数的影响系数,n 2为hc2指数对hc 指数的影响系数,h x为以h 指数为基础的调节系数,其取值与h 指数相关。
New Media to Bridge the Gap between Migrant Workers and More Matched-up Jobs: An Investigation and Analysis Based on Four Cities in the Yangtze River Delta Region
4 基于hc指数的学者划分
为了更好地对学者的学术能力进行描述,本文基于hc 指数将学者划为4 种类别:①被引程度较高的活跃学者,学术影响力和活跃度都高于当前h 指数水平。②被引程度较高的非活跃学者,学术影响力高于当前h 指数水平,活跃度低于当前h 指数水平。③被引程度较低的活跃学者,学术影响力低于当前h 指数水平,活跃度高于当前h 指数水平。④被引程度较低的非活跃学者,学术影响力和活跃度都低于当前h 指数水平。划分结果如图1 所示。
图1 中显示了四类学者间的潜在转换关系,从图1 可以看出活跃程度较低的学者其被引程度会逐渐降低,活跃程度较高的学者其被引程度会逐渐增加,其升降的速度与学者的活跃程度相关,即活跃程度越高的学者其被引程度增加越快且其h 指数越有可能提高,活跃程度越低的学者其被引程度减少越快且其h 指数越有可能维持不变。
由以上分析可见,设备改造后不仅有功电能节电率高,节省了大量的耗电成本,同时大大减少了无功消耗,提升了功率因素;同时提升了作业效率,节省了作业台班成本;并且有效提升了设备的安全系数,有利于供电系统性能及工作环境条件的改善。下一步工作将继续跟踪观察开放式炼胶机电力拖动系统改造后的运行情况及改善正常工作情况下的制动功能。
从表1~表3 可以看出,h 指数与被引总数有较强的正相关关系。为使得该关系更为明确,应用SPSS 软件进行回归分析,建立两个变量间关系模型,其中h 指数为解释变量,被引总数为被解释变量,依据三领域中两变量间的关系选择线性、二次与幂拟合模型。各领域拟合度最高的模型分别如图2~图4 所示。
图1 基于hc指数的学者划分
5 hc指数在学者评价中的应用
5.1 数据来源
为了验证hc 指数在不同领域中评价的有效性,本文选取数字图书馆、数字档案馆、数字博物馆三个领域来进行评价。这三个领域在具有一定联系的同时,其学者特征又存在较大的差异,选定这三个领域的学者来进行评价可以很好地对结果进行对比与分析。在知网上分别以数字图书馆、数字档案馆、数字博物馆为主题进行精确检索,统计2008—2017 年的相关学者信息(为了提高学者选择效率仅统计发表于核心期刊的论文)。经统计,2008—2017 年数字图书馆领域发文学者有1417 人,其中被引频次最高的论文被引次数为347 次;数字档案馆领域发文学者有1057 人,其中被引频次最高的论文被引次数为68 次;数字博物馆领域发文学者有181 人,其中被引频次最高的论文被引次数为24 次。
考虑到被评价学者的代表性,本文在进行学者评价时使用普赖斯指数对学者进行了筛选。首先使用普赖斯指数来选出各领域的高产学者,按照普赖斯定律,撰写全部论文一半的高产学者的数量等于全部科学学者的平方根。公式表示为,n (x )为撰写x 论文的学者数,i =n max为领域内最高产学者的论文数,N 为学者总数[14]。根据普赖斯定律,数字图书馆领域高产学者是发表论文数为11~12 的学者,选择发表论文数为11 以上的74 位学者为高产学者;数字档案馆领域高产学者为发表论文数为4~5 篇的学者,选择发表论文数5 以上的28位学者为高产学者;数字博物馆领域高产学者为发表论文数为2 的学者,选择发表论文数2 以上的21位学者为高产学者。
又如鲍照的《王昭君》不再繁复用典,仅以简单、明净的意象取胜,全诗无一句正面描写昭君的容貌神情,却在景物和意象描写营造的意境中,处处留给读者无穷的想象空间。
5.2 相关系数分析
虽然h 指数具有较广的应用范围,其在进行学者评价时也具有同时关注论文数量和质量的优点,但h 指数也存在一些不足之处:①h 指数存在不能减少只能增加的问题,无法对学者的学术影响力变化状况进行描述;②在不同学科领域中,h 指数情况存在较大差异;③无法对年轻学者进行较为准确的评价;④论文数量少而被引频次高的学者其学术影响力会被低估;⑤无法测度科研团队中个人学者的学术影响力;⑥针对h 指数相同的学者,无法区分他们的学术影响力大小;⑦灵敏度缺乏,h 指数较高时会难以上升,存在数年h 指数不变的情况,难以对高h 指数的学者进行近期评价;⑧h 指数进行评价时都是以长期时间来进行,缺乏短期视角的评价[7-8]。
地西泮(Diazepam纯度99.4%)、甲硝唑(Metronidazole,MNZ纯度99.9%)、地美硝唑(Dimetridazole,DMZ纯度99.9%)、洛硝哒唑(Ronidazole纯度99%)、羟甲基甲硝咪唑(HMMNI纯度99%)和羟基甲硝唑(MNZOH纯度99.4%)。
表1 数字图书馆领域学者信息
表2 数字档案馆领域学者信息
表3 数字博物馆领域学者信息
基于学者的被引程度与活跃程度对学者进行划分,一方面能对学者的学术能力进行更为细致的描述,一方面也为研究人员查找论文带来一定的便利。例如,当需要查找某领域的基础性研究成果时,可对学者类型①与学者类型②的学者成果进行搜索,这两类学者的被引程度较高,其成果有较为可能包含一些研究方向的基础性研究。当要对某领域最新的研究成果进行查阅时,可直接对学者类型①与学者类型③的学者成果进行搜索,这两类学者的活跃程度较高,说明其近几年持续在该领域进行研究,其成果能在一定程度上反映出领域内近几年的研究趋势。
图2 显示的是数字图书馆领域拟合度最高的模型——幂模型(R 2=0.726),函数表示为,被引总数=5.807h 1.745。
图3 显示的是数字档案馆领域拟合度最高的模型——二次模型(R 2=0.622),函数表示为,被引总数=53.732 -14.33h +3.332h 2(数字档案馆领域中仅有学者郭伟h 指数为2,且其论文被引数较高,在进行回归分析时会产生较大误差,故分析时舍去了该样本)。
图4 显示的是数字博物馆领域拟合度最高的模型——幂模型(R 2=0.930),函数表示为,被引总数=6.642h 1.379。
在选出高产学者后为了进一步控制待评价学者的数量以及保证所选学者具有一定的h 指数,对其进行再次筛选,选出其中发表过高被引论文的学者来进行评价。根据普赖斯定律[15],高被引论文的分布可用公式M =0.749×表示。数字图书馆、数字档案馆、数字博物馆领域的高被引论文最低被引频次分别为13.95、6.18、3.67,设定各领域高被引论文最低被引频次为14、6、4 以确保结果不失一般性。最后从数字图书馆、数字档案馆、数字博物馆领域分别选出68、21、16 位学者作为待评价学者。
用户可以通过控制按键上的按键来实现单片机对系统状态的控制。通过选择按键,可以实现单片机数据的输入、命令的传输以及人工控制发送紧急短信等。单片机系统包括两个常用的按键,分别是机械式按键和薄膜按键。按键实质上是一组按键开关的集合,通过控制按键的闭合来实现行线对高电平和低电平的呈现。
第二类,独立的扩展指数,如Egghe[11]在分析h指数评价效果时提出的g 指数。g 指数打破了文献总数的限制,首先将学者的论文按被引频次进行排序,若学者的论文总数为N,则只有当N 篇论文中有g 篇论文总共获得了不少g2 次的被引次数,而g+1 篇论文的总被引数少于(g+1)2,则学者的评价指数为g。g 指数在评价被引频次较高但文献产出数较少的学者时较为有效。
2月16日,水利部与浙江省人民政府在杭州签订《贯彻落实中央1号文件共同推进浙江水利改革发展促进浙江海洋经济示范区建设的合作备忘录》。双方将共同落实好合作备忘录确定的各项任务,共同推进浙江水利跨越式发展。
图2 数字图书馆领域拟合模型
图3 数字档案馆领域拟合模型
图4 数字博物馆领域拟合模型
在确定了各模型后,将h 指数应用于各模型求得相应的被引总数将其作为论文理应被引总数。随后,计算近5 年论文理应被引数:
其中,C Sy为近y 年间某领域内学者论文被引总数;C Ty为近y 年间论文理应被引数。在本实验中,C S为2008—2017 年各领域内学者论文被引总数;C Sy为2013—2017 年各领域内学者论文被引总数;C T为2008—2017 年论文理应被引数,C Ty为2013—2017年论文理应被引数。
以数字图书馆领域为例,h 指数为14 时的论文理应被引总数通过函数C T=5.807×141.745 计算,其值为580.691;该领域作者论文在2008—2017 年共被引14987 次,其中2013—2017 年共被引4723 次,故数字图书馆领域2013—2017 年论文理应被引数=(4723/14987)×2008—2017 年论文理应被引总数,当h 指数为14 时,C Sy=(4723/14987)×580.691=183.109。
利用拟合得到的函数与公式(3)来对表1~表3 中的数据进行处理,求得各领域的h 值及其对应的2008—2017 年论文理应被引总数、2013—2017 年论文理应被引数,结果如表4 所示。
表4 各领域相关系数
公式(3)中,n 1为hc1指数对hc 指数的影响系数,hc1指数描述的为学者的被引程度;n 2为hc2指数对hc 指数的影响系数,hc2指数描述的为学者的活跃程度。活跃程度是对学者学术能力的预测值具有一定的不确定性而被引程度为确定性值,故本文设置活跃程度对hc 指数的影响小于被引程度,即n 1>n 2;为控制hc 指数的数值,本文取n 1+n 2=1,其中n 1=0.7,n 2=0.3。h x为以h 指数为基础的调节系数,其取值与h 指数相关,为了控制hc 指数的数值,本文取hx=。在分析完相关系数后,下文将继续计算不同领域中各学者的hc 指数,以对其进行验证与分析。
另一方面,长三角危险品运输缺乏科学的法律规范体系,监督管理方式不健全,法律规范的有关规定尚未得到有效落实,因此给危险品的道路运输管理带来重重困难。长江三角洲作为中央政府定位的中国综合实力最强的经济中心,经济处于高速发展阶段,危险品道路运输货运量与日俱增,但是与此同时,相关法律制度建设却相对滞后、执行力度弱,长江三角区道路运输迅猛发展,该区域有关危险货物道路运输法律规范的建设步伐较慢,导致监督管理体系不完善,难以对危险货物道路运输作业进行有效的规范。
5.3 数字图书馆领域学者评价
应用公式(1)~公式(3)计算表1 中各学者的hc1、hc2、hc 指数,同时为了对结果进行分析与评估,计算出hc 指数相较于h 指数的变化率,变化率计算公式为×100%,其结果如表5 所示。
去年3月底,关小美怀孕了!在动员女儿流产遭到拒绝后,关云飞夫妇无奈之下只得同意他们继续交往。但是提出,郭启明必须先买房,才能和关小美结婚。很快,郭启明和关小美一起选中了一套价格60多万元的二手房。
世界各国都在对土壤重金属污染修复技术进行广泛研究,其主要修复方法有:工程修复措施、化学修复措施、生物修复措施等[13-15]。
表5 数字图书馆领域学者评价结果
如表5 所示,数字图书馆领域大部分学者hc 指数相较于h 指数的变化率在10%以内,这些学者的被引程度、活跃程度与自身h 指数较为符合。该领域中变化率最为明显的学者为王世伟,其h 指数为8,hc1指数为2.544,2008—2017 年论文总被引数为775 次,被引数在所有被评价学者中仅次于初景利的824 次,而初景利的h 指数为14;王世伟的hc2指数为0.32,其近5 年活跃程度也大于h 指数为8 时的伦理数值,故其hc 指数为11.753,相较于h 指数产生了较大增长。王世伟在2008—2017 年发表了论文“未来图书馆的新模式——智慧图书馆”与“论智慧图书馆的三大特点”,在2008—2017 年数字图书馆领域的所有论文中这两篇论文被引数分别排在第2 位与第4 位,由此可见王世伟在数字图书馆领域有较大的学术影响力,而其h 指数仅为8,排在所有被评价学者的第18 位,相较于其在该领域的学术影响力存在一定的偏差。利用hc 指数进行评价,王世伟hc 指数为11.753,在所有被评价学者排在第7 位,与其学术影响力较为契合。
5.4 数字档案馆领域学者评价
应用公式(1)~公式(3)计算表2 中各学者的hc1、hc2、hc 指数以及hc 指数相较于h 指数的变化率,结果如表6 所示。
如表6 所示,数字档案馆领域大部分学者hc 指数相较于h 指数的变化率在10%以内。该领域中杨来青的变化率最为明显,其hc 指数相较于h 指数增长了约1 倍,其h 指数为3,hc1指数为1.603,2008—2017 年论文总被引数为106 次,被引数接近于h 指数为7 时的理论数值;杨来青的hc2指数为4.479,观察学术经历发现其在2008—2017 年10 年间,仅在后5 年即2013—2017 年发表论文,可判断其在数字档案馆为新学者且近五年有较高的学术活跃度,故其hc 指数为6.02,相较于h 指数产生了较大增长。针对领域内的新学者,hc 指数可通过其近年来的活跃程度对其h 指数进行一定的预测,若学者有较高的hc 指数,则其h 指数未来几年有较大的增长可能。
表6 数字档案馆领域学者评价结果
5.5 数字博物馆领域学者评价
应用公式(1)~公式(3)计算表3 中各学者的hc1、hc2、hc 指数以及hc 指数相较于h 指数的变化率,结果如表7 所示。
表7 数字博物馆领域学者评价结果
如表7 所示,数字博物馆领域有部分学者hc 指数相较于h 指数的变化率在10%以内,另有部分学者变化率大于40%。该领域学者变化率差异较大主要是由于进行回归分析的样本过少,所建立的模型函数存在一定的局限性。该领域中赵生辉与朱学芳hc 指数相较于h 指数的增长较大,观察学术经历发现其在2008—2017 年10 年间,仅在后5 年即2013—2017 年发表论文且论文总数大与理论数值,故hc指数增长较大;该领域中,柴敏与郭治兴hc 指数相较于h 指数的减幅较大,观察学术经历发现其在2008—2017 年10 年间,仅在前5 年即2008—2012 年发表论文且论文总数小于理论数值,故hc 指数减幅较大。通过观察对比可以发现,赵生辉与朱学芳、柴敏与郭治兴的各项指数均相等,查询其发表的论文发现在数字博物馆领域中他们仅发表过彼此合作的论文,故其各指数相等,这也反映出了h 指数对作者顺序的忽略,以后可对此进行改进。
5.6 学者划分
在本文的第3 节已经提出了利用hc 指数来对学者进行划分的大体思路,本文的学者划分方法是基于学者的被引程度与活跃程度来进行的,在文中分别用hc1指数与hc2指数来表示。进行学者划分时,设置hc1指数≥0 的学者为被引程度较高的学者,hc1指数<0 的学者为被引程度较低的学者,hc2指数≥0的学者为活跃程度较高的学者,hc2指数<0 的学者为活跃程度较低的学者。
利用hc 指数来对本文第4.3 节、第4.4 节、第4.5 节分析得到的变化率最大的6 位学者进行类型划分,结果如表8 所示。
表8 基于hc指数的学者划分
从学者划分的结果来看,6 位学者被划分为两种类型,即①被引程度较高的活跃学者与④被引程度较低的非活跃学者。而未有学者被分为②被引程度较高的非活跃学者与③被引程度较低的活跃学者,这是因为所选的6 位学者其hc 指数相较于h 指数的变化率较大,而通常学者类型②与③的学者其hc 指数相较于h 指数的变化率较小。通过学者划分我们可以发现,学者类型为①的4 位学者其被引程度与活跃程度均较高,具有较大的学术潜力。
5.7 结果分析
基于hc 指数在数字图书馆、数字档案馆与数字博物馆领域的应用,可以发现hc 指数具有以下优势:①弥补了h 指数对高被引论文及被引频次小于h 的论文的忽略,当学者的论文总被引数较高时会适当提升对学者的评价。②解决了h 指数只能增加不能减少的缺点,当学者的学术活跃程度降低时,会适当降低对学者的评价。③对于领域内的新进学者,通过活跃程度来对其以后的学术能力进行预测,当作者活跃程度较高时,会获得较高的学术评价。④在不同的学术领域选用了对应系数,考虑到了不同研究领域的特性。⑤将对学者的评价分为了被引程度与活跃程度,前者可用来衡量学者的总体学术水平,后者可用来发现近年来较为活跃的学者。⑥利用指数对学者进行了类型划分,可以更为直接地了解学者的学术特征。
基于具体应用也可发现hc 指数存在以下不足之处:①在对学者进行评价之前需事先从数据库中进行样本收集,增加了一定的时间成本;②算法依赖于对现有样本进行回归分析,当某领域内样本数量过少时会对结果造成影响;③在不同领域需要重新进行模型拟合与系数计算,增加了计算的复杂性;④没有考虑到同一篇论文中作者顺序不同对学者评价的影响。
6 结语
为了使得科学评价能够更好地适用于不同领域,以及发现不同领域内的活跃学者,对h 指数较高的学者进行活跃性评价,本文提出了一种以h 指数为基础的改进指数——hc 指数。hc 指数在保存h指数考虑论文质量与论文数量的优点的同时,对h指数忽略高被引与低被引论文、只升不降、对新学者难以评价等问题进行了相应改进。通过分析学者的论文总被引数及其几年来的活跃程度对学者评价的结果进行改进,当学者总被引数较高、活跃程度较高时会获得较高的评价,学者总被引数较低、活跃程度较低时其评价也会降低。本文将hc 指数应用于数字图书馆、数字档案馆与数字博物馆领域,从研究结果可以发现,在样本数量足够的情况下hc 指数具有较好的评价效果,能够有效评判学者的学术水平,以及发现活跃学者。hc 指数也有一些不足之处,如依赖于对样本进行分析、未考虑作者顺序等,在以后的工作中可以对此进行相应改进。
参考文献
[1]Hirsch J E.An index to quantify an individual's scientific re‐search output[J].Proceedings of the National Academy of Sci‐ences of the United States of America,2005,102(46):16569-16572.
[2]赵基明,邱均平,黄凯.一种新的科学计量指标——h 指数及其应用述评[J].中国科学基金,2008,22(1):23-32.
[3]吕娜.科研人员h 指数动态变化趋势分析[J].情报理论与实践,2015,38(5):112-115.
[4]Bar-Ilan J,Levene M.The hw-rank:An h-index variant for rank‐ing web pages[J].Scientometrics,2015,102(3):2247-2253.
[5]Ruscio J.Taking advantage of citation measures of scholarly im‐pact:Hip hiph index![J].Perspectives on Psychological Science,2016,11(6):905-908.
[6]金碧辉.科学家为自己设计了一项评价指标:h指数[J].科学观察,2006,1(1):8-9.
[7]高志,张志强.个人学术影响力定量评价方法研究综述[J].情报理论与实践,2016,39(1):133-138.
[8]Wildgaard L,Schneider J W,Larsen B.A review of the character‐istics of 108 author-level bibliometric indicators[J].Scientomet‐rics,2014,101(1):125-158.
[9]俞立平,王作功.时间视角下h 指数创新:h1n指数与hn指数[J].情报学报,2017,36(4):346-351.
[10]金碧辉,Ronald R.R 指数、AR 指数:h 指数功能扩展的补充指标[J].科学观察,2007,2(3):1-8.
[11]Egghe L.An improvement of the h-index:The g-index[J].ISSI Newsletter,2006,2(1):8-9.
[12]Namazi M,Fallahzadeh M.n-index:A novel and easily-calcula‐ble parameter for comparison of researchers working in different scientific fields[J].Indian Journal of Dermatology,Venereology,and Leprology,2010,76(3):229.
[13]Hirsch J E.Does the h index have predictive power?[J].Proceed‐ings of the National Academy of Sciences of the United States of America,2007,104(49):19193-19198.
[14]李小霞.近年来国内洛特卡定律研究综述[J].科技情报开发与经济,2005(13):27-28.
[15]Senda K.Research viewpoint of Price Law[J].Bulletin of the Faculty of Life and Environmental Science-Shimane University(Japan),2000,5:37-44.
Scholar Evaluation Research Based on an Improved h-index
Xiong Huixiang1,Ye Jiaxin1,Ding Ling2 and Zeng Ting2
(1.School of Information Management,Central China Normal University,Wuhan 430079;2.Wuhan Land Resource and Urban Planning Information Centre,Wuhan 430014)
Abstract: The h-index is one of the common scientific indicators that are used to measure the academic ability of scholars.In view of the shortcomings of the h-index,which ignores often-cited papers,this paper analyzes the frequency of citation of papers with different h-indexes and calculates the average number of citations of papers with a certain h-index.On this basis,a new index is proposed:the hc index,which consists of an hc1index and an hc2index.The hc1index is used to mea‐sure whether the scholar’s academic ability is higher or lower than the average value of the current h index;the hc2index is used to measure the author’s academic activity in recent years.Scholars in the fields of digital libraries,digital archives,and digital museums have been selected for empirical research.The research shows that the hc index can better measure the author’s academic ability and that it can solve the problem of the h index ignoring often-cited papers.It can also be used to find scholars who have been active in recent years,and it can evaluate scholars according to the characteristics of different fields.
Key words: scholar evaluation;h-index;citation frequency;hc-index;Price Law
DOI: 10.3772/j.issn.1000-0135.2019.10.003
收稿日期: 2018-10-24
基金项目: 国家社会科学基金年度项目“融合知识图谱和深度学习的在线学术资源挖据与推荐研究”(19BTQ005)。
作者简介: 熊回香,女,1966年生,博士,教授,博士生导师,主要研究领域为网络信息组织与检索,E-mail:hxxiong@mail.ccnu.edu.cn;叶佳鑫,男,1993年生,博士研究生,主要研究领域为网络信息组织与检索;丁玲,女,1974年生,硕士,高级工程师,主要研究领域为数字档案馆;曾婷,1988年生,女,硕士,馆员,主要研究领域为数字档案馆。
(责任编辑 王克平)
标签:学者评价论文; h指数论文; 被引频次论文; hc指数论文; 普赖斯定律论文; 华中师范大学信息管理学院论文; 武汉市国土资源和规划信息中心论文;