用文献计量学方法分析近五年来国外学术出版领域的研究进展_高被引论文

利用文献计量学方法分析国外学术出版领域近5年研究进展,本文主要内容关键词为:计量学论文,研究进展论文,文献论文,学术论文,国外论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2013-05-14

学术出版领域涉及范围相对广泛,比如新闻学、编辑学、出版学和图书情报学。关于此方面进展的综述鲜有报道,为此本研究采用文献计量学的方法对国外知名出版学术类期刊进行文本挖掘以讨论最近5年来的研究前沿。

所谓科学研究的前沿一般认为是科学研究中最先进、最新、最有发展潜力的研究主题或研究领域[1]。目前关于研究前沿还有多种定义,本研究采用Persson提出的理念,即一个学科的研究状况由研究前沿和知识基础(intellectual base)两部分随着时间变化的轨迹来表示,在信息管理学中,知识基础用同被引文献簇表示,研究前沿则由引用知识基础的最新文献群组成[2]。本研究中,对重要刊物上发表的论文所引用的论文进行统计,截取其中被引次数较高的部分论文并统计高被引论文同时被引用的次数,以此将这些论文进行聚类分析,形成了该学科的多个研究方向的知识基础,结果表明这些高被引论文多为该学科研究中使用到的基本理论和重要工具;相应的,我们从这些高被引论文聚类簇所对应的引用文献中挑选出与高被引论文关系最为密切的、最具有代表性的当前论文,作为表示该分支学科各个研究基础的前沿。前沿论文的筛选采用了聚类分析中描述度和区分度等指标[3]。

1 资料与方法

1.1 调查样本的选择

为使本研究中所选择的分析样本能够较全面地反映编辑出版领域的研究热点及前沿,我们查阅了Thomson Reuters 2011年度《期刊引用报告》(Journal Citation Index,JCR),搜集了本领域的所有相关期刊,目前在社会科学引文索引(Social Science Citation Index,SSCI)数据库共收录期刊学、编辑学和出版学类期刊3种[4],分别是Serials Review(SR)、Learned Publishing(LP)、Journal of Scholarly Publishing(JSP),各刊的基本情况见表1。我们选取3种期刊在2008年1月1日至2012年12月31日5年间发表的所有文献,总计期刊论文和综述共678篇,获得7086条参考文献(频数),来自于6537篇参考文献(种数)。

1.2 数据分析

统计3种核心期刊参考文献的频次,根据信息科学中h指数的原理[5],截取出现频次较高的论文作为该学科的高被引论文,以此代表该学科当前的研究热点及开展研究的基础知识。两两配对统计这些高被引论文同时被2008-2012年发表的其他论文所引用的情况,形成高被引论文的同被引矩阵后,利用聚类分析软件(gCLUTO软件,Graphical Clustering Toolkit)进行双聚类分析(biclustering),同时获得高被引论文的分类和对应的引用文献的聚类结果。

分析每个聚类类别高被引论文的标题、文摘和全文,总结归纳相应的研究内容,作为学术出版领域研究中经常引用的热点,可以是学术关注的焦点,也可以是研究中经常使用的方法和观点;同时,根据引用相应高被引论文的引用文献的内容,即2008-2012年发表在3种核心刊物上的、与该热点有关的论文,可以了解到国际学术出版领域近年来研究的前沿。

2 结果

我们对纳入的3种期刊在2008至2012年发表论文的参考文献进行统计分析,得到了被引次数高于4次的35篇论文(表2)。对这些高被引论文进行同被引聚类分析,得到聚类结果(图1)。汇总分析如下。

图1 学术出版领域高被引论文同被引双聚类分析结果

最左侧的聚类树图表示的是35篇高被引论文,对应其最右侧是这些论文的信息,最上面一行则是对应的引用高被引论文的论文,图中的黑色区域表明了这些左边的高被引论文被上面的哪些论文引用。

2.1 科技写作实践与修辞学

作为最基本的技能之一,论文的写作技巧一直是初级科技人员培养内容之一,所以很多科技期刊有涉及这方面的教程推荐或技术支持。近5年这部分的重要进展值得一提的文献有Robert Brown的论著[6],作为一篇文笔顺畅的修辞学方面的文献,该研究的实践价值也很高,该作者比较了人文和社会科学领域的6篇毕业论文和相关6本书的类似段落,观察毕业论文到专著的文辞演变。其目的是将文字修改方面的经验传授给科技编辑、青年教师和毕业生,指导他们如何将这些分散的文字组织成为个人的专著。

其他的进展为Steven E Gump发表在Journal of Scholarly Publishing的3篇书评[7-9]。在2009年发表的书评中,Steven E Gump描述了这本旨在帮助辅助领域作者进行论文写作和出版的科技论文出版的实践技巧的书。该书精巧、实用,可作为学术论文出版的一个初级读本,非常适合在社会服务和辅助性行业工作的学者们和实习者,比如从事社会工作、教育、护士、咨询、心理学、公共行政和刑事司法的工作人员。为体现作者的真知远见,Furman行文谨慎,把著作分成8章,并附有9个练习、1个结论和6个附录。上述内容的设置都围绕学者们要求在学术期刊发表论文的信息和想法展开,实践性可见一斑。Steven E Gump 2010年发表的书评从题目来看,更具有指南性质:期刊论文写作12周——学术出版成功的指南。Steven E Gump提到,该书是一本全面的工作手册,可以让人文和社会科学领域的毕业生和大学初级教员在短期内提升自己的写作能力,将他们的作品在同行评议的期刊发表。2011年Steven E Gump做了一本关于学术论文写作和出版社会学研究方面专著的点评,该书的作者Clarke认为学术写作最终不会是独立的行为,它存在于社会背景下。在这种环境下,我们应如何进行学术生产和分享研究成果。

2.2 机构存储与出版

作为学术产出的重要基地,学术机构还承担一项重要的任务,即实现学术数据和成果的保存和交流。在本研究中,我们遴选了4篇重要的研究结果与大家分享。

Jean-Gabriel Bankiera和Irene Percialib在2008年的一篇文献中[10]再次探究了大学在机构存储中的作用,面对开放获取(OA)出版,大学还能做什么?作者指出,自OA运动蓬勃发展开始,大学一直是OA出版的一个重要参与者,但由于作者上传文档的质量问题,这条绿色通道不断面临着挑战。如今面对着机遇带来的独特机会,大学应该重新改造和鼓励机构存储模式。该文作者讨论了在与研究者交流机构存储时哪些方式是不可行的,以及如何让我们更好地满足学校教职员工的需求。作者认为机构存储不仅仅是个简单的档案库,它也是研究者发表优秀学术作品的陈列室,在OA期刊中出版原始成果的一个平台。

来自香港的Diana LH Chan在2009年报道了香港高等教育机构仓储的发展战略、挑战和方向[11]。该研究整合了这些机构存储的规模、内容、全文和公众开放性。该文也比较了在香港大学教育资助委员会注册的仓储的容量和研究的产量。发现存储作品的比例中期刊和会议的论文较少,毕业论文的比例中等。这些存储率反映了不同机构的存储策略。香港开放获取委员会在认识到这些挑战后,被告知需要解决知识分享中的区域问题。

Xia Jing-feng在2009年的JSP中探讨了图书馆出版在学术交流中的新模式[12]。该文首先简要地比较了图书馆出版和机构存储的历史、现行实践及其趋势,通过介绍某些国外大学出版模式,作者建议图书馆应建立一个不以学科方向构建的机构集合模式,同时建议图书馆出版能具有多样性。

在探讨学协会与出版伙伴的关系上,首先我们知道学协会的出版计划是任务驱动型的,他们在基金资助和传播研究中起到了独特的作用,但从本质上来说,那些资金量小且限制使用的资源,容易扰乱当前的学术出版。在这方面,Ashman Peter为我们带来了一些思考[13],BMJ期刊本身是个学会出版商,但也是跟其他学会签约的出版商。在2008年,作者调研了学会对他们出版合作方的需求。当前学协会出版经营能力下滑的一个威胁来自于学者们不断变化的期待和行为。学协会正努力拓展开发专业方面的活动,最大程度地利用现有技术来维持和发展会员。虽然在选择合作伙伴的时候,学协会首先会看重声誉、技术创新和发展的回报,将赢利能力放在最低的位置,但对于出版项目来说,一个高经济回报也是一个重要的标准。

2.3 开放获取与同行评议

自20世纪90年代末,国际学术界、出版界、信息传播界和图书情报界大规模兴起OA运动以来,OA的进展和成就一直举世瞩目,对其的讨论也不绝于耳。但目前学术界,尤其是读者和作者对其的认知和认可如何,还有待观察。2009年Learned Publishing上发表的一项研究[14]调查了35个英国学术团体的会员对OA的态度,回复1368位,大部分回复者知晓OA,并支持OA期刊。66%的调查者读过OA期刊,25%在其中发表过文章,但这2项提到的期刊有三分之二不是OA期刊。大部分回复者认可OA期刊可提高研究的获得性,但他们也关切OA收取读者费用的问题、学术质量可能下降的问题及其对已有期刊、出版商和学术团体的负面影响。相反,不到一半的调查者知道什么是自存储,只有36%支持,50%对此不敢确定。对于自存储的利用和知晓率相对较低。虽然他们对于自存储的便利性和获取性是确定的,但对于质量控制、读者和机构的工作负担、版本的混乱扩散,对已有期刊、出版商和学会的潜在损害还是有顾虑。

JI-HONG PARK的一项研究了解了科学家实现基于网站学术出版的动机,认为他们了解OA的益处[15]。作者认为,虽然OA期刊可以让研究成果得以更高的显示和更广泛的交流,受到各方的鼓励,但没有证据表明与之相关的益处。尽管出现了很多关于OA作用的争议,我们还未能很好地了解学者关于OA的观念。为此,作者设计了一个基于web的问卷调查,发放给全球的1104位学者,以了解学者们通过OA路径进行出版的情况及其动机。数据显示定义的11个相关动机因素明显地影响了他们进行OA出版的意图。社会影响和学科相关性的因素不是很重要,但对待OA的态度不同程度地依赖于调查者是否授予了终身职务。

在同行评议方面,Souder Lawrence等[16]总结了关于同行评议的研究和评论的文献集合,试图追踪出现在同行评议系统中关键参与者(作者、编者、评审员和读者)间不同的伦理学问题。这些问题包括:偏移、恩惠、利益冲突、重复发表、诚实、透明和训练。他认为,关于这些争论(比如开放还是盲审)还不能解决,但新技术为解决老问题提供了前景,即使他们也会出现新的挑战。

Borgman Christine L等[17]提到了数据的重要性,认为数据正在成为学术的重要产品,成为期刊论文和书的重要补充。研究数据可用来解答新问题、重复工作及核实研究成果。数据的类型和应用在各学科领域间有很大的不同,这跟出版物的在线获得能力和激励机制有关。作者指出,技术、政策和机构组建都已成熟,下一步是如何整合他们。在公共存储中创建一个与出版商数据集进行互链的大数据集,以数字形式保持和维护学术记录是最有前途的解决方案。

2.4 科技期刊自引与质量控制

国内期刊的自引问题一直是个较为敏感的话题,前些年有个别国内期刊恶意提升自引率,从而提升期刊的影响因子,受到了国内外同行的一致反对,部分期刊受到了惩罚。但这些问题是否还存在,目前自引的情况如何?国内有二项研究可以参考,其一是Liu Xue-Li和Wang Mei-Ying对于中文生物医学期刊的自引期刊的调查[18]。他们对884种中国生物医学期刊的自引率进行了调查,其中包括185种综合性、96种预防医学类、103种中医类、66种基础医学类、370种临床医学和64种药学类期刊。在调查的2005-2007年间有逐年下降趋势,不同学科间自引率有所差异。2007年52种中文生物医学期刊未出现自引现象,他们的总被引频次和影响因子分别为263和0.206,这比2007年所有统计期刊的平均值要低。自引率超过上限的被称为过度自引期刊,在2005-2007年分别有62(7.01%)、68(7.69%)和66(7.47%)种被定义为过度自引期刊。然而,一定数量的自引是合理而必须的。

此外,Xia Xiao-dong和Wu Ya-wen等[19]对国内某些中文科技期刊的自引情况进行了分析。该研究对7个领域中的222种中文期刊的自引率进行了调研,包括农学、生物学、环境科学与技术、林学、农业大学的学术期刊、水产科学和畜牧兽医学。大部分学科领域间期刊自引率之间有显著差异。文章也讨论了自引率与期刊影响因子之间的关系。

如今学术团体面临的一个重要问题是研究结果出版和传播中的质量控制。关于作者对期刊质量的认知方面,Regazzi John J和Aytac Selenay等[20]调查了作者认知的STM期刊质量的特点。该研究对纽约长岛大学全职教职员自愿者进行了以下3种方式的调研:(1)问卷调查;(2)分组讨论;(3)半开放式的面对面访谈。最终结果显示,对于期刊质量的把握最为重要的3个属性是期刊的声誉、出版时滞和读者对象。

经济衰退是当前学术期刊危机再现的一个原因,而商业出版商的利润兜售再次受到抨击,称其为这场危机的驱动力。但数据分析并未发现最近几年中存在过多的公司贪腐现象,真正的问题来自于学术图书馆的经费预算不足和以简单方式评估教职工能力的出版狂潮。为防止在接下来的几年里,不发生类似的出版海啸,Philippe C Baveye[21]提醒大学和研究所务必要将出版活动的重心从量转到质,必须找到在生产力和影响力评价标准中引入同行评议。为实现这个目的,需要研究者、图书管理员和出版商的齐心协力。

2.5 新阅读模式和新技术

Blanca Rodrfguez Bravo和Ma Luisa Alvite Díez对西班牙的学术电子期刊进行了分析[22],以了解5家西班牙大学学术团体的消费模式,也就是了解5家学术团体对2010年开始订阅的4大主要电子期刊提供商内容的使用情况。同时,作者基于里昂和比戈的西班牙大学的数据创建了一个初步方法来评估这些电子期刊的投资价值。

另一来自西班牙的研究[23]也探讨了西班牙大学图书馆电子期刊的利用模式。该研究对西班牙西北地区6所学术图书馆对订阅的2002-2005年间的电子期刊的应用情况进行了分析,提出了大学使用这些期刊的模式和这些内容分布的特点。

关于学术期刊和书籍阅读新模式的调查,英国的一项传统研究可以给我们些启示[24]。该研究对英国6所大学的学术人员进行了调查,以便于出版商了解学术论文和书籍阅读模式,结果显示图书馆馆藏的电子期刊是学术期刊阅读的重要来源。书的阅读模式不同于论文,大部分为个人的纸质收藏品。学者们每天接触不同来源的信息,因此便利性和方便获取是重要的因素。

在论文阅读的新技术方面,Bennett Claire Ponsford等[25]研发的Ex Libris' SFX?的“参考文献链接器”可能为学者的引文查询和链接带来便利。许多OpenURL链接解析器提供了参考文献寻找服务,让终端用户在论文层面检索特殊的已知字段。该文作者研究了Ex Libris' SFX?的“参考文献链接器”的检索功能,并邀请21位志愿者来比较标准的A-to-Z表与SFX参考文献链接器搜索在检索期刊论文的功能。

3 讨论

文献是科学研究的记录,文献计量学方法一直是分析学科专业研究结构和趋势的重要手段。如果一篇论文被某学科专业的其他论文引用频次越多,说明该论文是研究活动中不可或缺的工具和基础;两篇论文如果频繁地被其他论文同时引用,则说明它们之间存在着内容的关联。根据“物以类聚,人以群分”的思想,聚类分析算法是通过两篇高被引论文被同时引用的多寡来表现其相关性,由此把这些论文加以分类,形成各专业发展的知识基础。以此为基础,我们从2008-2011年发表论文中找到与之关系最为密切的论文,如同从树根寻找到新芽,展现出研究的最新进展,这就是我们要寻找和表现的研究前沿。

我们从中发现了5大研究前沿,分别为科技写作实践与修辞学、机构存储与出版、开放获取与同行评议、科技期刊自引与质量控制和新阅读模式和新技术。从笔者的经验来判断,此5项研究确实在目前的科技出版界比较热,讨论的也比较多。说明该方法有一定的科学性,取得的研究进展值得关注。我们也选择最具代表性的文献进行展开叙述以期了解研究者的发现和观点,以飨读者。

但囿于目前数据处理技术的限制,本研究选取了5年中发表的文献记录,仅仅显示了一个时间横断面上的静态的状况,如果想要了解这些学科的动态变化及趋势,应当在今后定期跟踪这些热点和前沿。

标签:;  ;  ;  ;  

用文献计量学方法分析近五年来国外学术出版领域的研究进展_高被引论文
下载Doc文档

猜你喜欢