2001~2009年国外开放存取研究内容分析_图书馆论文

2001-2009年国外开放存取研究内容分析,本文主要内容关键词为:国外论文,内容论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

我国对OA的大规模研究始于2006年左右,内容主要涉及OA与图书馆、OA期刊、OA与出版、OA与学术交流等方面,对国外OA发展的研究则主要集中于项目分析、相关策略和政策的研究,系统梳理国外OA研究和发展状况的成果尚不多见。笔者选取国际知名的ISI三大引文数据库,以open access为检索词,利用题名检索功能和检索优化功能查找到相关文献527篇,抽取命中文献的关键词字段,通过Bibexcel工具统计关键词词频和共词频次,生成共词矩阵,分析国外OA研究的热点问题。并利用SPSS13统计软件的多元统计功能,将词频大于一定阈值的关键词进行聚类分析,以期洞察国外OA研究的微观结构。在此基础上,结合对相关文献的阅读和国际上有关组织、会议及政策的最新动态的跟踪,从OA期刊的商业模式研究、不同领域OA资源的计量研究、OA对出版和图书馆的影响研究、OA资源的组织利用研究等方面,分析解读近十年来国外OA的研究和发展状况。

1 数据的采集与分析

SCI、SSCI和A&HCI是国际知名的三大引文数据库,因其有严格的期刊选择标准而成为评价科研人员和论文水准的重要指标。笔者利用WOK的标题检索功能,共检索到国外2001-2009年间发表的与OA相关的文献记录960条,对检索结果进行学科类别、文献类型和国别精简后最终得到相关文献记录527篇,其年度分布结果显示,国外的OA研究从2001年开始逐步升温,相关文献数量增长较快,2004年后开始趋于稳定,2007年的文献总量达到顶峰,但2004年至2009年间的论文数量总体平稳,波动幅度不大。

1.1 关键词词频统计和共词分析

关键词是文献主题、观点和研究方法的重要表征。词频统计和共词分析则是描述某领域研究热点和发展动向,揭示该领域学术研究微观结构的文献计量方法[1]。利用关键词进行词频统计和共词分析,可以避免利用题名和摘要进行抽词分析时因分词词典词汇量有限或分词算法精确度不足所带来的局限。笔者以上述527篇文献为样本,抽取其中的关键词,在进行同义词统一、大小写一致和单词时态统一等处理后,共得到有效关键词512个,借助于Bibexcel软件统计关键词词频,选择词频大于4的前21个关键词(约占总词频的34.77%,满足普遍意义上的二八定律),统计其共词关系,结果如下。

如表1和表2所示,国外OA研究的关键词及共词关系呈现出高度集中的状态。从词频列表和共词列表可以看出,国外OA研究的热点主要集中于OA与出版、OA期刊、不同领域的OA、OA与发展中国家、OA的计量研究和资源利用等方面。但仅凭关键词词频分析和共词分析反映出的研究热点过于庞杂和分散,还无法全面反映国外近十年来OA研究的微观结构和各研究子领域之间的关系,因此,还需要将这21个关键词生成共词矩阵,并利用多元统计方法对该关系矩阵进行变量结构分析。

1.2 多元统计分析

多元统计分析是共词分析的重要内容,通过多元统计中的因子分析和聚类分析方法可以揭示某一领域主题词或关键词间的关联与区分,反映某一领域的研究热点和研究结构。本文多元分析所用的关键词共词矩阵如表3。

1.2.1 因子分析

因子分析是一种数据精简或数据压缩的方法,其目的在于以最少的因子数量最大限度地反映原有数据中的信息。在本文所选用的主成分分析法中,数据的信息总量通过数据的方差值来表征,以因子的方差值与总方差的比率来反映因子解释原有信息的能力。本文采用因子分析的主要目的在于为后续的聚类分析提供类目数量参考。鉴于因子的选择目前还没有较权威的定量评估方法,笔者借鉴常用的特征根阈值法,选择特征值(或方差)大于1的因子为有效因子[2],同时综合碎石图法的辅助做出判断,认为从关键词矩阵中可以提取出8个左右的因子。

1.2.2 聚类分析

聚类分析是一种根据数据特征,利用特定的相似度算法将没有分类信息的数据进行归类的方法,常用的类目相似度衡量指标主要包括距离指标和相似度指标。本文选用R型分层聚类方法,其原理是将所有待分类的高频关键词都看成单独的一类,然后依照相似度算法合并最相似的两类,将此过程迭代进行,直至将所有的类别归为一个大类。最后再把整个分类系统绘成一张谱系图,将所有关键词的亲疏关系表示出来。

由于关键词共现矩阵是计数变量矩阵,变量之间是一种相关关系,而非距离关系,两个关键词之间的共现频次越大,就代表它们之间的关系越密切。所以在聚类过程中,笔者选择了计数变量中的卡方值测度不相似性方法,类间的相似度计算采用组间平均连接,为了避免绝对词频对共词频率的影响,选择Z分数数据标准化方法,对角线的数据处理则采用某关键词的总共现次数加1填补。参照因子分析的判断,将聚类结果设定为8-12类,聚类结果如下:

图1 聚类分析结果树状图

通过对聚类结果的分析,结合对相关文献的阅读,最终选择将关键词集合聚为7类,各类目的关键词及内涵如下:

第一类:open access、publishing、internet,研究OA与网络和出版业之间的关系;第二类:businessmodels、open access journal,研究OA期刊的商业模式;第三类:field、informetrics、impact,用计量方法研究不同领域OA资源的影响;第四类:developing countries、developed countries、open source、open resource,研究发展中国家和发达国家的OA发展;第五类:libraries、scholarly communication,探讨OA、图书馆和学术交流之间的联系;第六类:service、usage,研究与OA相关的服务和资源利用;第七类:research resource、repository,探讨研究性资源与存储库之间的关系。

2 聚类结果的内容分析

上述聚类结果表征了近十年来国外OA研究的整体结构,但聚类结果仍只是一种宏观表述,无法获知各研究分支内具体内容和主流观点,所以笔者又分别将上述聚类结果各分组中的关键词定位到具体文献,在查阅全文文献的基础上,结合对国际上相关组织、会议及政策最新进展的跟踪,对上述聚类结果中的各分组进行内容解读。限于篇幅,笔者只选取其中的主要研究分支予以阐述。

2.1 OA与出版业之间关系的研究

OA活跃了学术出版市场,为其带来新的竞争,对传统出版商的垄断地位造成挑战,影响到其既得利益,所以OA与传统出版业之间注定矛盾重重。学者们也一直密切关注和分析出版商为应对OA挑战所采取的最新举措。结果表明,一开始许多出版商视OA为自身利益的侵犯者,企图颠覆OA出版。2007年美国出版商协会(The Association of American Publishers,AAP)建立了“科学和医学研究的伙伴”(Partnership for Research Integrity in Science & Medicine,PRISM)倡议组,反对政府强制实行OA政策[3]。

但随着OA理念的传播和影响力不断扩大,逐渐获得了政府、科研机构和高校的广泛支持,出版商也表现出更加务实的态度,开始尝试支持OA。以Hindawi为代表的一些出版商积极采用OA模式,而Springer、牛津大学出版社等大型出版商则采取了相对谨慎的态度,通过为作者提供期刊论文的OA选择等方式,开展自己的OA试验。其中,Springer的措施最为丰富和全面,不仅为期刊论文的作者提供了OA选择,还合并了全商业化的OA出版商BioMed Central,并且与加利福尼亚大学签订了具有转折意义的OA协议,将其下属机构的科研人员的OA选择费用纳入期刊的订阅费用[4]。

2.2 OA期刊的商业模式研究

OA期刊的收入主要来自作者和机构所支付的出版费用及科研资助机构的支持,受上述主体是否愿意支付OA出版等多种因素的影响,这种收入来源的稳定性不强。OA的可持续发展存在隐患,因此有关支持OA持续发展的可行商业模式的研究引起国外学者的关注。

现有研究认为OA期刊的商业模式要素主要包括期刊的用户、期刊传递给每个用户的独特价值、创建和传播这些价值所需的资源、期刊将其特有价值转换为收入的市场机制、期刊的收入流等要素。根据收入来源的不同,OA期刊的商业模式被分为由内容生产者或相关机构资助的提供方模式和由内容消费者或其代理机构资助的需求方模式两类[5]。其中提供方模式主要包括作者付费、广告收入和各种形式的赞助和补贴等方式,而需求方模式则包括提供不同版本的服务、出售内容聚合许可和通过提供增值服务收费等方式。这一分类框架基本覆盖了现有OA期刊的商业实践,其中研究资助机构的支持和作者及其所属机构支付的出版费用是OA期刊的主要收入来源。Kaufman-Wills小组的调查发现,OA期刊出版费用中的34%来源于研究资助、27%来源于机构图书馆、13%来源于作者及其所属机构、5%来源于基金会[6]。为了顺利地获取出版资助,保障OA的可持续发展,Arne K Richter建议必须充分利用网络、Web2.0工具、免费软件和志愿者服务,将OA出版商在论文提交、同行评议、出版和传播OA资源过程中的责任和工作量减至最低点。惟其如此,才能将期刊费用减少到可承受的、资助人感兴趣的范围[7]。

2.3 不同领域OA资源影响的计量研究

OA资源的权威性和引用优势多年来一直是学术界和出版商争论的热点话题。鉴于OA资源的网络依附性,学者们热衷于利用网络计量学来证实这一疑惑,通过Web of Science等权威数据库及Alta Vista和Google等大型商用搜索引擎来搜集不同模式的引用数据,证实不同学科中OA资源的引用优势。研究结果可谓喜忧参半,由于受学科出版传统和研究人员对OA资源质量主观认知的影响,不同学科表现出的引用优势差别较大,硬科学比软科学对OA资源的引用更多。

Devon等通过对比医学领域来自同一期刊上的OA文章和非OA文章的引用率,发现OA文章比非OA文章的被引率高29%[8]。Steve分析了计算机科学和相关学科领域的119,924篇会议论文的被引情况,结果显示可在线获取文章的平均引用次数比离线获取文章高157%[8]。但更多的调查显示学科间的OA引用优势差异明显。Frandsen等调查了生物学、数学和药理学这3门学科中的OA期刊和非OA期刊引文对OA资源的认可程度,结果显示生物学的OA期刊显示出OA包含,而非OA期刊显示出OA中立,药学领域OA期刊和非OA期刊都显示出OA排斥,在数学领域,非OA期刊显示出OA包含,而OA期刊则显示出OA中立,即使在OA期刊的作者群中,人们对OA期刊的认可和期望也不一致[9]。Norris等选择生物、应用数学、社会学和经济学四个学科,评估同传统收费期刊论文(Traditional Access,TA)相比,OA期刊论文是否有引用优势,结果发现在样本文章中,49%的引文源是OA资源,OA文章比TA文章具有明显的引用优势。然而这一优势因学科而异,社会学的OA论文引用优势最强,作者还发现影响因子和期刊是否可开放获取之间的相关性很弱,不同学科内有不同的作者关系和引用实践,所以很难解释任何OA引用优势[10]。

2.4 OA与发展中国家之间关系的研究

由于科研资金相对匮乏,传统学术期刊高额的订阅费用阻碍了发展中国家的科研人员接近国际学术前沿和展示自己研究成果的机会,OA运动有助于缓解这一矛盾,所以发展中国家理所当然地被当作OA运动的天然获益者,学者们也一直热衷于证实和评价OA运动的这一积极效应。结果表明虽然OA运动有助于提升发展中国家的学术可见度,为其提供丰富的学术资源,但由于受软硬件设施条件的限制和观念偏差等因素的影响,这种积极效应并不明显。许多发展中国家的学者在利用OA资源、参与OA出版的过程中面临着语言障碍和数字鸿沟障碍等诸多困难,并且研究人员对OA资源也存有认知偏见:

Assimina Vlachaki等调查发现OA仅是英语国家研究者的特权,其他国家的研究者在利用OA途径发表研究成果方面有着莫可名状的劣势[11]。Adomi等2003年对发展中国家的调查,归咎于高昂的接入费用和较差的通信基础设施,网络接入问题在发展中国家当中普遍存在,限制了这些国家对OA资源的获取利用和OA计划的开展[12]。

发展中国家OA发展面临的另一关键障碍就是科研人员对OA的误解和忽视。Papin Ramcharan等于2006年对拉丁美洲特立尼达岛West Indies大学工程教员的调查发现,在参与调查的79名教员中,有18人关注OA期刊,有6人知道数字存档或仓储,仅有两人曾在OA期刊上发表文章,没有人自存档自己的文章[13]。

所以,从理论上讲发展中国家的科研人员是OA运动的主要受益者,理应比发达国家的科研人员有更积极的感知。但由于受软硬件设施欠完善和观念偏差的制约,这种积极效应并未广泛显露。Frandsen等对发展中国家研究人员利用OA资源的计量研究显示,OA期刊的作者组成与传统的订阅获取期刊相比,并没有显著差别,发展中国家的作者引用OA期刊的频次并不比发达国家高[14]。Norris Michael等通过对生物、应用数学、社会学和经济学等学科中OA文章第一作者所属机构的分析也发现,北美是最大的OA资源来源地,北美学者提供的OA文章在所有被调查学科中占54.19%,欧洲占23.68%[15]。

2.5 OA与图书馆之间关系的研究

作为学术交流和传播的重要机构,陷入期刊危机中的图书馆一直是OA运动的倡导者和支持者,OA对图书馆的资源建设和图书馆员的能力要求都产生了较大影响,学者们也纷纷撰文介绍各类型图书馆开展的OA实践,探讨OA对图书馆的影响。作为一种新的学术出版和学术交流方式,国外学者探讨OA对图书馆的影响主要集中于图书馆员、图书馆的信息资源建设和图书馆的信息服务等方面。

2.5.1 OA对图书馆员的影响

Ghosh Maitrayee认为OA运动扩展了图书馆传统的维护和保存人类记忆的职责,今天的图书馆正被塑造为知识生产和交流过程中的主动合作者与参与者。OA环境中图书馆职能的变化赋予了图书馆员新的使命,对其专业技能和理念提出了更高的要求,现今的图书馆员被期待为研究者、规划者、管理者、评估员、团队成员、解决问题的人和电子资源专家,整体上是一个多才多艺的领导者[16]。图书馆员应承担起:(1)通过多种途径积极向所在机构的科研人员宣传OA;(2)证实OA的引用优势,充当科研人员OA出版的版权顾问;(3)参与OA资源的组织管理等职责。

2.5.2 OA对图书馆信息资源建设的影响

OA运动拓宽了网络学术资源的范围,图书馆有必要调整自身的资源建设政策,将OA的收集和整理作为馆藏资源建设的有机组成部分,并积极开展相关实践。日本实践女子大学选择OPAC作为一个有效获取数字资源的途径,该校OPAC能搜索的数字信息范围不仅包括付费期刊和电子书,还包括OA图书和期刊等免费内容[17]。Anna K Hood于2007年3月对123个ARL成员馆进行的OA资源利用调查表明,大部分成员馆已开始关注OA资源的组织和建设,86%的成员馆从OCLC下载OA资源的编目记录、69%的成员馆开展原始编目工作、56%的成员馆从其他第三方机构获得OA资源的编目数据,部分成员馆整合了DOAJ的所有期刊[18]。

2.5.3 OA对图书馆信息服务的影响

OA运动拓展了图书馆的服务范围,在传统的信息环境中,图书馆的职能以信息搜集和提供利用为主,但在OA环境中图书馆的角色发生了改变,由知识的整理传播机构演变为知识的创造和传播机构。图书馆不仅应积极搜集利用OA资源,更应开展OA资源的建设实践,促进本机构科研成果的传播和共享,提高本机构的科研声誉。

加拿大西蒙弗雷泽大学(Simon Fraser University,SFU)大学图书馆于2005年建立了机构仓储,以标准的文件格式和资源共享协议加工整理资源,促进资源的网络利用,增加本校科研成果的可视度和影响力[19]。伊利诺伊大学图书馆将在学术出版中积极发挥作用作为自己的战略重点,在芝加哥利用开放期刊系统(Open Journal System,OJS)软件建立了期刊出版基础设施,开展Journals@UIC服务,帮助OA期刊的在线出版[20]。

2.6 OA资源的组织利用研究

信息组织是资源发现和利用的基础,OA运动蓬勃发展,高质量的OA资源不断涌现,但分布式的存在状态难以显现OA资源的规模效应,给用户的使用带来不便。在这种情势下,对OA资源的组织和获取利用研究开始进入人们的视野。

2.6.1 OA资源获取方式的研究

网络上大量的OA资源以“信息碎片”的方式分散存在,给用户的使用造成负担,对OA资源综合获取方式的研究逐渐引起人们的重视。学者们通过对比不同OA资源获取方式的效率、调查主流商业数据库的OA资源收录情况等方式,总结不同学科OA资源的最佳获取途径,为用户提供查寻指导。

Taler Izabella调查了图书情报领域(Library and Information Science,LIS)开放存取期刊被文摘和索引工具收录的情况,发现WorldCat覆盖了100%(31种)的期刊,乌利希期刊指南和DOAJ大约收录了87%的期刊,EBSCO的LISTA数据库包含了23%的期刊,两大商业数据库LISA和Lib.Lit仅分别覆盖了6%和10%的电子期刊。Google Scholar对OA资源的检索能力优于DOAJ和其他商业性数据库,能搜索到84%的LIS开放存取期刊[21]。Norris Michael等以生物学、经济学和社会学的同行评议期刊论文为搜索对象,对比分析了Google、OAIster和OpenDOAR等信息获取工具发现网络OA期刊的效率,结果发现Google搜索这些学科OA资源的效率最高[22]。Matsubayashi Mamiko利用PubMed搜集生物医学2005年的文章数据,然后用PubMed、Google、OAIster查证这些文章的可获取途径,发现大约只有27%的文章可以在线获取。其中,期刊网站是最主要的信息来源,其次是生物医学中心(PubMed Central,PMC)和期刊门户网站,通过自存档获取的比率很小[23]。

2.6.2 OA资源的组织研究

信息组织是网络资源检索和利用的前提,目前对OA信息组织的研究还比较零散,侧重于应用层面的探讨,在理论和实践上并未突破已有的信息组织研究水准,主要集中在资源元数据领域,涉及机构库元数据质量、元数据分析工具的对比研究、元数据方案和政策的制定及元数据的映射和整合等问题。

Jung ran Park通过对艺术数字仓储元数据质量的调研,探索应如何测量和评估仓储元数据质量,并反映在学术出版流程中,建议采用通用元数据框架来提高仓储的元数据质量[24]。

Jane Greenberg以生物进化研究数据仓储(Dryad)为例,探讨了将生命周期理论用于元数据分析可行性,认为有必要通过对研究数据产生、存储和利用过程的分析,借助于生命周期模型引导仓储元数据框架的制定,以支持数据的共享和重用[25]。

John W.Chapman等比较了明尼苏达州大学、约翰霍普金斯大学和伊利诺伊大学香槟分校三所大学机构仓储中元数据的创建和管理方法,建议这些机构仓储开发者应该支持扩展的元数据方案和权威控制,以更好地解决元数据的描述能力和标准问题[26]。Rowan Brownlee针对悉尼大学图书馆仓储中含有许多传统出版类型的资源,仓储的都柏林核心元数据方案与其他数据库不一致的问题,分析了本地元数据结构,设想了其与DC之间的转换,认为应该与研究人员一起合作管理数据[27]。

3 结语

开放存取作为一种新的学术交流理念,对科学信息交流和利用产生了重大影响,促使学术交流系统朝着以学术为主导的方向发展。已有研究在OA商业模式、不同领域OA引用优势的证实、OA与发展中国家和图书馆的影响和OA资源的组织利用等方面取得了丰硕的成果,但也还存在诸多问题需要进一步证实或解决,突出表现在:(1)需要为OA期刊寻找通用稳定的商业模式,针对各类型OA期刊分别提供可操作性强的商业指导和实践案例;(2)需要充分证实OA资源的引用优势和质量,澄清人们对OA资源质量的疑惑,以吸引发展中国家和发达国家的科研人员积极参与OA出版;(3)需要强化对OA资源的组织利用研究,重视不同来源和不同类型OA资源的整合,发掘便捷高效的OA资源获取方式,提高OA资源的可用性,等等。上述问题亟须学者们在后续研究中予以证实或解决。

标签:;  ;  ;  ;  

2001~2009年国外开放存取研究内容分析_图书馆论文
下载Doc文档

猜你喜欢