基于OA的开放仓储库,本文主要内容关键词为:OA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 OA的兴起与发展
OA是Open Access的缩写,也就是开放存取,是网络环境下新型的学术交流理念和交流机制,从某种意义上说,也是一种新的学术交流运动。二战后,由于商业进入了学术出版领域,其盈利性的根本特质决定了学术期刊的走向越来越商业化,作者、读者和相关科研机构都不得不面对日益高涨的各种费用;同时,出版时滞也为学术信息的交流带来了又一重的障碍,人们迫切呼唤一种全新的、无障碍的学术交流体制。这种情况下,OA运动应运而生。
OA是国际学术界、出版界、图书情报界为打破商业出版者对科学研究信息的垄断和暴利经营,而采取的推动科研成果通过Intemet免费、自由地利用的运动。对于促进科学信息的广泛交流,促进利用互联网进行科学交流与出版,提高科学研究的劳动生产率都将产生深远的影响,对世界各国平等、有效地利用人类的科技文化和科技成果具有重要的意义。其中主要资源便是开放文献(期刊),根据BOAI(Budapest Open Access Initiative)的定义,认为开放文献(期刊)是指那些可以在公共网络上免费获取的,并且允许用户进行阅读、下载、复制、分发、打印、检索、链接到全文、用于编制索引、作为软件数据使用或者其它合法目的,用户在使用该文献时,除需要上网之外,没有其它的经济、法律以及技术障碍。进行分发和复制时的唯一限制和规定是存取时保证文章作者对其作品的完整性、署名权和正确引用权进行控制。
自2002年2月14日布达佩斯开放使用创始行动上的首次提出,到随后不久被经济合作和发展组织以及国际图联等机构采纳,OA的发展正呈现出良好的趋势,不仅这种理念正在得到越来越多的认可,相关的实践活动也迅速地发展起来。最早是各种OA期刊的建立与运作,如2003年10月创刊的《大众科学图书馆(生物卷)》(PLoS,Biology),在一家非赢利组织——Gordonand Betty Moore基金会资助下,以美国国家医学图书馆负责的Pub Central为基础运行,任何人都可以将符合标准格式的生物医学方面的论文上传、发表,同时还提供不受限的免费访问和检索服务。已经在生物领域取得了相当的影响力和认可度。除此之外,OA的另一实践方式——开放仓储库,也开始在世界各地、各个学科领域、各种研究机构内纷纷上马,逐渐成为学术领域内的新的关注热点。
2 开放仓储库
2.1 开放仓储库的定义
开放仓储库,即Open Access Archives(或Open Access Repositories),是OA——开放存取的新兴实践方式,也就是一个为科学研究者提供电子版科技文献存储和检索的数据库。通过开放仓储库,科学家们可以利用自我归档技术提交、存放自己的论文,甚至是发表的文章,从而使其文献可以迅速、便捷地在其学科领域内被传播、检索和谈论,从而实现推动无障碍学术交流的目的。
开放仓储库中的文献可以是预印本(Preprint),也可以是后印本(或勘误本,Postprint)。预印本指的是未公开发表、出于进行同行交流而在互联网上发布的学术文献,包括未投稿的文献、未采用的文献和已经被采用但尚未发表的学术文献。后印本则是相对预印本的另一种电子文献形式,指已经在期刊或其它公开出版物上发表的文献。同样,这些文献既可以是期刊文献,也可以是会议论文、专著篇章或其它研究成果。其共同之处在于,开放仓储库中的任何一篇文献都具有可获取的高度便捷性。
需要特别指出的是,在线论文的提交、访问无论是对于作者,还是读者都是完全免费的,充分体现了OA——开放存取的基本理念,也是推动其发展的根本动力所在。
2.2 开放仓储库的类型
根据内部资源的收录范围和对外开放程度,开放仓储库大致可以分为两类:学科范围的开放仓储库和机构专属的开放仓储库。
2.2.1 学科范围的开放仓储库
由于学术出版的时滞问题,20世纪90年代,最早在物理、计算机、天文学等自然科学领域内的学者开始在网上采取预印本的形式进行专题领域内的学术交流,于是一些学术组织自发地开始收集这些共享的学术信息,将其整理后存放于服务器中供用户免费访问和使用,从而在网上建立起一个公开交流自我最新研究成果的文档库,这就是开放仓储库的诞生。早期的开放仓储库大多采用这种形式。时至今日,依然由很多开放仓储库沿袭了这种传统方式,即服务范围并不针对特定范围内的用户,而是对某一学科领域或多个学科领域的所有研究者开放,提供免费的文献存取和检索服务,以供交流、学习。
2.2.2 机构专属的开放仓储库
机构专属的开放仓储库,即机构库(Institutional Repository),是近两年来发展相当迅速的开放仓储库新形式,区别于早期的开放仓储库。它主要为某一特定机构范围开放,保存自我机构内的所有学术产出成果,为专属机构提供文献存取和检索服务,一般由大学、大学图书馆、研究机构、政府部门等创建和维护,并为其提供专门服务,一般不对外界用户开放,根本目标是实现机构范围内的开放存取。毫无疑问,这种方式保证了机构自身所有产出成果的完整性和连贯性,对于促进机构的发展有着显而易见的推动作用,因而也就得到了越来越多的机构支持,各项建设工程纷纷热火朝天地启动上马,成为开放仓储库的主流发展趋势。
2.3 开放仓储库的发展现状
2.3.1 学科范围开放仓储库的建设
arXiv预印本文档库,由美国国家实验室的Paul Ginsparg于1991年8月建立,得到美国国家科学基金会和美国能源部资助。覆盖物理学、数学、非线形科学、计算机科学和量化生物等5个学科。目前已有28万篇的预印本文献库。研究者按照一定的格式将论文进行排版后,通过网络、E-mail、FTP等方式,按学科类别上传至相应的库中。这其中不需任何审核程序,也没有任何先决通过条件,实际上实行文责自负的原则。同行可以对库中的论文随时评论,论文作者也可以对这种评论进行反驳,进行双向交流。论文作者在将论文提交e-print arXiv的同时,也可以将论文提交学术期刊正式发表,论文一旦在某种期刊上发表,在e-print arXiv相应论文记录中将会加入文献正式发表期刊的卷期信息。同时,该库还可以提供免费的检索服务。
E-LIS——图书情报领域的开放仓储库。E-LIS是世界上图书情报领域的首个开放仓储库,2003年由RCLIS(计算机、图书情报学研究)工程——存储有关计算机、图书馆学、情报学的技术和应用的所有文献的数据库工程和DoIS(信息科学文库)发起,旨在促进图书情报领域的学术交流,不以任何盈利性为目标。其运行遵照OAI(Open Archive Initiative)协议和标准,为世界范围内的任何研究用户提供长期保存和开放检索服务,但是要求提交文献的作者必须遵照其“服从政策”进行相关程序的操作,并遵守一定规则。迄今为止,库中已经有2350篇文献。
中国预印本服务系统,由中国科学技术信息研究所与国家科技图书文献中心联合建设,是一个以提供预印本文献资源服务为主要目的的实时学术交流系统。由国内预印本服务子系统和国外预印本门户(SINDAP)子系统构成。系统的收录范围按学科分为五大类:自然科学,农业科学,医药科学,工程与技术科学,图书馆、情报、文献学。中国预印本服务系统完全按照文责自负的原则进行管理。系统不拥有文章的任何版权或承担任何责任,在系统中存储的文章,作者可以自行以任何方式在其他载体上发表,并且鼓励作者将预印本文章投递至传统期刊发表,一旦文章在传统期刊上发表,作者可以在预印本系统中修改该文章的发表状态,标明发表期刊的刊名和期号,以方便读者查找。在该系统发表的文章版权归作者本人所有。中国预印本服务系统的服务是免费的,用户无需支付费用。
除此之外,国内外相关的实践还有很多。比如美国国家医学图书馆下的PubMed Central(http://pubmedcentral.nih.gov/),主要提供免费使用之生物医学相关期刊索引,收录89种免费全文期刊;中国的奇迹文库——预印本(http://www.qiji.cn/eprint/)、中国科技论文在线(http://www.paper.edu.cn/home.jsp)等。
2.3.2 机构专属开放仓储库的建设
DSpace系统,由美国麻省理工学院(MIT)和惠普公司共同开发,用以处理该校教师和研究人员每年完成的总计达1万多份的电子版学术研究成果,其中包括期刊论文、技术报告、会议论文等,类型涵盖文本、音频、视频、图片等多种类型。并且该系统可以对其中资源进行统一的搜集、保存和编目,其软件是目前为止开放仓储库中应用范围最广其中之一种。并且DSpace还和OCLC的OAICAT结合,完全支持OAIV2协议,同时采用CNRI的Handle建立唯一标识框架,为实现不同数据库中元数据交换,进而实现不同开放仓储库资源的完整意义上的互通存取提供了可能性。
dLIST,为图书情报学和信息技术领域提供全文电子文献存取的开放机构库(或数字图书馆),由Arizona大学提供支持,以其信息科学和技术中心(Arizona Center for Information Science and Technology)为依托,采用EPrints2 archive-creating软件,同样遵循OAI协议进行运作,下设信息资源和图书馆学、技术学习中心、Arizona大学三个部分,登录可设置用户代码或直接匿名登录。需要指出,其中文献格式不仅仅局限于*.pdf和*.doc,还包括*.htm,*.html和*.ppt文件。
香港科技大学机构仓储库,是香港科技大学专属的开放仓储库,以数字化形式存取香港科大的学术产出成果,其接口提供便捷的自我存档,并以逻辑形式组织这些文献,使其便于检索利用。内部资源按照香港科大的院系和研究机构(社团)进行组织,同时当新的研究机构(社团)出现时,系统可以及时添加。通过图书馆提供服务。依照OAI协议,采用DSpace软件进行系统的运行,目前已经有超过180个研究机构的140万篇文章可以通过其链接的OAIster检索到。
除此之外,相关项目还有佛罗里达州立大学图书馆的D-Scholarship仓储库、美国能源部的“Information Bridge”以及国内的浙江大学数学科学研究中心、南开大学数学研究所都在其网站上开设了预印本文库等。
3 开放仓储库发展中的一些问题
3.1 资金来源
开放仓储库声明为其内部信息资源提供长期保存服务,那么这必然要求稳定、可靠的资金支持保证。就目前发展的情况来看,开放仓储库大都是由专门的学术组织、研究机构、大学图书馆以及政府机构建设的,都是根据其研究需要和保存需要而由其母机构指导建设的。因此,来自母机构的强而有力的支持成为开放仓储库的可靠资金支柱,同时加上一些基金资助和部分广告收入,也就较好地解决了开放仓储库的资金来源问题。
3.2 版权问题
首先是针对预印本,开放仓储库保留作者对其作品的版权,包括对其作品的完整性、署名权和正确引用权等,他人引用必须表明出处;同时还可以为作者提供对其作品的访问限制权,即只允许选定范围内的读者进行访问。基本实行作者自负、自我管理的原则,并不与现行版权法相违背,一般较少产生纠纷的可能性。但是后印本(勘误本)则又是另一种情况,由于出版商的商业性运作,往往要求论文作者在同意其作品发表的同时,将相关版权移交至出版社,因而就与开放仓储库作者文责自负的原则产生了矛盾。目前,已有部分出版商允许作者把后印本存放于开放存储库中,但是还有许多出版商并不允许类似行为。这种情况下,开放仓储库大多采用避免冲突的勘误本(Corrigenda)的方式,即不直接提供发表文章的原文,而是给出一份与预印本内容不同之处的说明版本,从而也就为研究人员间接提供了希望获取的全文文献,较好地解决了版权问题。
3.3 跨库检索和互操作
出于尽量减少管理和运作成本的考虑,多数开放仓储库并没有对提交文章的格式进行标准的规范化统一,往往只是简单地要求PDF或HTML等格式,同时也没有对其进行更深入的组织、归档。因而如何实现异构数据库间的跨库检索和互操作,也就成为开放仓储库发展过程中的一大难题。这种情况下,OAI的出现带来了曙光。OAI(Open Archive Initiative),即开放文档库先导,是一个旨在促进网络信息资源开发、发布与共享的合作组织,最早提出了针对预印本的互操作计划——OAI协议(OAI-PMH)。OAI协议主要通过元数据收割(metadata harvest)的模式实现不同数据库之间的互操作,形成一个与应用无关的互操作框架,从而为跨库检索和异构数据库的互操作提供有效工具。目前,很多开放仓储库都采用了OAI协议,一定程度上较好地解决了跨库检索和互操作的难题。
4 开放仓储库对图书馆的启示
4.1 抵制发行商,减轻经费压力
由于学术出版领域的商业化运作份额的不断扩大,学术期刊的出版价格及其数据库的价格节节攀升,根据美国研究图书馆协会的统计结果,从1986年到2000年的14年间,图书馆用在期刊等连续出版物上的花费增长了226%,成为经费紧张的图书馆难以承受之重。图书馆界曾经尝试馆际互借、合作购买等方式来减少涨价带来的压力,但是结果都不甚理想,向数据库发行商的抗议也如泥牛入海。而开放仓储库的发展可以使图书馆尝试减少学术期刊和数据库的购买量,向发行者施加压力,迫使其降低价格上涨幅度,为图书馆经费问题的解决提供了新的出路。
4.2 拓宽信息资源,促进学术交流利用
开放仓储库的根本宗旨就在于开放存取,实现免费、自由的学术成果交流,其运作方式跨越了传统期刊的出版时滞,大大节约了出版浪费的时间,实现了为学术领域及时提供最新的科技信息和研究成果;并且还提供了同行间快速的交流修正机会极大地促进了学术信息的交流和共享。同时还由于网络传递方式的多样性、便捷性和其包容的交流反馈机制,对于图书馆而言,这无疑是一种更好的服务研究性用户,促进学术自由交流的宝贵信息资源。
4.3 成为开放仓储库提供者
图书馆应尝试为机构提供数字存档库,由于开放仓储库的运行必须以长期稳定的服务器为根本依托,同时还需要花费相当的财力、物力和人力进行数字资源的维护和组织,因此,这将是一笔不菲的费用支出,成为有需求的机构上马存储库建设的一大障碍。在这种情况下,图书馆可以利用自身的设备、信息资源和人员优势,为申请机构提供数字存档库,提供相应的维护、管理以及与其它仓储库的互操作,并向机构收取相应的服务费用。同时,还应鼓励馆员自我创作,加入相关项目,充分利用这一开放、免费的交流体制,以促进图情事业的发展。