论开放资源建设的发展(2001-2013),本文主要内容关键词为:资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[分类号]G250 修回日期:2013-10-17 DOI:10.7536/j.issn.0252-3116.2013.21.002
1 引言:OA运动中的资源建设
从2001年提出《布达佩斯开放获取计划》开始,开放获取(open access,OA)已到了第12个年头。也是在2001年,P.Suber创建了《联机免费学术动态》[1],主要跟踪和宣传OA,2012年又出版了Open Access一书[2],系统地总结了OA的概念和理论。OA提供了知识的新出版方式、交流方式,改变了传统出版模式、交流模式,形成了以科研人员-出版商-读者为角色的新模型[3],其中涉及的各方,如学协会、资助者、出版商、用户都逐渐认识到OA的价值并努力争取自身的最大利益。同时,开放资源发展到现在,占据了文献资源的相当大的比例[4],并有逐渐成为主体资源的趋势。
本文所论述的开放资源建设是指对开放资源的收集、描述、集成、组织、保存和利用的过程。从开放资源建设的角度看,在OA发展中,包括图书馆在内的组织和机构通过项目启动建设的开放资源服务系统逐渐发展,标志性地出现了:①领域知识库,如:arXiv(1991年)、PubMed Central(PMC,2000年);②机构知识库,如:ePrints(2000年)、DSPACE@MIT(2002年);Open Course Ware项目(2002年)、DOAJ(2003年)、BASE(2004年)、OpenDOAR(2006年)、EThOSnet项目(2007年)、Europe PMC(2007年)、Dryad(2007年)、GitHub(2008年)、OpenAIRE和DataCite(2009年)、SciencePAD(2011年)、DOAB(2012年)开放资源建设系统和服务等。这些开放资源建设活动围绕着开放教育资源、开放科学数据、开放期刊、开放仓储、开放软件、开放图书等各种开放资源的内容、使用、集成、再利用、存储、开放政策、标准规范、技术约束展开,其中,DOAJ已建设10年(2003-2013年),收录的开放获取期刊从最初的300余篇发展到9 000余篇(截至2013年10月),在用户中具有很强的影响力和权威性[5]。
本文从开放资源建设的重大背景、重点事件、重要项目和系统建设来分析开放资源建设的发展历程,其中重点关注并分析了DOAJ的10年建设历程及其发展特点[6],力图通过对这些建设活动的透析来把握开放资源建设的发展脉络、建设内容和影响因素,为图书馆了解并推进开放资源建设工作提供启示。
2 开放资源建设的发展历程分析
2.1 OA期刊创新期(2001-2004年)
在这段时间中,OA概念逐渐被接受并进入实践,开放资源建设项目逐步启动,知识库建设开始兴起,OA期刊建设进入创新期。
在《布达佩斯开放获取计划》发布后,2002年出现了一批OA资源建设项目,包括英国联合信息系统委员会(JISC)启动的SHERPA机构知识库项目,美国麻省理工学院(MIT)启动的开放课程项目,科学公共图书馆(PLoS)开始出版OA期刊,同时出现了一些开源软件以支持开放资源系统的建设,如EPrints、MIT DSpace。到了2003年《毕士大开放获取出版宣言》和《柏林宣言》发布,OA概念开始深入民心。2003-2004年,资助者和科研机构意识到资助研究成果开放的意义,知识仓储(实现OA的一种方式,即绿色OA,包括机构仓储和学科仓储)建设兴起,越来越多的机构推出开放存储。2005年,美国国家健康研究院(NIH)宣布实施开放共享政策,英国惠康基金会发布了关于开放获取的立场声明。而很多出版社却还没有OA政策和仓储政策,无法应对知识仓储建设提出的要求,为此,出版社开始调整出版政策和出版方式(例如把传统订购期刊转变为OA或复合OA期刊、提供绿色OA)。OA期刊在2000-2004年为创新期[7]。作为实现OA的另一种方式(即金色OA),OA期刊具有版权清晰、遵循CC协议、出版后立即在期刊网站上发布,允许作者立即存储论文正式出版版本的特点。2004年,更多OA期刊具有ISI影响因子[8],学术影响力增加。2001年,PLoS也成为非营利性开放出版机构,致力于出版高水平的开放获取期刊,旨在与同领域商业出版商的高质量学术期刊直接竞争。在这种形势下,OA期刊目录资源系统——DOAJ于2003年5月开始建设,一年内收录的OA期刊数量就增加750种,2004年6月基本完成系统建设。P.Suber曾这样评价DOAJ的出现:“是一个随着时间推移会显得越来越重要的事件。”[9]
2.2 OA期刊巩固期(2005-2009年)
OA成为世界性趋势,更多国家级的机构、组织、大学倡议公共获取,开放资源层出不穷。OA期刊的发展进入巩固期[7]。
首先,更多类型的资源被开放获取:2004年开放数据被提出,国际科技数据委员会CODATA在2005年就启动了全球科学信息共享计划[10];2009年,斯科特极地研究所提供了150年的2万多张基地考察照片的在线获取[11],超过9 000份美国国家科学院报告实现了OA[12]。其次,不同资源类型的系统开始出现:2006年1月开放仓储目录OpenDOAR启动,2007年1月欧洲PMC启动,2007年3月英国学位论文OA项目EThOSnet启动[13],2008年NIH创建了全球最大的哮喘病临床和遗传公共获取数据集[14],2009年6月英国高等教育学会(HEA)和JISC启动了开放教育资源项目[13]。第三,开放资源的数量、使用量、影响力也快速增长:2005年至少有10多个订阅期刊转变为OA期刊[15],2007年1月全球联合机构知识库(OAIster)收录的OA论文达到100万篇,2月Hindawi出版社宣布其所有期刊实施OA出版;2007年7月BMC单篇论文的访问量首次超过10万次;在2005年,BMC的5种期刊排名居其各自所在领域的前5名,PLoS Biology在出版后第一年的影响因子就达到13.9[15]。Google Scholar和微软的Live Academic Search分别于2005年11月和2006年4月推出,可实现对开放资源的索引和发现。DOAJ在5年中收录的期刊增加4 000种,并且实行会员制,提供期刊长期保存服务,还与SPARC 一起推出OA期刊的SPARC Europe Seal标准,一方面明示期刊的版权和CC BY协议,以便于重用,另一方面表示期刊允许通过OAI收割论文元数据,这是OA期刊建设中的第一个相关标准,在同期的其他类型开放资源建设中还没有。
2.3 OA期刊持续期(2009-2011年底)
这一时期OA已经燎原,开放资源也形成了各自的影响力。
2009年10月19日-23日,第一个国际开放获取周(OA Week)启动[16],自此,OA运动已经得以持续并保持强劲的发展势头:OA系列会议例如开放获取柏林会议、开放知识会议已具有国际影响力;国家层面的OA活动越来越多,2012年美国民众发起白宫请愿,督促美国白宫实施公共资金资助的研究成果的开放共享;美国先后于2006年、2009年、2012年向国会提交了旨在推进联邦资助研究成果公开获取的FRPAA法案,每次均得到了更多议员的联署。更多的开放获取联盟和门户开始出现,例如开放获取知识库联盟(COAR)、科研资源获取权联盟、开放获取政策机构联盟(COAPI)、欧洲海洋联盟、全球开放获取门户(GOAP);更多的信息资源开始提供开放获取,在2011年10月英国皇家学会将其世界闻名的历史性期刊档案库永久性免费在线开放[17],2011年各大出版社OA计划也遍地开花,如1月美国物理学会(APS)和英国自然出版集团(NPG)发布了新的OA期刊——Physical Review X和Scientific Report,2月Wiley-Blackwell发布了Wiley Open Access平台,以推出一批生命科学和医学领域的OA期刊,6月美国国家科学院出版社提供4 000多本图书PDF的免费下载,9月JSTOR提供200多种期刊、50万篇论文的免费访问。在开放资源建设方面:PMC在2010年7月实现了两个里程碑——收录题录数据达到2000万条、收录全文达到200万条,已是全球重量级的开放学术资源;2010年开发的生物数据共享平台BioTorrents在开放性和容量两方面表现极佳,在大科学时代开创了数据共享的先河[9]。2011年6月,霍华德休斯医学研究所、德国马普学会和英国惠康基金会宣布,将合作创办生物医学和生命科学领域的顶级开放获取期刊eLife,与Science和Nature直接竞争。DOAJ加大了宣传力度,参与OA相关会议并发表文章,并在1年多的时间内推出了5个语种站点(PMC建立欧洲站点用了7年时间,DOAJ建立第一个法语站点用了8年时间,预印本网站/学科仓储ArXiv在2012年6月却改变了在很多国家开通镜像站点的策略,关闭了一些站点,转而主要支持少数使用情况好的站点建设[18]),但DOAJ依然存在问题,例如在2011年DOAJ中81%的期刊没有使用CC协议,这个问题“将可能使DOAJ错过提供自由Libre OA、提升论文学术价值、为科研和科研人员服务的黄金机会”[19]。在2011年发表的《期刊与知识库的作者与使用者的行为研究》一文中,学者提出“学术研究人员对学术交流系统的态度、认知和行为是保守的,不希望当前的传播和出版模式有实质性改变”[20],而对于开放资源建设来说,就是要把OA深入到研究人员的意识和利用中。在完善了检索和浏览功能、建立了期刊标准、提供OAI-PMH接口以供收割后,DOAJ开始考虑与出版者、作者甚至与科研机构、资助者的合作,并推动科研工作对OA资源的使用。
2.4 OA期刊战略期(2012年至今)
OA相关问题已经能放到国家层面上讨论和解决,科研资助者、OA组织转为支持更深层次的OA知识服务、元数据框架和互操作框架、学术影响力分析,促使开放资源建设思考新的转变,以抓住先机。
2012年1月,美国研究图书馆协会提出《针对白宫科技政策办公室的公共获取学术出版物信息征询书的回应》,FRPAA再次提交至美国参议院和众议院,欧盟委员会和欧洲议会在下一个研究框架协议Horizon2020中全面实施受资助项目产生的研究论文的开放获取[21]。经过多年的较量,开放资源的开放程度加大,2012年西班牙和德国国家图书馆、博物馆已使用CCO协议开放数据[22],BMC的部分期刊向作者提供CCO的许可选择。越来越多的出版社在开放获取期刊中开始提供更加宽松的使用许可,允许研究论文的开放复用(如CC-BY许可),例如:SpringerOpen的绝大多数开放出版期刊采用CC-BY使用许可,2012年IOPP将其出版的开放获取期刊的使用许可由CC-BY-SA转为CC-BY;同在2012年,NPG将其旗下40余种开放获取期刊的使用许可在现有的CC-BY-NC-SA或CC-BY-NC-ND的使用许可基础上,新增CC-BY使用许可[23]。在开放资源建设中,2012年11月OpenAIRE发布第二版互操作指南[24]并推出OpenAIRE Plus项目,促使达成机构知识库与知识库服务聚合器的兼容以及更大范围资源的互操作;2013年2月美国国家信息标准组织(NISO)推出制定开放获取元数据和指标标准项目[25],制定标准化的书目元数据和可视化指标,不仅描述了论文的可获得性,而且潜在地描述了期刊论文的开放程度,这与DOAJ印章(DOAJ Seal)似乎殊途同归;2013年3月《开放获取的影响》发表[26],提出OA的学术影响力除了加大科研成果的可见度、使用量、引证影响力之外,还将对机构竞争态势、知识转移转化甚至经济产生影响,美国细胞生物学会在2013年5月发布的《关于科研评价的旧金山宣言》[27]提出,未来研究论文以外的其他产出(例如科学内容、数据集、软件)对于评价科研成效将越来越重要,这些文章将推动科研人员参与生产并使用开放资源。DOAJ收录期刊数量目前已近万种,于2012年12月进入它的第4个发展阶段,采取了转换发布平台、工具,调整工作团队和顾问委员会,推出开放期刊新标准、扩展期刊收录范围、与出版社更紧密合作以改善目录中期刊信息的质量等一系列举措,进入发展战略转变期。
3 当前开放资源建设特点和存在的问题
开放资源经过十几年的发展,资源量具有了一定规模、服务内容日益深化,也推动了标准规范和技术的发展,甚至在开放政策上超出了开放频谱(open access spectrum)提供的开放层级,例如Dryad、DataCite、DOAB已执行CCO许可协议(见表1)。然而开放资源面向未来的发展还存在一些障碍。
3.1 当前开放资源建设发展特点
结合上文对开放资源建设历程的分析以及表1中对具体开放资源的分析,可以看出当前开放资源建设具有几个特点:①建设的资源类型多样,除了开放期刊、开放仓储外,开放教育资源、开放数据、开放图书、开放视频也逐渐发展起来;②开放资源的数量增长较快,DOAJ中的期刊数量、OpenDOAR中的机构知识库数量、BASE中的文档数量,都是很好的说明;③不同资源的再使用权各异,一些资源的开放性低,这些约束着开放资源的使用;④机读性开放程度低,很多开放资源只提供元数据的机器获取,并不提供全文的开放接口,这阻碍了开放资源的再利用。
3.2 存在的问题
尽管目前开放资源建设发展态势良好,但发展的步伐不停,开放资源建设工作还有可改进的地方:①使用许可的标识不清晰,例如在DOAJ、BASE、OpenAIRE网站上很难找到相关许可说明。②机读性说明文档难以发现,尤其是提供全文的资源系统,一般是在网站FAQ中才提供技术内容的相关文字,或者网站上介绍提供了下载全文的OAI-PMH接口,却难以查找到相关说明,例如The World Bank OKR。③鲜有长期保存策略。除了数据仓储Dryad与数字资源长期保存项目CLOCKSS合作长期保存、PMC自身具有保存功能外,其他资源没有提供说明。DOAJ在2011年时只有8%的期刊在LOCKSS/CLOCKSS中、5%在Portico中,而目前要求被收录的期刊有数字仓储或保存管理计划[30]。④知识组织和再利用层面的建设和服务内容少,目前提供的服务基本是浏览和检索。⑤缺少用户需求分析。DOAJ领导者L.Bjrnshauge在2012年建设DOAB的前期,已意识到用户需求研究的重要性[30]。⑥各自为阵,内容有重复。
4 开放资源建设的影响因素和建设内容分析
有学者提出我国开放获取资源服务存在“研究多,实践少”的现状,在集成平台建设、开放资源的信息组织、知识服务层面的研究和实践薄弱[31],这主要是针对开放资源服务系统建设而言的。实际上,在现阶段的开放资源建设中,针对开放资源的开放程度不同、再使用权不一致等特点和存在的问题,在明确影响开放资源建设的因素后,其开放性建设、政策建设、标准建设显得更加必要[32]。
4.1 影响因素
从以上对OA环境和开放资源的分析中,笔者认为在开放资源建设中有3种主要影响因素:人、资源、方法。“人”的因素中包括作者和用户(包含需求、使用情况)、建设者(如图书馆员、技术人员、科研机构、出版者)、参与者(如资助者、学协会、项目组织者)。“资源”因素则涵盖资源类型、数量、知识产权、OA政策、开放性、合作方式、长期保存等,其中,OA政策和资源开放性较复杂,影响到资源的获取和利用方案,前者包括国家层次的宏观OA资源建设政策、OA期刊及仓储创建机构的资源建设政策、传统出版商的OA政策、科研资助机构的公共获取政策和图书馆等信息服务机构的OA资源建设政策[32];后者(对于OA期刊而言)包括阅读权、再使用权(使用许可)、版权、作者在线发布权、自动发布和机读性[9]。“方法”因素中,除了网络技术和信息技术外,还包括资源建设牵涉到的建设策略、分析报告、标准规范、知识组织、服务能力、推广方法等。因开放资源具有内容开放获取、形式数字化、在线访问的特点,信息技术对开放资源建设的影响程度降低,而OA政策、标准规范、服务能力等的影响比重加大。
4.2 建设内容
依据OA运动中不同时期的关注点和开放资源项目的侧重点,笔者提出开放资源建设的4个主要内容:服务建设、政策建设、规范和标准建设、技术能力建设。它们在开放资源建设的不同时期有不同侧重,涉及到的影响因素也不同(见图1)。
图1 开放资源建设阶段和建设内容分析
注:图中白色圆圈表示各阶段的关键建设内容
服务建设是指从资源发现到利用的过程,以实现多方位的服务,包括资源组织服务、长期保存服务、用户利用服务(包括第三方利用)。影响因素包括人(用户、建设者、作者、资助者组织)、资源(资源类型、数量、OA政策、开放性、长期保存、资源获取或获取方式)、方法(需求分析方法、知识组织技术、系统构建技术、服务推广方式、与资源拥有者或作者的合作能力)。服务建设在开放资源建设的创新期为重点建设内容,并在其他阶段逐步发展为核心能力。
政策建设是指从了解各方政策到构建资源本身利用和持续发展管理政策的过程,包括资源使用政策、资源OA政策、资助者政策、技术政策、资源合作政策。影响因素包括人(作者、资源拥有者、资助者、科研机构)、资源(相关政策)、方法(资源合作能力、与资助者或机构的协调能力)。政策建设为开放资源建设巩固期的重点建设内容,是对创新期政策的详细扩展,并在持续期凝练为完整的资源建设政策和OA政策。
标准和规范建设是指建立开放资源服务和利用规则,包括建设指南和规范、技术规范和标准资源的行业标准。主要影响因素为方法(分析能力、参与行业标准能力等)。标准和规范建设是持续期的重点建设内容,在创新期和巩固期逐步完善,并在持续期最终形成。
技术建设内容即影响因素中的“方法”,贯穿于整个建设过程,是建设者(如图书馆员)需要掌握的能力。
5 开放资源建设策略
开放获取资源建设是一个充满活力的领域,众多的机构和组织参与其中并贡献着力量。正如前文所述,在开放资源建设中的人”已不仅仅是单一角色的人,而是包括了作者和用户、图书馆员、技术人员、出版人员、管理人员、项目组织人员等多种角色共同参与建设活动的人。图书馆可以参与到开放信息资源建设的“传播”、“检索”、“利用”和“保存”环节中[33]:①参与OA出版,从APC和权益上来控制出版商行为[34];②采集开放资源,构建虚拟、可信赖的、集成的馆藏;③对集成的信息资源进行开放复用,包括知识组织和再利用;④通过资助或合作等方式保存核心资源[33]。
回顾10年来开放资源建设的经典案例和发展演化,分析其中规律性的因素和核心建设内容,可得出以下结论:图书馆在规划和建设开放资源建设内容时,需要分阶段按步骤设计和推进:①尽快完成创新期和巩固期的建设内容;②利用在知识组织、长期保存、贴近用户/了解需求、长期资源建设工作中与出版商的合作等优势,建立为特定用户关键保障的开放资源体系;③提供更深程度的知识服务内容,开放获取、开放知识和开放创新的30会聚为知识服务机构支持用户驱动的知识服务创新提供了巨大机遇[35];④图书馆在开放资源建设过程中应融入开放资源政策建设、标准规范建设,以便有效支持用户的开放资源获取和再利用服务。