基于资源目录网站的高校图书馆分布研究_roar论文

基于资源目录网站的机构库分布研究,本文主要内容关键词为:机构论文,目录论文,资源论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G250.73 文献标识码:A 文章编号:1003-6938(2009)06-0097-07

1 引言

机构库(Institutional Repositories,简称IR)又称机构仓储、机构典藏库等,是以网络为依托,收集、整理和存储由某个或多个学术机构(如高校、科研所、图书馆等)研究人员创造的、可供机构内外用户共享的信息数据库,[1][2]它是重要的开放存取资源。

国内外理论和实践研究表明,机构库的创建对科研人员学术信息交流,数字文献资料的永久性保存,学术成果的传播,科研团队知识共享以及提高机构核心竞争力都有着重要的作用。2007年度全国哲学社会科学规划办公室将《机构库应用研究》列入国家社科基金项目指南,[3]表明我国机构库研究将转入应用研究阶段。除了建设新机构库外,组织、利用和挖掘网络中现有机构库资源也是应用研究的重要内容。

对机构库的分布做统计研究需要基于成体系的机构库集合,笔者考虑到数据获取的可行性和完整性,将机构库资源目录网站作为本文研究的数据来源。资源目录是将分散的机构库通过统一平台集成起来的网站,Directory of Open Access Repositories(简称OpenDOAR)和Registry of Open Access Repositories(简称ROAR)就是其中最著名的两个。OpenDOAR由英国诺丁汉大学和瑞典Lund大学合作承担建设和维护,[4]ROAR由英国南安普敦大学的Tim Brody建设和维护,[5]它们都是开放存取的注册网站,对各领域的机构库进行记录和分类。对这两个网站整理的机构库进行统计分析(检索时间:2008年9月23~24日),可以总体了解世界范围内机构库的建设和发展情况。

2 机构库的增长分析

OpenDOAR和ROAR提供了所收录机构库总数发展的统计图,可以反映出总体的发展趋势(见图1、图2)。截止2008年9月24日,OpenDOAR和ROAR上收录数达到了1235个和1145个,对比2006年11月12日OpenDOAR收录网站的数量为827,[6]OpenDOAR中注册的机构库每年都要增加200余个。

图1 OpenDOAR机构库增长情况

机构库的发展建立在理论、技术不断成熟和人们对其逐渐认同的基础上。1991年8月16日,Paul Ginspary创建基于Web的arXiv.org,主要收录物理学领域的论文预印本,[7]可以说e印本文库是机构库出现的催化剂。2002年和2003年,Raym Crow和网络信息联盟的执行理事Clifford A.Lynch分别对IR进行了定义;[8][9]2000年,惠普公司斥资1800万美元与麻省理工学院(MIT)合作开发DSpace,2002年11月DSpace正式面世,在2002年“第六届欧洲数字图书馆先进技术研讨会”上,MacKenzie Smith做了《DSpace:来自MIT图书馆和惠普实验室的机构库》的学术报告,介绍了DSpace构建原理、运行情况及在开放学术交流和数字资源长期保存中的重要作用,从而拉开了全球范围内大规模建设机构库的序幕。[10]

图2 ROAR机构库增长情况

机构库的发展还建立在实际需求的基础上。2005年,Gerard van Westrienen和Clifford A.Lynch在对美国、加拿大、澳大利亚和欧洲十国等高等教育发达国家的调查中显示,机构库在这些国家已经成为高等教育机构普遍使用的基础设施,一些国家甚至制定了全国性的制度来统一协调机构库的发展,越来越多的国家出台了相关的研究报告、声明和指导原则。[11]

3 机构库分布情况统计分析

3.1 国家和地区分布统计分析

机构库在各洲和地区都已经出现,说明开放存取理念得到了一定程度的认同,在数量上主要分布在欧洲和北美,分别为597个和357个,占总量的77.25%(见表1)。

机构库的国家分布中,排在前三位的分别是美国、英国和德国(见表2,表3),在OpenDOAR中占46.40%,在ROAR中占39.65%。出现这种分布的原因是:一是这些国家科技和经济水平较高,有必要、有实力建机构库实现信息资源的存储和交流、传播;二是机构库作为一种理念和技术首先出现在欧美国家,特别是在美国,早在1991年LOS Alamos国家实验室的Paul Ginsparg就创建arXiv.org电子印本文档库,[12]并且欧美学者对机构库作了较为深入的研究,都给这些国家在机构库建设中占有绝对优势创造了条件。

在亚洲,日本、印度和中国是机构库建设的主要国家,特别是日本在OpenDOAR中有69个,占5.59%,位列第四,在ROAR中有57个,占4.98%,位列第五,这与日本总体经济水平和科技教育实力相关;印度在建设机构库中也很引人关注,在OpenDOAR数量中排列11位,在ROAR中排12位,这与印度的科研水平和IT发达是分不开的。中国(包括港台)在OpenDOAR和ROAR中注册的机构库数量为11个和21个,其中比较著名的有奇迹文库、[13]HKU Scholars Hub、[14]台湾大学机构典藏[15]等等,它们的良好运行必然带来中国学术交流传播方式的变革。

OpenDOAR中建设机构库的机构分布,美国是单位机构建库数最高的国家(见表4),达到了1.52个,说明机构库发挥了重要的作用,是交流和存储信息资源的重要手段。

3.2 机构库所使用软件的分布

机构库系统主要可分为4类:(1)专用系统,这类系统是IR研究项目的成果,如eScholarship、Knowledge Bank等;(2)开放源码和免费系统,如Dspace、Eprints、Fedora等;(3)商业系统,如Documentum、Bepress、Open Repository等;(4)混合型系统,如VTLS公司的Vital(见表5、表6)。[16]使用率最高的软件是Dspace、Eprints,在DOAR和ROAR中比率达到了47.29%和53.45%,说明目前机构库系统的主流是开放源码和免费系统。

DSpace是开放源码机构库构建软件,它具有基于Web的用户界面,可为特定机构定制;[17]Eprints是南安普顿大学开发的一个通用免费软件,具有高度的可定制性。[18]DSpace有较强的社区性,在技术上的完善和在市场上的宣传推广,较之两年前,已经超过了Eprints成为占有率最多的机构库系统。[19]

为了便于机构库建设者选择IR解决方案,美国开放社会研究所(Open Society Institute,OSI)近年来定期发布了IR软件指南,2004年8月发布的指南第三版中列出了Archimedes、ARNO、CDSware、Dspace、Eprints、Fedora、i-Tor、MyCoRe和OPUS共9个IR,并从基本情况、技术细节、仓储和系统管理、内容管理、用户接口和查询功能、存档、系统维护等7个方面对这些系统进行了详细的对比研究。[20]

3.3 机构库内容类型分布统计

机构库作为机构的智力产品,用来长期保存机构成员的研究成果,[21]内容包括正式出版物和灰色文献两部分。[22]正式出版物就是通过正式渠道出版发行的文献资料,比如图书、期刊论文等;灰色文献是指那些内容复杂、信息量大、形式多样、通过正式渠道无法得到的文献资料,具体包括预印本、工作总结、学位论文、技术报告、会议文献、数据统计、调查报告等,通常一些信息资源只会在灰色文献中出现,这部分内容对教学和科研有着重要的利用价值,是机构库资源的重要组成部分(见表7)。

3.4 机构库的学科主题分类统计

经过学科分类,可以把OpenDOAR机构库所涉及的学科主题分为28学科大类和跨学科综合,其中跨学科综合的机构库达到了694个,占总量的56.19%(见表8)。

3.5 机构库内容的语言分布

OpenDOAR中1235个机构库所涉及的语言达到了45种,采纳作为学术交流和写作最主要语言英语的就有1046个,覆盖面达到了84.70%,其次为德语、法语、西班牙语和日语,使用汉语的有15个,占到总数的1.21%(见表9)。对于机构库的语言分布,笔者认为:一是大多数的机构库使用了世界通行的英语,有利于学术的交流和传播;二是诸多语种的加入丰富了机构库的内容,有利于传播地域特色、多元化的信息资源。

3.6 创建机构库的机构类型分布

机构库的出现主要解决在学术研究过程中信息资源的传播、交流和存储等问题,因此建设机构库的单位主要是科研教育机构,主要包括高等院校、科研院所、实验室等机构(见表10)。在OpenDOAR中科研教育机构的机构库占到80%。

3.7 机构库运行状态统计

图3是OpenDOAR提供的被收录机构库所处状态示意图,1235个机构库中处于运行状态(Operational)的为1120个,占91%,处于试验状态(Trial)的有91个,占7%,由于各种原因处于关闭状态(Closed or Broken)的有24个,占2%。通过上面的数据分析,说明机构库绝大多数处于活跃的运行状态,在实践中发挥着作用。

图3 OpenDOAR中机构库运行状态

4 机构库资源目录网站功能分析

4.1 对机构库目录的检索

(1)关键词检索

OpenDOAR提供关键词检索,可以进行学科主题、内容类型、机构库类型、机构所在国家或地区、使用的语言、所使用软件等的设置,并且可以设置检索结果显示界面的类型、每页显示条目的数量和机构库条目显示的顺序等;ROAR检索界面相对比较简单,包括关键词的输入框和检索按钮,检索时对机构库的所有元数据字段进行检索。

(2)浏览检索

OpenDOAR给出了List of repositories,用户可通过逐层浏览找到需要的机构库;在OpenDOAR检索界面,可通过Subject,Content type,Repository type,Country,Language,Software等的选择获得符合条件的机构库目录。ROAR有Browse功能,可通过Country,Archive type,Archive software三种途径逐层浏览获得机构库的目录。

(3)检索结果显示

检索到的OpenDOAR机构库目录包括:带有网站链接的机构库;创建机构库的机构并做了网站链接,机构所在国家或者地区;对机构库的描述;OAI-PMH链接;机构库所使用的软件;机构库存储内容的大小,包含多少资源;机构库主题;机构库收集、存储资源的类型;机构库使用的语言;机构库的一些政策,比如元数据、内容使用的一些规则等;机构库评价。

ROAR机构库目录包括:机构库网站首页的缩微图,并有链到机构库网站的超链接;机构库信息量增长的图表,可下载获得;支持软件信息;在ROAR注册的时间;机构库所在国家和地区;机构库类型;机构库所累积信息数量;OAI Interface;机构库基本信息介绍。

4.2 对机构库内容的检索

机构库资源目录网站一般只提供机构库的目录提要,要对内容检索就必须用到第三方的工具。OpenDOAR和ROAR借助了Google自定义搜索引擎(http://www.google.com/coop/cse/)对机构库内容进行检索,由于这种功能是来源于外部,所以并不能实现完全可控,需要机构库网站迎合Google的收录习惯,以便于更多的网页内容被Google的Web crawler抓取到。

5 结语

通过对机构库资源目录网站的统计分析,对机构库的建设者来说可以从中获得建库的相关信息,比如怎么样选择支持软件;对于资源的获取者来说,能更好地选择所要的机构库,消除查找信息的盲目性;对于信息服务的提供者来说,可以通过对机构库资源目录网站的二次整理,向用户提供服务。

2001年1月OAI项目推出了OAI-PMH元数据收割协议,较好地解决了分布式异构数据库之间的互操作和跨库检索问题,目前大多数机构库都遵循这一协议,资料具有互通性,使许多分布的机构库集中成为一个大的虚拟库,给准确、快速获取机构库内容创造了条件。网上已经有了专门的基于OAI-PMH开放存取搜索引擎OAIster,[23]在机构库资源目录网站的建设中可将开放存取搜索引擎技术结合进去,实现更好的可检索性。另外,随着网上开放存取资源的增多,Google、Yahoo!等常用搜索引擎可以开发出专门针对机构库或者其他开放存取资源的搜索功能。

收稿日期:2009-03-19

标签:;  ;  

基于资源目录网站的高校图书馆分布研究_roar论文
下载Doc文档

猜你喜欢