国外文献对机构知识库的研究综述,本文主要内容关键词为:知识库论文,文献论文,国外论文,机构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
20世纪90年代末,开放存取运动在国外兴起,并形成开放存取期刊、学科知识库、机构知识库三个分支,其中以机构知识库(Institutional Repository,以下简称IR)的发展最为迅速,得到国外众多学术机构的认同和采用,并掀起对IR建设进行理论和实践研究的热潮。国外IR研究的文献大致可分为三类,一是概述性研究,主要涉及IR的定义、兴起背景、存在问题、实施影响等方面;二是项目介绍,是对一些具有代表性的IR建设项目进行介绍与总结报告;三是对IR建库软件进行介绍分析。通过搜寻学术数据库和互联网,笔者查找到国外有关IR论述密切度较高的33篇文章。本文通过对这33篇文章进行综述研究,总结国外IR建设与理论研究经验,以期为国内IR的进一步研究尽一份薄力。
1 概述性研究
1.1 IR定义
对于IR的定义,目前还没有统一的界定,学者们也都各执一词,但其定义大致可划分为两类,一类侧重于对IR是一种服务体系的论述,如:文献[1]认为“以大学为基础的IR是一整套的服务体系,它是一所大学对其社区或机构成员所产生的数字资源进行管理和传播,并向其社区成员提供这些资源有效使用的服务体系。”文献[2]认为“IR是由大学向其社区成员提供的一整套服务,并对其机构内和社区内所产生的数字资源进行管理与分发。”也有观点认为“IR是以机构为依托的服务,对机构内成员所产生的学术成果或内容进行存储、分发和管理等服务。”[3]
另一类文献则侧重于强调IR的机构性、学术性、累积和持久性、开放和互操作性。如:Raym[4]指出“IR的狭义定义应满足以下两个目的:一是对重新改造的学术交流体系的补充;二是对机构品质的一个明确体现。并认为,按照上述目的,IR是对机构成员所产生的智力成果进行收集保存的数字知识库,可被机构内外的终端用户所获得,不存在获取障碍.并包含以下特性:能够显示机构特色的、学术的、累积和持久的、开放和互操作的。”文献[5]认为“狭义的IR是能够显示机构特色的、学术的、累积和持久的、开放的和互操作性的。与学科知识库或主题导向型知识库相比,IR重在收集原始研究数据及机构成员在众多领域所产生的其他智力成果,是对一个机构的知识发展期和知识产出量的一个明确的历史体现。这也使IR成为主要的学术质量控制层,成为一个机构学术质量的把关者。”文献[6]认为“IR是对一个大学或多个大学内智力成果的收集和保存所形成的数字知识库;其包含的内容是广泛的,能反映机构智力资产;是累积和持久的,能确保对保存资料的持续获得;遵循通用的互联网技术标准,以确保资料可以被搜索和获得;可通过互联网免费获得。”
1.2 兴起背景
IR的兴起与开放存取运动密不可分,因此许多文献是把开放存取运动和IR的兴起放在一起介绍。其中,以文献[7]的介绍较为全面,它认为开放存取运动的兴起与发展主要源自三个要素,一是传统出版体系所带来的价格危机和许可危机引发学术界的日益不满;二是互联网的普及使电子出版成为可能;三是互操作协议的发展推动信息的有效共享与传递。还有部分文献则侧重于从学术交流体系本身的局限性和价格危机方面来论述其兴起背景。
1.3 存在问题与相应对策
在对IR建设中存在问题进行分析的文献中,既有从整体角度进行全面分析的文章,也有侧重于某一问题进行重点分析的文献。
着重于全面分析的文献有以下几篇:文献[8]把IR实施和运行中存在的主要问题归结为四大类:组织、管理与文化问题;内容获取与保存政策的制定问题;各院系及师生的参与度问题;技术与基础构造问题。文献[9]对IR实施中的机构文化、实施规模、内容提交、获取政策、获取层次、法律、标准化、合作性、持续性和基金支持等问题进行论述,并提出IR建设的“8C”理念,即“理解、合作、背景、改变、爱心、承诺、创造性、能力。”而文献[10]则把IR发展中的问题归结为应用上和文化上两大方面,涉及IR建设中的版权、质量控制、长期保存、学科文化差异性、期刊在现有交流体系中的作用等方面。
还有一些文献是重点针对IR建设中的某一问题来论述,具体可分为以下几点:
(1)对IR建设中的内容收集问题,文献[11]建议图书馆针对传统学术交流环境采用相应的策略和技巧来实施内容收集与管理,并对收集的内容类型提出建议。
(2)文献[12]主要关注IR建设环境下对数字保存的具体要求、功能实现和使用等问题。文献[13]通过对美国现有IR数字保存状况的调查,总结出移植、技术保存、仿效、持久的对象保存这四种互不排斥的保存方式。
(3)文献[14]对IR现有服务模式进行总结,对比分析中央集中式、分布式、收割式这三种服务模式的优缺点,指出收割式的应用最为广泛,并对建立在该模式基础上的ePrints UK体系、基于浏览入口的服务体系、Google服务模型进行介绍。
(4)文献[15]对电子出版环境下版权归属问题的现状进行调查研究,指出高等教育机构在对版权归属问题的政策声明上有待加强,并提出现阶段解决版权问题的两种可行方法,一是作者向出版商移交论文印刷版本的版权,但保留论文的电子版权。二是只给出版商在期刊上生产和传播论文的权利。文献[16]则指出在处理知识产权的问题上,最重要的是劝阻作者不要轻易地把版权转移给出版商。应尽可能地鼓励作者保留版权,如:可把论文投递给不要求转移版权的期刊;也可改变版权声明,允许作者保留其版权(最低限度保留电子分发权)。如果上述都行不通,可对预印本加上评价修正后上传到IR服务器中。
(5)对于IR建设中的文化差异性,文献[16]指出不同学科在交流、认证和讨论时有着不同风格。这种文化差异性在大的学科范围如自然科学、社会科学和人文科学上尤其明显。即使在大学科范围内,其具体的各学科之间也存在文化差异,如物理学和化学,物理学领域的预印本文化已经存在、实施并获得成功,但在医学和化学领域,对同行评议过程有着极高地重视,如果说一个IR中包含着这两个学科领域中没有经过同行评议的论文,那么这两个学科领域的研究者是不会使用此IR的。
(6)OAI及其互操作协议是IR发展中的一个重要部分。文献[17]通过调查现有适应OAI协议的IR,指出OAI-PMH的使用极大地促进IR之间的互操作性,讨论了几种通过OAI-PMH运用来提升IR使用的情况,并对OAI-PMH使用中的有待改进的方面进行讨论研究。文献[18]则介绍如何运用OAI-PMH来方便地和低成本地获取信息。
1.4 实施益处及其影响
文献[16]指出IR的实施对于研究者来说,可降低影响栅栏、方便获取、快速传递、通过OAI协议提供IR之间的交叉检索、提供附加服务;对于机构来说可提升机构地位、实施RAE管理、实现长期的成本节约。而文献[19]则指出IR的实施可提升学术交流过程中的信息获取;信息的整合有利于知识的产生;存储和保存机构数字成果以保障其可长期获取;平衡机构内的知识资本;通过合作实现协调作用与规模经济性:增加实施机构的可见度与声誉。文献[9][20]论述IR的实施对于社会的益处。如,通过拓宽学术出版物和研究成果的市场,尤其是在科学和医学方面,开放存取运动和IR能够有效地促进经济增长,带来更多的革新和工艺技术,还可发展新形势下的在线教育。
文献[21]从学术交流过程中的注册、认证、利用、保存四方面对传统学术交流体系和IR的功能实现过程进行比较分析,指出不管是通过传统的学术交流体系,还是通过IR这种新兴的交流方式,学术交流过程中的参与者和赞助者主要是学术机构及其成员,而且交流中的大部分直接成本都来自于学术机构。传统学术交流体系的商业运行模式所引发的期刊价格危机与许可危机已日益引发学术界的不满,IR的出现无疑是对传统学术交流体系的一个挑战。IR的出现并非为了取代传统出版体系,而是通过自身对学术交流功能的有效补充,打破传统出版体系所形成的垄断地位,掌握对学术成果的控制权,迫使传统出版体系下调期刊价格,更多地关注于向学术界提供附加服务。
文献[22]主要对开放存取运动的发展对发展中国家的影响进行论述。指出开放存取运动对发展中国家信息获取的重要性,并对一些发展中国家的开放存取运动的实践和IR的建设经历进行回顾。
1.5 图书馆员在IR建设中的作用
文献[23]具体关注图书馆员在IR建设中的角色和作用。指出在新环境下图书馆员除承担获取、组织资料并向师生提供使用的职责外,还需要和技术职员、教员一起合作来传播其机构内的资源,需要掌握对OAIS的管理技能,并培训师生对OAIS的使用,帮助他们整理数字学术成果,使其参与到IR的建设使用中来。
2 项目研究
在国外有关IR项目研究的文献之中,以对FAIR项目及其各子项目的介绍居多。如文献[24]从整体上介绍FAIR项目,并对其包含的各个子项目进行简单概述。
文献[25]重点介绍DAEDALUS项目的内容获取策略,该项目分三个阶段进行内容获取试验,并在不同阶段采用不同策略。在第一阶段,主要是邀请特定领域的著名专家提交内容。在第二阶段通过调查教员的个人网站;确定支持IR的学术期刊;利用开放存取期刊这三种方式增加内容。由于前两个阶段的策略只适用于短期及相对小范围内,该项目在第三阶段提出利用院系出版物数据库来满足IR的内容收集,其最终目标是发展成一个基于大学范围内的可系统添加内容的工作流程。文献[26]对DAEDALUS项目的发起环境、隶属项目、软件运行测试的经历与结果进行介绍,涉及建设时的政策支持、软件选用、内容获取和知识产权等问题。
文献[27]对SHERPA项目发起缘由和其在质量控制、版权问题、数字保存上的经验进行介绍,指出对于IR建设中的版权问题应按照出版商版权政策的不同来区别处理,该项目收集有关出版商的版权政策并列制成表,明确公布各出版商所允许和禁止的事项,对于IR了解特定期刊或出版商的版权政策提供很大帮助。
文献[28]对于探索如何建立持续的多学科IR,以平衡机构内研究成果的TARDis项目进行介绍。文献[29]对ROMEO项目中元数据的准确度进行相关研究。
3 软件研究
专门研究IR建设所需软件的文献也有许多,有的是从整体出发,对众多软件进行介绍分析,有的是专门针对某一种软件进行介绍。还有的是通过某一项目的具体实施,专门对某一种或几种软件进行介绍分析。
从整体上来研究的文章中,以文献[30]对各软件的介绍最为全面。该文涉及ARNO、Archimede、CDSware、DSpace、Eprints、Fedora、i-Tor、MyCoRe和OPUS九种软件,首先是对上述软件进行系统地介绍,然后以表格的方式从技术规范、知识库及系统管理、内容管理、用户界面与检索、文件的保存、系统维护等方面对各软件进行详细的对比分析,是迄今为止从整体上对IR的构建软件介绍最多、分析最为全面的一篇文献。而文献[12]则对ARNO、CDSware、DSpace、Eprints、Fedora、MyCoRe这六种软件进行系统地描述总结。
还有一些文献是针对某一软件进行专门介绍。如文献[31]对EPrints软件进行详细介绍,涉及其特性和设计理念,并介绍应用此软件建立IR的相关成本,如硬件、职员时间等。文献[20]主要对DSpace软件系统的信息模型、元数据、用户界面、工作流程、技术平台、系统体系、标识符等方面进行介绍。文献[32]主要论述Fedora软件的特性,详细介绍其体系特征,如:支持多种数据类型,可以兼容新的数据类型,可以把混合的、分布式的数据集合成复杂的数据对象;并对其结构层、界面层、管理层以及对数据对象的管理权限等方面进行介绍。
还有一部分文献是通过某一项目的具体实施,对某几种软件进行介绍或对比分析,如文献[33]利用“Theses Alive!”项目中对DSpace和ETD-db软件在网络环境下对电子论文的传送能力差异性的评估实践,从使用范围、运行环境、提交过程、存档和获取、管理与安全性等方面对Dspace和ETD-db两个软件进行对比分析。文献[26]针对EPrints和DSpace这两个软件在Glasgow大学中注册运行的情况进行分析,对其实施过程中各软件所要求的运行环境、软件的系统构造、提交过程、界面设置、系统管理等方面进行记录比较,并提出各软件中有待加强的地方。
收稿日期:2008-01-16