国外数字资源长期保存活动进展,本文主要内容关键词为:进展论文,国外论文,数字论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数字资源逐渐成为社会信息传播、交流的主流媒介,数字资源长期保存已成为一些国家和机构的战略考虑。美国、澳大利亚和欧洲国家较早关注了这一问题,相继启动了一系列项目。他们在此领域取得了很大的进展,积累了大量的经验。而在我国它还是一个新问题。本文对国外的相关项目作了简单的介绍,希望能对我国的研究有所启示。
1 美国数字资源长期保存项目
1.1 美国国会图书馆的保存项目NDIIPP
NDIIPP(National Digital Information Infrastructure and Preservation Program[1]):2002年10月,美国国会通过立法(PL106-554)确定了NDIIPP计划。国会图书馆在此计划中作为领导,与联邦机构、研究界、图书馆界及商界合作,共同开发、设计国家数字资源长期保存的基本架构。该计划的使命是开发一个收集、存储和长期保存数字信息的国家策略。该计划决定对Web信息、视频、音频、数字期刊、电子图书和数字电视6个方面的内容进行保存,其中Web信息资源的整理和保存被视为该计划的重要组成部分。2003年初美国国会通过了国会图书馆的NDIIPP实施计划。
1.2 美国高校图书馆的保存项目
1999年由MELLON基金资助,DLF(数字图书馆联盟)组织7个图书馆开展不同方面的保存先导项目。随后其他高校也不断参与和开展保存项目,有的已经和国外进行联合。
(1)斯坦福大学的LOCKSS
LOCKSS(Lots of Copies Keep Stuff Safe[2]):这是一个由NSF(美国国家科学基金)和MELLON基金资助、斯坦福大学图书馆组织实施的项目,致力于解决电子期刊的保存和利用问题。LOCKSS通过建立出版商与图书馆之间的协作平台,为出版商和图书馆提供电子期刊数据保存和访问服务。图书馆可以利用LOCKSS提供的信息系统在本地创建一个低费用、永久保存的数字化信息缓存站点,在本地实现电子期刊信息的收集、存储、管理,为本地用户提供服务,并为LOCKSS联盟内其他成员提供支持。
(2)康乃尔大学的PRISM
PRISM(Preservation,Reliability,Interoperability,Security,Metadata[3]):该项目于1999年启动,为期四年,由康乃尔大学图书馆开发管理。其目的是创建能确保分布式数字图书馆数字资源的长期保存的政策和机制。研究内容集中在5个方面:数字信息的长期保存、信息资源和信息服务的可靠性、互操作性、安全(隐私权和知识产权)、元数据。其核心是将传统保存策略移植到数字领域,以支持数字保存工具和机制的开发。
(3)加利福尼亚大学的eScholarship计划
eScholarship[5] [6]:该计划由加利福尼亚大学的数字图书馆(CDL)发起,CDL成为全校数字资源保存中心。保存的内容主要有:研究与学术知识库(包括没有出版的资料)、网络出版物、学者与普通读者都感兴趣的学术专题资料的电子版等。该计划通过CDL建在各学院图书馆、研究机构、实验室、博物馆等地的节点,为用户提供保存服务。
美国高校在数字保存领域十分活跃,除了上述项目外,还有麻省理工(MIT)的Dspace项目、耶鲁大学(Yale)的YEA(Yale Electronic Archive)、宾夕法尼亚大学(Pennsylvania)的Data Provenance Project等。
1.3 其它机构开展的保存项目
美国的一些非赢利组织与学术机构也投入到了数字保存领域的研究,如OCLC、RLG等。
(1)Internet Archive[7]
Internet Archive是一个非赢利组织,于1996年成立,位于旧金山。该组织一直按月收集并保存HTML网页,其目的是使研究人员、历史学家和其他学者能够永久访问到过去存在的数字资源。该库与Alexa公司密切合作,Alexa公司负责从网上收集数据,在数据失去一定商业价值6个月后,由Alexa公司捐赠给Internet Archive保存。自1999年底起,它开始保存更多形式的数字资源。现在除了网页之外,它的保存内容还包括文本、音频、动态图像和软件。
(2)PREMIS
PREMIS(PREservation Metadata:Implementation Strategies[8] [9])是一个国际工作小组,由来自五个国家的30位专家组成。该小组由OCLC和RLG发起,于2003年6月成立。它有两个目标:一是定义开发一套保存元数据的核心元素集,二是了解与评估保存元数据的实施应用情况。它借鉴了由OCLC/RLG保存元数据小组于2002年开发的元数据框架,并以此作为概念基础和研究出发点。其成果有:开发了保存元数据的核心元素集并作了相应描述;起草了在国际范围关于数字保存的调查报告。
(3)JHOVE
JHOVE(JSTOR/Harvard Object Validation Environment[10]):是JSTOR和Harvard大学图书馆合作开发的一个项目,受Mellon基金资助。其目的是自动识别和确认文件格式,而且这个过程是基于文件本身而不是文件扩展名。JHOVE是一个开放源代码、基于Java的框架,能够对数字对象进行识别、确认和特征化。从2004年7月19日推出测试第2版开始,JHOVE就投入了使用。2005年5月26日,JHOVE推出正式版。
2 澳大利亚的国家保存项目PANDORA
PANDORA(Preserving and Accessing Networked Documentary Resources of Australia[11]):1996年由澳大利亚国家图书馆创建,现在与9个其它澳大利亚的图书馆和文化机构合作,其根本目的是在建立一个经过选择的澳大利亚网络信息资源归档系统的同时,为保护和存取澳大利亚电子资源制定政策和程序。目前该项目由电子资源部、编目部、期刊部等部门共同管理,以电子部为主。澳大利亚国家图书馆每年大约花费100万澳元来支持该项目。PANDORA包括5个环节:出版物选择收集、检索、存储管理、报告生成和提交。
3 欧洲数字资源长期保存项目
3.1 欧洲各国合作保存项目
欧洲早在20世纪90年代就开始关注数字资源长期存取问题,欧盟各成员国都充分意识到数字资源长期保存的重要性。因此,欧洲是数字资源长期保存研究最活跃的地区之一。
(1)DELOS
DELOS项目(Network of Excellence on Digital Library[12] [13] [14]):是欧盟近期的一个数字图书馆项目。欧盟的FP5(Fifth Framework Programme)和FP6(Sixth Framework Programme)都资助了该项目。DELOS FP6项目在DELOS FP5项目(时间为2000年1月—2002年12月)基础上于2004年1月启动,为期4年,研究经费1570万欧元(欧盟提供其中的600万欧元),来自13个国家47家机构的近300位研究人员参与该项目。DELOS FP6共有7个工作组,其中第6个是长期保存小组。该研究组的工作包括:设计能够测试和验证不同数字保存策略优劣的试验台;设计、部署和管理数字仓储;调查文件格式与保存策略的交互作用;将保存功能模块集成到数字图书馆中;自动提取、评价元数据等。
(2)NEDLIB
NEDLIB(Networked European Deposit Library[15]):由荷兰国家图书馆牵头,欧洲8个国家图书馆、一个国家档案馆及3个出版社(Kluwer,Elsevier,Springer-Verlag)参与,合作研究数字资源长期保存的基础结构和欧洲存储图书馆机制,保证电子出版物的长期保存和利用。1998年1月启动,2001年1月结项。该项目为了建立电子出版物存储系统(Deposit System for Electronic Publications,DSEP),开发了通用框架和基本的工具。
(3)ERPANET
ERPANET项目(Electronic Resource Preservation and Access NETwork[16]):2001年11月开始,2004年10月完成,由欧洲委员会和瑞士政府资助,由荷兰、英国、意大利和瑞士的几个学术机构合作进行。它建立了一个可以扩展的联盟,将存储机构(如图书馆,档案馆)、研究机构、政府部门等联合起来。其最大的特色在于建立了一个可以扩展并能自我维持的欧洲启动项目,成为了关于数字保存的知识交换中心和知识仓库,使机构或个人能够实现知识转移。
(4)PRESTO
PRESTO项目(Preservation Technology for Broadcast Archives[17]): 2000年9月开始,2002年10月完成,由欧盟IST(Information Society Technology)发起,由欧洲主要的公共广播资料档案馆和商业研究机构合作实施。该项目主要是要为欧洲广播档案馆收藏的音视频资料找到经济的长期保存方法。在此基础上,2004年2月又启动了一个相关项目PrestoSpace。PrestoSpace把保存方法扩展到了除广播资料之外的其它音频、视频和缩微胶卷资料,关注于解决视听资料迁移成本方面的问题。
(5)SEPIA
SEPIA项目(Safeguarding European Photographic Images for Access[18]):于1999年最初由ECPA(European Commission on Preservation and Access)启动,由欧盟资助,主要着重于照片资料的长期保存问题。随后欧盟的2000文化计划(Culture 2000 Programme)资助了该项目,于是合作者将项目延长了3年,从2000年11月1日到2003年10月31日。
(6)MMP
MMP(Mellon Microfilming Project[19]):1998年启动,历时10年,直到1998年才结束,最后共扫描制作了12500盘缩微胶卷。大英图书馆、牛津大学图书馆和剑桥大学图书馆等10多家机构参加了该项目。主要是把一些受到毁坏威胁的社会类、学术类资料缩微化,以利于其长久保存,同时提高缩微技术水平。例如大英图书馆把自法国大革命以来的报纸都扫描到缩微胶片上,向读者提供电子版的全文。
(7)EVA
EVA项目(European Visual Archive[20]):作为由欧盟发起的“INFO2000计划”的项目之一,于1998年12月开始,2001年2月完成。它把欧洲许多档案馆收藏的历史照片数字化后供公众在线浏览。EVA项目的主要目标有:提供对伦敦城市档案馆(London Metropolitan Archives)和比利时安特卫普档案馆(Stadsarchief Antwerpen)的资源的广泛存取;让历史照片收藏者熟悉数字化和照片发布的方法。
(8)NWA
NWA项目(NORDIC WEB ARCHIVE[21]):1998年10月,北欧国家图书馆决定成立一个指导小组,开发NWA,其工作包括:由指导小组开发存储、获取模块的功能与技术需求说明书;协调北欧国家的项目开发工作;协调北欧国家与其它欧洲国家的合作。合作者包括:丹麦哥本哈根皇家图书馆、芬兰赫尔辛基大学图书馆、冰岛国家图书馆与大学图书馆、挪威国家图书馆、瑞典的斯德哥尔摩皇家图书馆。它们在许多方面展开了合作:技术开发、技巧与方法、永久保存等,其目的是为了促进科学研究和公众获取。
3.2 英国的保存项目
英国是最早建立数字图书馆的国家之一,也是最早关注数字资源长期保存的国家之一。
(1)CAMILEON
CAMILEON项目(Creative Archiving at Michigan and Leeds:Emulating the Old on the New[22]):是英国利兹(Leeds)大学和美国密歇根(Michigan)大学的一个合作项目,于1999年10月启动,受JISC和NSF提供资助。该项目研究了将仿真技术作为数字长期保存策略的相关问题,并作了用户评价和成本效益的分析。该项目开发了工具、指南,将仿真技术与其它保存策略进行了比较,认识到了该技术在还原数字对象上的优点,认为将仿真作为数字保存策略可行。
(2)CEDARS
CEDARS(Curl Exemplars in Digital Archives Project[23]):该项目由JISC资助,在1998年4月-2002年3月间进行,由利兹大学、牛津大学和剑桥大学实施。其致力于研究数字保存的策略、方法和实际问题,包括数字对象的获取、长期保存、有效描述和永久获取。CEDARS还制定了几个方针性文件,在诸如馆藏管理、知识产权、保存元数据、技术策略等方面提供指导。
(3)DPC
DPC(Digital Preservation Coalition[24]):该联盟成立于2001年,其目的是与其它机构展开合作以保存英国的数字资源以及全球的数字记忆,文献[25] 概括了其长期目标。其成员现有10个,包括British Library、CURL、JISC、OCLC等。它还设立了一个数字资源保存奖(Digital Preservation Award),2004年由英国档案馆获得,2005年由PREMIS工作组获得。
(4)DCC
DCC(Digital Curation Centre[26]):获得JISC和电子科学核心项目(e-Science Core Programme)从2004年3月开始的为期3年的联合资助,于2004年11月正式启动。它主要支持英国相关研究研究机构存储、管理和保存数字科学数据,致力于研究数字医疗、文件格式、工具、认证服务等问题。
(5)AHDS
AHDS(Arts and Humanities Data Service[27]):由JISC和AHRC(Arts and Humanities Research Council)资助成立,是以收集、保存和推广艺术、人文领域的研究和教育电子资源为目的的服务机构,促进相关资源的网上获取以支持科研和教育。目前其保存有五个领域内容:考古学、文学与语言、历史、视觉艺术和表演艺术。
(6)FAIR
FAIR(Focus on Access to Institutional Resources[28]):注重于机构资源的获取(机构仓储和开放获取)。受JISC资助200万欧元,研究时间是2002年8月-2005年10月。其目标包括:调查机构资源的存储与公开情况;提升对技术、机构、文化的理解;创建机制支持用户对数字内容的提交与共享。其共有14个项目,分为3个研究组:电子出版物和学位论文、博物馆和图像、机构门户。
(7)Dspace@Cambridge
Dspace@Cambridge[29]:2002年底开始,2005年底完成。它是由剑桥大学图书馆和MIT合作建立的一个机构存储库。它将用来存储剑桥大学图书馆的数字化资料和本校其它机构产生的数字资源,如学术交流资料(论文和预印本)、学位论文、技术报告、部门档案等,以不同格式如多媒体、课件、数据集、数据库等加以存储。CMI(Cambridge-MIT Institute)除了给该项目资助170万英镑,还资助了一个培训项目LADIRS(Learning About Digital Institutional Repositories Seminars)。
3.3 欧洲其它国家的保存项目
除了英国,欧洲其它国家也很重视数字资源的长期保存工作,如荷兰、德国。
(1)荷兰国家图书馆的保存项目DARE
DARE(Digital Academic Repositories[30]):预算200万欧元,计划在2004年7月-2006年12月间完成。合作者包括:荷兰所有大学、荷兰国家图书馆、KNAW(Academy of Arts and Sciences)、NWO(National Scientific Research Board)。其目标是建立一个科研资料存储库的网络,以支持科研中研究资料的存储与发布。在此框架中,所有大学都对其数字资源的存取负有责任,而荷兰国家图书馆负责数据的长期保存。
(2)德国的NESTOR
NESTOR(Network of Expertise in Long-Term Storage of Digital Resources[31]):由BMBF(German Federal Ministry of Education and Research)赞助,预算80万欧元。2003年6月启动,计划于2006年5月结项。由德国6个学术机构合作,其中德国国家图书馆领头。项目目标包括:主页;信息平台;交流平台;德国数字保存联盟的永久框架;可信数字仓储的标准;如何评价选择数字存储系统;馆藏管理和资源选择标准;数字保存政策;图书馆、档案馆和博物馆之间的协调。
(3)德国的KOPAL
KOPAL(Co-operative Development of a Long-Term Digital Information Archive[32]):于2004年7月启动,同样由德国的BMBF资助,具体工作由Die Deutsche Bibliothek领导。KOPAL想要开发可复用的数字数据长期保存的新技术解决方案。该项目的目标是:评价IBM的DIAS软件;提取DIAS的核心;开发新的功能,如远程访问、技术元数据等;开发用于数字对象分类的工具;实施保存规划;开发访问工具;工作流集成。
通过介绍,我们可以了解到国外的确在数字资源长期保存领域取得了较大的进展。总之,国外在实施数字资源长期保存项目时所采取的一些策略和方法值得我国借鉴。