美国数字信息保存计划——NDIIPP及其对我国的启示,本文主要内容关键词为:美国论文,启示论文,我国论文,数字论文,计划论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 发起
NDIIPP 是由美国国会图书馆发起的保存数字资源的联合行动。2000年12月,美国国会通过法案建立“国家数字信息基础设施和保存计划”(National Digital Information Infrastructure and Preservation Program,NDIIPP),该计划决定让国会图书馆承担领导全国数字信息长期保存的任务,并与政府部门和拥有收集与保存数字内容专长的实体进行合作,如商业部、白宫科学技术政策办公室、国家档案及文件总署(NARA)、国家医学图书馆、RLG 工作组、OCLC。另外,它还鼓励广大民营机构加入进来参与此项计划。NDIIPP 试图保存电子图书、电子期刊、数字音乐、数字电视、数字录像、网站共6种媒体类型的信息。
2 数字化保存基础设施的发展[1]
NDIIPP 授权合作者建立一个联合的保存网络,围绕投资和以下两个宽泛领域的行为明确了角色和责任:不同机构合作所必需的核心能力;为控制网络所需的数字化保存结构。
2.1 数字化保存网络的核心能力
国会图书馆促进了收集、保存和利用数字信息内容的一系列主要行动,并认为这些行动必须联合起来。经过NDIIPP 商讨与研究进而认可的行动有:
2.1.1 选择和收集
此方面的合作行动包括:在国内图书馆之间建立数字化信息收集范围的合作协议,包括基于网络的、得到许可的数字化信息;在图书馆、档案馆和其他公共或私有的数字信息收集机构之间建立合作收集协议;召集专家制定评估指标,以确定具有永久价值的信息内容;召集专家检查在收集动态对象(如网络杂志、地理信息系统中的信息)的最佳做法的准则;确定基于网络的、用于保存的数字信息的边界;审查信息收集的政策,使这些政策不断更新。国家科学基金会与国会图书馆研究建立投资收益模型(cost-benefit models)来确定保存的格式、标准、保存策略的选择(常态、迁移、仿真)、不同水平的描述与元数据的投入与收益。
2.1.2 知识产权
关于知识产权的研究活动有:为国会图书馆保存从因特网上抓取的数字信息而开展的选择权与组织机构的研究;研究在图书馆环境中哪些是可接受的获取数字内容的手段;研究法定资金对数字信息保存的影响;研究各种安全保护设备对保存的影响;建立更好的具有国际化背景的关于版权、司法权和责任的协议,形成可实施的法律,以便与其他国家的图书馆和跨国出版与媒体公司的合作成为可能。知识产权被认为是数字信息遗产保存的所有障碍中最大的障碍。NDIIPP一个主要的指导原则就是把数字信息的所有者及用户的权利置于同等重要的地位,以使保存在讨论中具有优先性。
2.1.3 职责模型(business models)
国会图书馆及其合作者采取的行动有:识别各种机构保存数字信息的诱因;识别数字信息的创作者保存其内容的诱因;建立数字信息保存的投资与收益的测量尺度(metrics),形成可靠的客观的方法去衡量投资、收益和数字化信息的价值; 建立评估数字作品的保险与税收的测量尺度;为商业实体或者其他机构中没被妥善保存的数字资源建立类似安全港(safe-harbor)的协议模型,规定所有者的数字资源可被自己保存,也可以被可靠地转变为可信的资源库,以保证其长久性。
研究和测试经济模型与策略对于建立稳固的数字化保存基础设施是必须的,为此需要研究的领域有:获取与保存信息的费用;创作者存储作品的经济诱因和其他诱因;使保存格式标准化所需的费用;在数字化对象的生命周期的各个阶段应由谁承担这些费用。在数字信息的保存活动中,信任是决定性因素。保存者们必须在资源库中拥有非常高水平的信任,这种信任建立在熟练地使用安全技术、完好的跟踪记录和始终如一的应用规则和协议。
2.1.4 标准与最佳的做法(standards and best practices)
国会图书馆继续领导或发起的行动有:协调和记录支持重要保存服务的标准,例如元数据和持续的标识符计划;支持对格式与编码计划的研究,介绍最佳做法;支持策略的研究与建立,例如移植和仿真,这能保证数字化内容的稳定性;建立交流的策略,以跟踪技术的变化和技术对保存的影响。
数据格式、数据模型、元数据等数字信息标准是保存行动必不可少的。数字化数据的长久性及在将来读取这些数据的能力依靠于编码和描述的标准,但标准随着时间而变更。研究标准的演化必须理解标准变化对长期保存措施与实践的影响。国会图书馆领导着全国数字化保存的工作,主持研究相关的标准,不仅仅限于元数据,也包括数据格式,或者数字化信息的编码方法。国会图书馆继续支持已经现有的许多研究和交流关系,并在其中发挥积极作用,以帮助明确最佳的保存做法。
2.1.5 交流和外展服务(communication and outreach)
对专业或普通读者的外展服务活动包括:维护NDIIPP 的网址( www.digitalpreserv ation.gov),以该计划的当前状况为主要内容;通过参加专业会议对专业团体提供外展服务,贡献专业著作;通过流行的印刷型与网络出版物和广播媒体,对公众提供外展服务。
交流和外展计划的目标是形成全国性的NDIIPP 的支持者,并使他们成为保存数据化遗产的积极参与者。吸引图书馆和档案馆团体、商业界、创作团体和普通公众,努力向他们传达保存数字化遗产的重要性和紧迫性。鼓励NDIIPP 的合作者成为公共交流的积极参与者。保存活动不能仅局限于图书馆和档案馆,而应必须被看作创作行为内在的一种行为。
2.2 数字化保存的结构
数字化保存的基础设施需要建立一个众多保存者参与的强大网络,明确数字化保存的结构。为此,国会图书馆将召集一个设计组以更深入地发展数字化保存结构的各个组成部分,征求意见测试系统,并为系统的组成部分建立模型,对项目的结果进行评估,以明确下一代系统需要补充的地方。
2.2.1 设计原理
NDIIPP 的数字化保存结构必须:支持保存机构之间的相互关系;允许保存问题从检索问题中被独立地处理;在可能的地方,运用现有的技术和成果进行模块化的构造;始终能够装配,而不是需要马上把所有的部分都建构起来;能够部分地更新,而不影响整个系统;详细说明广泛使用的可采用的协议。这些原理共同支持透明、合作、发展、稳定、弹性、多样性和革新等多种价值的实现。
2.2.2 简要内容
为了与上述原理保持一致,技术专家组清晰地设计出了四层保存结构,每一层包含一系列不同的功能,同时又被一系列相关的使用规则控制着。这些层和它们的内部联系可以允许保存团体根据它本身的特定需要定制保存结构,并且因需要的变化而能调整其结构。
附图
保存结构共有四层(如图所示):资源库层用于长期保存数字化的数据;网关层为资源库层提供保护和管理;收集层形成数字信息的获取、检索和环境(context)的协议与决策;界面层帮助检索与获取数字化信息。这个结构类似于图书馆工作人员找一本放在安全资源库的不常见的书。它通过求助于分类卡片的一种替代方法来发现书的检索入口(收集层的书目记录),然后请图书管理员(在网关层)检索安全库里(资源库层)的书。用户对许多存放在不同的资源库的数字化对象有多种检索途径,因为在网络里有目录、网关、资源库这些重要的功能。这四层中的每一层都能被要求打开或者关闭,以便从公共领域到商业性的有价值的任何数字化信息都能被保存。作为一个整体,这个系统提供了检索、控制和保存之间的平衡。
3 对我国数字资源保存工作的启示
数字资源的保存是信息时代提出的新的挑战,也是保存一国文化的迫切要求。考察美国的NDIIPP 之后, 笔者深为发达国家规模庞大且思虑周密的数字资源保存计划所感叹。联想到我国在此领域的发展状况,觉得有些方面需要引起注意。
3.1 要形成社会广泛参与的数字资源保存机制
数字资源的长期保存,面临着经济、法律、技术等多个方面的难题,是一项艰巨的系统工程。单独的某个机构根本无法解决所有的问题,必须全国上下齐心协作才能挽救看似无所不在、实则在瞬间可能飞灰烟灭的数字资源。从NDIIPP 的发起可以看到,参与这项计划的机构既包括了图书馆(如国会图书馆),也有政府机构(如商业部)及商业性组织(OCLC),甚至鼓励民营机构也参与进来。这样做的目的是集思广益,切实地解决一些问题,而不是流于空谈。在2001年11月,国会图书馆召集了近七十名各行各业的代表参会,他们来自于专业协会、娱乐界、电影、音乐、图书馆、档案馆、报纸、杂志、出版、软件等行业,有的代表还具有多种职业背景。这次会议对保存方式的分散化、保存技术的地位等重大问题达成了一致意见。[2] 在这个保存计划中,提到了数字作品的创作者的保存责任,并把保存行为视作创作行为的一部分。这就改变了保存数字信息只是保存机构(如图书馆)责任这一传统看法。只有形成人人主动地保存数字信息的意识,数字资源的保存才可能是全面的、有效的,才能形成一种广泛的社会行为。
另外,对于数字信息的保存机制,笔者赞成建立分布式保存的保存机制[3]。除了保存任务繁重、单靠一个机构无法完成这一原因外,安全因素也是一个不可忽视的因素。从图书馆学史我们不难发现,我国古代许多大型藏书楼的珍贵典籍由于战争、管理不慎等原因,或被毁,或丢失,总是呈现聚久必散的规律。如果过于集中,一旦受到破坏,损失就更大。数字资源的保存也应汲取这方面的经验教训,保存的物理地点应分散,不宜集中。明确各个保存机构的保存范围和职责,发挥各自的优势与特长,形成数字资源的分布式保存体系。
3.2 发挥国家图书馆的领导作用
2000年,美国国会意识到阻止数字资源的丢失需要相当大的投入,决定立法实施NDIIPP,任命国会图书馆负责此项计划的设计与实施。公共法案106—554决定投入1亿美元支持NDIIPP。在强有力的法律保障和资金支持下,国会图书馆积极努力,多次召开会议,广泛召集各行各业的代表与会,为NDIIPP 初期的工作开展发挥了不可替代的作用。2005年1月,国会图书馆第一次召开了所有合作者参加的工作会议,这样的会议将在NDIIPP 实施的前三年中每年召开二次。这些关系密切的合作者被分为四组,分别关注知识产权、数字信息的选择与收集、技术性的基础设施和支持数字信息长期保存的经济因素。每一组必须明确未来的首要工作,并与其他的合作者分享所取得的成果。国会图书馆所做的就是促进这四组的工作。在具体的实施中,目前成立了以加利福利大学数字图书馆、Emory 大学等为主导的8项研究项目,分别承担网络存档工具、分布式的数字保存网络等项目的研究。[4]
我国国家图书馆开始了即网络信息资源采集与保存试验项目(Web Information Collection and Preservation)和网络数据库导航项目(Online Database Navigation),对数字信息的保存正进行着积极的尝试。单就网络信息资源的信息量大、寿命短、更新快等特点看,这样一项保存工作也非常繁重。目前这两个项目还处于实验阶段,主要由国家图书馆负责。假如将来形成大规模实施的工程,那么,像保存的机构设置问题、法律问题、技术框架问题等都是需要认真解决的。我们期待着国家图书馆能在未来的保存活动中发挥类似美国国会图书馆的领导角色,积极有效地协调各方面的工作。
3.3 建立可信的信息保存环境
可信的信息保存环境意味着要把数字信息的保存纳入法制化、规范化的轨道。首先,数字信息的作者不会把自己的作品存入可能导致信息丢失或不可用的保存系统,这是保存系统本身所引发的信任问题。NDIIPP 提出,要以熟练地使用安全技术、完好的跟踪记录和始终如一的应用规则和协议来使之得到解决。这些不仅是参与保存的机构进行合作的基础,而且对维持数字信息的创作者对保存系统的信任也发挥着重要作用。其次,数字信息的创作者能从保存活动中得到某种形式的回报,这是数字信息保存的诱因问题,必须在数字信息保存的相关法律或制度中得到解决,形成规范。在市场经济条件下,数字信息保存的诱因可以是经济诱因,可建立类似于稿费性质的用于收集数字作品的基金,对数字信息的保存机构给予适当的经济补贴;另外,在不损害已有数字信息的前提下,不妨给予保存机构在法定许可的范围内使用这些数字信息的权利,使保存和利用得到兼顾,这是使用方面的诱因。第三,建立数字作品的呈缴制度,以国家法律形式规定数字作品的作者向指定机构提交数字资源。国外的实践表明,如果不制定相关的呈缴制度,数字作品就会有丢失的危险。一些国家对呈缴法法案进行了修改,增加了数字资源呈缴的内容,这些国家主要有英国、法国、新西兰等国。[5] 我国也应尽快在相关法律中明确数字作品的呈缴义务。
3.4 注意把技术与标准的更新纳入数字化保存结构的考虑范畴
NDIIPP 的保存结构使用模块化的构造原理,对系统的部分更新不会影响到整个系统。这就为某个局部的技术与标准的更新提供了解决方案。NDIIPP 所要实现的目标价值就有发展和革新,它的保存基础设施在设计时就要求从不停滞,能不断囊括与整合新的硬件和软件,很容易地加入新的合作者,能保存新的格式和类型的数字信息。可以看出,这样的保存系统不是封闭而是开放的,它的开放性不仅表现于对保存机构的容纳,而且表现在它对新的技术与标准(新的硬件与软件、新的格式和类型的数字信息)的包容性。
我国在保存数字信息的实践中,也遇到了技术过时所导致的困难。当新设备不能读出旧的存储媒体的信息时,数字信息就有可能丢失。因此,旧格式、旧标准与新格式、新标准的不配套必然加大数字信息保存的难度。尽管在保存时所采用的技术与标准是最新的,但这并不妨碍技术与标准的更新对数字信息保存所带来的不利影响,最直接影响的是破坏数字信息的可靠性和完整性。因此,由技术与标准的更新所导致的数字信息是否可用这一问题,也就成了数字信息长期保存的核心问题之一。NDIIPP 采用的四层保存结构为克服这个困难提供了一种新的思路,它怎样实现以及效果如何是我们将来对NDIIPP 进行追踪考察的一大看点。