美国档案信息全文描述系统EAD的形成与发展_档案目录论文

美国档案信息全文描述系统EAD的形成与发展_档案目录论文

美国档案信息全文著录系统——EAD的形成与发展,本文主要内容关键词为:美国论文,档案论文,全文论文,系统论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

美国的图书档案部门采用计算机技术和网络通讯技术较早,在档案现代化管理方面已经取 得 了比较成功的经验。其中,能够远程利用的档案信息全文著录检索系统——EAD(Encoded Ar chives Description)研究成功与实际运用,正在对世界范围内的档案信息资源的开发与管 理产生着重大影响。

美国图书、档案部门为了克服档案文献利用的地域限制,一开始是通过印刷出版统一的检 索目录来实现的。这主要包括国会图书馆及美国国家历史出版物和文件委员会(NHPRC)的工 作实践。但由于图书馆、档案馆和文献资料数量的急剧增加、昂贵的费用等因素,该项工作 分别于1982年和1994年被取消了。此后,美国图书档案部门把工作重心转移到利用计算机网 络技术上来,他们认识到利用计算机技术,能更好地开发档案信息,提供远程利用服务。

随着计算机技术的发展,美国档案图书部门开发出了机读目录系统(MARC)和计算机网络数 据库。这为图书档案界建立现代化的检索途径提供了新方法,为EAD发展提供了可能性,也 可以说,MARC系统就是EAD的前身。然而,MARC系统一开始主要服务于图书资料的机读目录 ,没有规定档案文献机读目录的著录标准,到1983年止,该系统中几乎全是图书资料的机读 目录。但是,美国有些地方实行的档案图书一体化的管理体制,决定了该系统必须能适用于 档案资料。于是,美国档案工作者协会的国家信息系统工作组开展了一系列工作,开发出了 档案文献机读目录交换格式——USMARC AMC。AMC使得档案馆为MARC系统提供机读目录成为 可能。然而,AMC仅规定了机读目录的著录标准,没有规定文件本身内容的著录标准,而且 ,英美著录规则第二版又废除了档案部门长期坚持的著录原则。为此,国会图书馆的Steven L.Hensen制定了一个变通规则(APPM),以弥补AMC之不足。APPM和AMC使档案界为MARC系统 提供了475000条目录,现在学者们可以通过Internet查阅该系统中大量的图书资料目录和简 要的档案手稿案卷目录。

但是,通过MARC系统只能查阅相关的档案案卷,查阅具体的文献资料还必须借助其他检索 工具,因为,机读目录中的信息来源于案卷的检索工具,而机读目录中仅有很少部分的检索 工具中的信息。显然,MARC AMC系统并不完善,不能够全面反映档案文献检索工具有层次、 有结构的特点。因此,几乎是在AMC系统取得成功的同时,完善AMC的工作就开始了。

开发EAD的工作,就是对MARC AMC系统的完善。因此,EAD的开发者一开始就把MARC当作开 发原型,并力图将其许多成功的经验运用于EAD系统之中。MARC系统其本质是一种著录性质 的编码系统。鉴于目前档案目录信息的多种用途,开发EAD时就应考虑有足够的灵活性来支 持潜在的用途,最好的办法就是将其设计成著录性系统而非程序性系统。

MARC系统具有如下两个特点:一个是对记录信息进行著录性编码,通过编码从而使档案目 录数据库的构成具有清晰的结构,这样就能基于明确的编码特征来提供各种不同的处理方式 。另一个是MARC是一个基于国际标准(ISO-2709)的公开的公共标准,从而可以确保基于MAR C系统所形成的数据可在一个动态的计算机环境中持久使用,并且不依赖任何具体的硬件和 软件平台。MARC系统的这些设计特色,强烈影响着EAD的设计者,并且在很大程度上决定着E AD设计的本质。

在开发EAD之初,设计者就调查了对检索工具著录编码的各种选择,最终决定的选择标准主 要有两个:A.选择的系统必须是一个标准,即是一个公共领域中的一个正式规则,不依赖任 何硬件和软件,也不为任何人所拥有。B.能如实地以一种支持高级检索、查找定位和显示的 方式表达检索工具复杂的信息内容和结构。

虽然MARC系统具有很高的设计质量,而且EAD的设计者也曾考虑以其作为标准,但经过研究 ,他们发现了MARC的缺陷,MARC系统不能清楚表达档案检索工具复杂的信息内容和结构。因 为:A.MARC系统设计的最大记录长度为十万个字符,而很多检索工具的记录长度要远远超过 十万个字符,因此,记录长度不足成为其不可克服的障碍。B.MARC系统对档案检索工具复杂 的层级关系适应性非常差。C.MARC系统运用的市场狭小,这对于缺乏资金的档案馆来说,运 用该格式编制庞大的检索工具,其费用是巨大的。

由于MARC存在上述缺陷,EAD的设计者把他们的注意力转向了通用标记语言(SGML)。SGML为 设计档案检索著录系统提供了令人满意的框架和模式。因为:A.象MARC一样,SGML是一个国 际标准(ISO8879)它有一套正式的公共规则组成,不属于并独立于任何软、硬件生产商。B.S GML可在许多需要的层次上适应有层级的相关信息。C.在SGML文件中,没有固定的字节空间 限制。D.SGML的市场空间远远大于MARC的市场空间。

虽然SGML作为一个公共的公开标准具有上述诸多优点,但它不能为档案检索工具提供一套 现成的标记语言,它只是一种构建标记语言的标准。SGML提供了文献逻辑构件或元素的命名 规则、定义及表达文献逻辑结构及文献构件间相互关系的语法和标记语言。与MARC相似,SG ML支持的也是著录性标记而非程序性标记。同时,SGML还支持参考性标记,参考性标记在超 文本和超媒体中经常用到,用来提供其他文本及数字化文件或手稿、照片、所有三维对象、 视听资料、音乐、年表和其他任何可以用数字化方式捕获的数字化副本的超级注释和超级链 接。此外,SGML还可提供对档案原件的数字化副本的检索。

超文本标记语言(HTML)是一种根据SGML的标准构建的一种标记语言。由于HTML作为支持Int ernet的著录标准取得了很大的成功,许多人认为用它来作为档案检索工具的著录标准已足 够了。然而,EAD的设计者认为HTML是不足的。因为HTML只能用于在线显示和超级链接的程 序性著录,而程序性著录不能正确表达档案检索工具的内容、结构的复杂性。用过Web搜索 引擎的都知道,用Web搜索引擎查找已知或与某个主题有关的信息,其检索的误检率是相当 高的。

由于HTML的局限性和SGML对软件开发商和用户的复杂性,1996年国际因特网联盟成立了扩 展性标记语言(XML)工作组,该工作组建立了一套在网上更易运用的SGML的简本——XML。XM L去除了SGML中难以操作的部分,同时弥补了HTML的局限性。而且微软、网景公司的浏览器 都支持XML。XML标准的发展解决了运用SGML著录档案检索工具的最后障碍——因特网上能否 易于传输。和HTML一样,EAD也是一种根据SGML标准构件的一种标记语言,而且,EAD和XML 是兼容的。在XML中去除的SGML难以操作的部分,没有用在EAD中,而在EAD中存在的SGML难 以操作的部分也很容易以符合XML的方式被表示出来。因此,在将来利用微软、网景公司的 网络浏览器时,EAD就几乎不需要做什么修改。

MARC系统的成功设计和SGML、HTML、XML等标准的发展及计算机技术的发展,为EAD的成功 奠定了基础。EAD——依据SGML标准设计的标记语言,既吸收了MARC系统的成功经验和SGML 、HTML优点,又避免了其的缺陷和不足,从而为档案检索工具的网上传输和提供远程利用服 务,提供了一套成功的著录标准。

1993年,加利福尼亚大学Berkeley图书馆率先开发EAD,此时EAD被称FINDAID。1995年4月 ,美国保管和检索委员会和Berkeley图书馆共同主办了一次由档案、图书界和博物馆等单位 参 加的网上检索工具著录标准会议,会议肯定了Berkeley图书馆的工作成果——依据SGML构建 的检索工具标记语言(FINDAID DTD)。1995年7月的档案、图书和博物馆界的代表在美国密歇 根大学档案馆——本特利历史图书馆所在地Ann Arbor召开会议,正式审议了Berkeley图书 馆开发的DTD,并开发出了一个新的DTD。该会议在DTD的设计原则上达成共识,形成了Ann A rbor协议,此时FINDAIDDTD正式更名为EAD DTD。Ann Arbor会议后,又开展了一系列的工作 ,EAD的早期设计者写出了第一个EAD DTD草案。1995年9月,该项工作得到了美国档案工作 者协会(SAA)的支持,SAA成立了专门的机构负责EAD的开发、审查、完善和维护等工作。通 过档案界、图书界的共同努力,最终在1996年12月公布了EAD第二版。

在EAD的发展过程中,涌现了大量的实施EAD的研究和实验项目。在早期阶段,加利福尼亚 大学Berkeley图书馆、DUKE大学和国会图书馆开始用EAD著录检索工具,并测试EAD的理论和 技术基础。加利福尼亚大学和圣地亚哥大学成功地用EAD输出了数据库形成的EAD检索工具。 自EAD公布以来,英国伦敦公共档案馆、利物浦、牛津等大学也开始运用EAD。

为了促进EAD的发展,美国研究图书馆协会(RLG)还开展了EAD的培训工作。1996年夏季,RL G与加利福尼亚大学Berkeley图书馆合作开办SGML培训班。1997年,RLG在美国、英国、加拿 大成立了几个培训组,以加快EAD的推广和应用。1997年8月,RLG把这些培训组的工作移交 给SAA,现在SAA把这些培训课程合并到了它的教育课程中。

基于以上丰富的实践,并且吸取了国际档案界的建议,EAD工作小组又对EAD第二版进行了 修改,并于1998年公布了正式的EAD著录标准。

综上所述,EAD是一个基于国际标准SGML而构建的档案检索工具网上传输的著录标准。因此 ,EAD对信息时代各国的档案工作均有借鉴意义,为各国档案检索工具网上传输和打破信息 交流的时空限制,提供了一个有效的解决途径。通过实施EAD,可对档案文献进行从全宗到 类别、再由类别到案卷、再由案卷到文件的从总到分的多级的完整的著录,或者说是对一个 全宗内各个级别目录信息的全文著录。因此,对网上“远程用户”而言,就十分方便,因为 在不需要实际去档案馆的情况下,就可检索到一个全宗的完整信息,如果在档案原件已生成 数字化副本的情况下,通过EAD的标记链接,又可很方便地查到该副本的内容。

标签:;  

美国档案信息全文描述系统EAD的形成与发展_档案目录论文
下载Doc文档

猜你喜欢