档案元数据(EAD)的开发工具及应用评价_元数据标准论文

档案元数据(EAD)开发工具及其应用评价,本文主要内容关键词为:开发工具论文,及其应用论文,评价论文,档案论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔分类号〕G271

1 引言

EAD(Encoded Archival Description,编码档案著录)目前已成为全球档案界最有影响的档案著录标准之一,但是对于规模较小的机构而言,技术、专业知识和人力资源的匮乏成为阻碍其应用EAD的严重障碍。现阶段,技术困境和使用效果构成了EAD开发应用的两个重要维度。鉴于此,本文希望通过对这两个方面的探讨,为EAD在我国的开发应用提供借鉴和参考。

2 EAD开发工具

为使阐述能够严谨和深入,这里首先对“工具”一词进行界定,即由EAD开发者提出,EAD团体可以免费获取和使用,能够创建、发布或者检索EAD实例的各种技术解决方案,其范围既包括各种软件,也包括其他非软件形式的解决方案。

目前能够通过网络获得的EAD开发工具主要有制作工具、发布工具、检索工具和学习工具4种。下面笔者拟对这4种工具的特性和应用价值进行探讨。

2.1 基于XML的EAD制作工具

EAD制作工具是指那些辅助档案工作者产生编码文件,并以档案检索工具形式表现出来的软件包等。这些工具包括针对特定XML编辑器而设计的软件、网络表单以及制作EAD文件所必需的其他相关解决方案。

遍览当前EAD制作工具可以发现,绝大多数制作工具都依赖于公共机构和专业联盟的应用项目。其中只有一个例外——“EAD使用指南(2000年版)”,因为该工具的开发初衷就是为了实现普遍的适应性,使应用者能够根据自己的需要进行改写。在这些制作工具中,本文选择了其中3个分析介绍,其他的工具名称及网络链参见由EAD圆桌会议维护的“EAD站点评注”[1]。

2.1.1 国会图书馆EAD 1.0至EAD2002转换工具 该工具由美国国会图书馆技术人员Mike Ferrando开发,本质上是开放源码转换工具包,用于把数据格式从EAD1.0版本转换至EAD2002,仅适用于Windows2000及XP环境。它使用XSl(Extensible Stylesheet Language,可扩展样式表语言),具体包括转换工具包的安装说明书,James Clark的SP应用程序、Michael Kay的SAXON处理器、运行转换程序所必需的文件的详细清单、常见问题解答。此外,该工具还能够把SGML转换成XML以及把XML转换成HTML,而且它也考虑到了这些转换过程中所涉及的批处理问题。

2.1.2 明尼苏达大学EAD制作工具 明尼苏达大学的EAD工作主要是通过2004年至2005年的一个内部基金资助项目开展的,其开发的EAD制作工具是对“EAD使用指南(2002年版)”的补充。它包括辅助从Access数据库转换为EAD的工具和一个附随的模板数据库。模板数据库在Access向EAD转换时能够生成可供备份的报告,这些报告必须在包含EAD转换信息的现有数据库中备份,而且需要作一些相应的设定保证该过程的正常运行。还有一个最小需求模板,用来进行最基本的编码,该模板是XML文档,不需要单独的软件平台。此外,明尼苏达大学的EAD工具还为EAD模板、字体及颜色在XMetal中的定制提供了指导和说明。

2.1.3 维吉尼亚遗产项目工具集 维吉尼亚遗产项目始于2000年美国国家人文学科基金的资助,其最基本的目标就是创建一个基于EAD标引的共享数据库。该项目的EAD工具集包含一个可以应用于NoteTab软件的模块单元,该模块单元包括版本历史、处理编码元素、格式化元素的一组模块以及数字化的档案对象,并且提供下载。但是维吉尼亚遗产项目开发的其他工具对于非项目成员不能获得也无法改写。而且,由于工具模型是一个联合数据库,EAD记录输入系统后在系统中进行处理,所以该项目工具中不包括EAD的发布工具。

总体来说,当前的EAD制作工具都充分利用了现阶段的信息技术成果。这些工具的开发绝大多数都有基金会等机构资助,以项目方式开展,这就导致各研发机构都根据自身项目需求选择不同的软件平台和软件工具,要使用这些工具,就需要了解这些工具开发的背景以及相关技术知识等,这就增大了各EAD制作工具的使用壁垒。就笔者所了解的情况,只有“EAD使用指南(2002)”跳脱了这种项目和特定机构的局限,具有普遍的适用性。

2.2 EAD发布工具

发布工具是指为在网上传输EAD编码检索工具,使用可扩展样式表语言或者层叠式样式表(Cascading Stytle Sheets,CSS)创建的工具产品,其中EAD检索工具的格式可以是XML、HTML或者PDF形式的。本文所考察的样式表是指那些可以免费获得、下载和定制的,关于其功能和效果的信息附随或嵌入到样式表中,而且可获得支持级别的技术协助范围是对现有样式表的修正。表1列出了5种EAD发布工具的特点。

2.3 EAD检索工具

本文中的EAD检索工具是指由EAD开发人员研发或选定的开放源码或免费使用的检索工具。回顾EAD团体可资利用的检索工具,可以发现其中许多检索工具依赖的主要技术只有几种。下文论述的5个EAD检索工具就包括这些主要的技术,最重要的是,这些技术在检索工具中是彼此结合、综合运用的,而非各自独立。

2.3.1 Cheshire Ⅱ及Cheshire Ⅲ Cheshire是SourceForge.net支持的一个XML搜索引擎,它由加州大学伯克利分校和利物浦大学联合开发。Cheshire Ⅱ是“下一代联机目录和全文信息检索系统”[2],它的设计是为了克服联机目录主题检索中搜索失败和信息超载两大问题,该系统采用客户机/服务器结构以及包括Z39.50和SGML在内通行的信息检索标准。Cheshire 3目前仍在开发过程中,但可以从其网站http://cheshire3.sourceforge.net/上获取其完整的文档信息。

2.3.2 Cocoon Cocoon是一个网络开发框架,相当于一个可以和其他开放源码软件(例如Lucene[3]),同时使用的servlet程序。在当前进行的各EAD项目中,Five College Archives & Manuscript Collections项目[4-5]已经决定使用Cocoon和Lucene为其EAD检索工具提供技术支持。目前该项目网站共收录了1000多个检索工具,而且这个数目未来还会继续增加。虽然项目没有提供上述工具的下载,但就开发应用过程中相关的重要问题提供了指导方针。

2.3.3 DLXS搜索引擎 DLXS[6]为教育机构和非赢利机构提供了完整构建数字图书馆的框架和基础。它的特色在于搜索引擎以及一些基于类的中间件。其中的开放源码中间件全部是免费的。搜索引擎则有两个版本,其中一个免费,名为XPAT Lite;另一个需要注册付费,即XPAT。差别在于前者只能支持IOM容量、不支持Unicode编码,而且不直接支持DLXS。

2.3.4 可扩展文本框架XTF 该框架由加利福尼亚数字图书馆创建[7],是一种灵活性很强的索引编制和查询工具,由SourceForge.net网站提供下载。它是一种基于Servlet container的结构体系,包括广泛的文档资料,这些资料的范围涉及下载安装、为各种不同的开发需求编程和配置文件等。

2.3.5 PLEADE检索工具 PLEADE[8]是一款基于SDX平台的开源搜索引擎和浏览器,主要用于EAD编码的档案检索工具的查检和浏览。其可配置性极强,支持多语种EAD文件。它属于SDX顶部的一层,主要负责EAD文件的索引编制、组织及显示,同时也支持使用词表进行检索。检索包括基本的全文检索和高级检索,高级检索的选项在安装时定义,其中包括多个具有检索意义的字段。

2.4 EAD学习工具

EAD学习工具是指可以从网络上获得的“最佳实践指南”或编码辅助文档,本文将着重论述前者,因为对于EAD新用户而言,它是很有实用性的入门指南。最佳实践指南全面把握各馆藏机构和专业联盟对EAD标准的解释和评价,通过它还可以了解不同解释系统中都适用的EAD常规编码环境。当前,许多刚刚开始应用EAD的用户普遍认为EAD编码有一种“正确的”方法,然而,综观当前数量众多的最佳实践指南及其对EAD的解释,就可以知道这是一种错误的想法[9]。对于这些初入EAD领域的用户来说,充分理解EAD的灵活性和解释性需要一个过程,而最佳实践指南为可其提供了解的途径。

最佳实践指南作为EAD学习工具,提供了宽松的实践遵循原则与准则,以供各类组织机构应用,但是其不足也比较明显,即最佳实践指南通常只涉及各个元素的包含关系和元素自身的含义,对著录资料的内容和结构则很少重视。“研究图书馆协会EAD最佳实践指南[10]就是一例,其内容简要介绍了元素属性、元素值、日期标准格式、标点以及针对系统实体的XML专门指南等,对著录资料的相关方面几乎没有涉及。在这一意义上,最佳实践指南或者说EAD学习工具只是纯粹的编码指南。其他指南也意识到这个问题,并已经开始尝试改进。例如,2004年美国、加拿大两国合作制订的《档案著录内容标准》(Describing Archives:a Content Standard,DACS)发布后,北卡罗来纳EAD工具集的最佳实践指南就对“EAD使用指南(2002版)”进行修订,加入了参照系统使之与DACS兼容,并加入页码把著录的档案资料与编码联系起来[11]。不同的最佳实践指南反映了对EAD标准的不同解释体系,笔者通过网络检索,获得了来源于不同EAD项目的最佳实践指南共14个,这些指南在一定程度上反映了当前EAD学习工具的实际情况,有助于我们更全面深入地了解和学习。EAD标准在向前发展,更多的指南被发布,更多可以参照借鉴的档案著录规则在不断地制订,可以预见,档案学习工具也会随着实践的推进而不断完善深入,为EAD开发应用提供更有效的指引。

3 EAD开发工具应用评价

如前所述,EAD的深入开发和应用拓展需要解决好技术和使用效果两方面的问题。在了解4种主要EAD开发工具之后,还需要关注用户对这些工具的评价,以从中分析、洞察用户的未来需求。

2005年,美国档案工作者协会下属的EAD工作组针对EAD工具概况进行了一次网上调查,旨在鉴别可资利用的各种EAD开发工具,并把这些信息提供给更广泛领域的EAD团体。共有4个国家的70个团体参与了调查,而且这些团体绝大多数来自美国,其余分别来自英国、新西兰、澳大利亚和瑞典。调查中对EAD开发工具的评价主要集中在EAD使用指南和各种相关软件的使用效果两个方面。

3.1 EAD使用指南评价

调查结果显示,有近三分之二的团体都使用过EAD使用指南,并且大多对其持肯定态度,这在某种程度上验证了该工具集适用范围的广泛性。具体来说,对EAD使用指南的评价可以分为4类:

●大多数使用者对使用指南持完全肯定态度。这类使用者严格按照指南的内容进行EAD编码,并且效果十分显著。他们认为指南实用性很好,在编码中遇到的任何问题都能给予解答,而且其中的样式表为XML文档显示提供了多种可供选择的方案。

●部分使用者认为指南应当随需应变。这类使用者虽然也肯定指南的作用,但同时也指出指南应当根据现实需求的变化进行持续不断的修正和更新。

●还有一部分使用者肯定指南作为入门工具的作用,并表示指南对其而言不具备直接的可行性,但是可以帮助他们很快地了解和掌握EAD,这类使用者把指南作为EAD应用的起点,并以指南为参照选择自身适用的编码协议和工具。

●只有少数使用者对指南持批评态度。这些使用者认为指南使用起来比较麻烦,并且很难根据自身需求对其进行修改。

3.2 EAD应用软件评价

本文对EAD开发中使用的应用软件的评价主要是根据使用者在“EAD站点评注”上对各种主要应用软件的描述以及EAD工作组的网络调查。需要说明的是,评价并未涵盖当前EAD开发中使用的所有软件种类,而且由于无法对使用者的描述进行精确度量,所以仅是提供一种定性的经验证明,希望借此为EAD用户选择软件时提供参考。

在各种软件描述中,使用者对NoteTab和Oxygen给予了高度评价。对于NoteTab,使用者认为它与其他的编辑器相比更易习、更易用,而且成本非常低。同样,Oxygen也以其易用性而受到使用者的青睐,使用者认为Oxygen能使他们更容易地掌握标识语言。

相较于这两者,XMetal和XMLSpy的使用效果则令多数用户不满。使用者表示,XMetal的安装预览耗时且费力;Altova的XMLSpy虽然免费提供供家庭和非商业用户使用的家庭版,但是家庭版的程序缺陷太多,经常导致运行失败。还有一部分用户使用WordPerfect和Author/Editor,但没有对这两种软件做出评价。

4 结语

EAD团体应当以开放性和共享性为导向,为EAD知识和技术的交流提供平台,以推进EAD的研究和实践进程。国外的EAD开发应用显示信息成果的普及十分迅速,并且已经超越了地域的局限。但对我国而言,中文环境下的EAD开发应用起步较晚,进展相对缓慢。吉林大学主持的国家社科基金项目在深入研究EAD元素属性等内容的基础上,用实例验证了EAD在我国的实用性与可行性,试图为中文环境下开发应用EAD做出突破性贡献。

收稿日期:2008-07-10 修回日期:2008-09-24

标签:;  ;  ;  

档案元数据(EAD)的开发工具及应用评价_元数据标准论文
下载Doc文档

猜你喜欢