可资借鉴的国外档案网站特色分析,本文主要内容关键词为:国外论文,特色论文,档案论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
国外档案网站的建设始于20世纪90年代。1990年,加拿大国家档案馆在因特网上建立了自己的网站,宣告世界上第一个档案网站诞生。随后,美国、英国、澳大利亚、欧盟各国和亚洲一些国家的档案馆纷纷建立自己的网站。因特网上的档案网站如雨后春笋相继破土而出,极大地丰富了网络档案信息资源。目前,这些档案网站正处于不断充实信息内容、不断进行丰富与发展的进程之中。
在这个建设过程中,许多档案网站具有与众不同的特色。本文就选取一些网站的特色内容、项目或功能加以分析,以期在我国档案网站的建设、发展和完善过程中得以借鉴。
1 整体建设水平高——美国国家档案与文件署网站
美国是世界信息高速公路的发源地,整个国家的社会机构网络化程度相对较高。在这种大环境下,美国档案机构也都积极地融入网络社会之中,发挥信息资源优势,发展社会服务功能。美国国家档案与文件署网站就是其中的典型代表,目前它是世界公认的、建设整体水平最高的档案网站。
美国国家档案与文件署(The National Archives and Records Administration,简称NARA)是美国联邦政府系统内档案和档案工作的最高管理机构。它由国家档案管理处、总统图书馆管理处、联邦文件中心管理处、联邦登录处、人事处及国家历史出版物与文件委员会组成。下辖国家档案馆和国家第二档案馆两个中央级档案馆、15个文件中心、13个地区档案馆、9个总统图书馆和两个总统资料部。NARA及其下属机构形成一个全国性的联邦政府档案管理网络。NARA对其下属机构进行严密的控制和管理,对联邦政府机关及其派出机构的档案文件管理进行有效的指导监督,并制定和组织实施国家档案文件管理的规定和有关标准,在联邦政府的档案管理工作中具有举足轻重的作用。
NARA的网站中包含本机构及其下属各个档案机构的档案信息,其机构性质决定了其网络档案信息资源种类齐全,内容极为丰富,NARA网站的主要特点可以归纳为以下几个方面:
1.1 布局合理
NARA网站采用了框架式结构,站内页面设计分为左、中、右三栏。页面左侧是导航栏,全面、系统地显示当前页面的主要内容目录。它使得访问者查找页面相当方便,避免页面过多时造成迷路的情况;页面中间是内容栏,用于显示主要内容;页面右侧是链接栏,用于链接和访问其他内容。
1.2 内容丰富
NARA网站包含本机构及其下属各个档案机构的馆藏档案信息,内容跨越美国三个世纪的历史,涵盖美国联邦政府工作的方方面面。此外,还包括大量档案工作信息,如介绍NARA的机构性质、信息品质、工作策略、工作计划等档案工作信息;为文件管理提供理论指导信息,指导各机构如何在从文件到档案的完整的文件生命周期中发挥本机构的职能,完成相应的管理过程;提供在线阅读各种政府文件、公众法律、总统文件;介绍NARA所管理的档案授权信息及电子文件和文献出版计划;发布美国参议院与众议院的历史文件信息;展示总统图书馆有关的档案、个人资料及物品等。
1.3 数据库资源丰富
在主页的右下角列出了NARA可在线访问的数据库资源。其中有在线档案研究目录ARC,有馆藏电子文件检索工具ADD,这两个数据库提供档案文件与历史资料信息。有专门为退伍军人提供服役资料的eVetRecs,退伍军人可以查询自己的服役档案和待遇标准等。
1.4 检索方便快捷
NARA提供“站内信息搜索(Search)”和“档案信息数据库检索”两种检索方式,不论是进行网页内容检索还是数据库内容检索,检索输入方便,响应速度快,检索结果相似度排序合理,使访问者可以方便地检索到所需信息。
1.5 在线服务水平高
可以通过Order Online服务在线订购各种档案产品、缩微胶片、档案复制品;通过FAQs服务(Frequently Asked Questions)解答利用者的常用问题;通过E-mail服务回答网络用户的专门问题。笔者曾就该网站一些内容使用E-mail与馆藏人员进行交流或请教问题,基本上都在三个工作日内得到了答复。
1.6 更新及时
网站日常维护做得很好,内容更新及时。在绝大部分页面上,都注明了最新更新日期。此外,网站上提供的各类系统也一直在不断地升级,使用新技术,增加新功能。
1.7 传输速度快
在NARA网站上点击超级链接,打开新页面的响应时间较短,能够满足利用者的检索期待。做到这一点一方面是由于带宽和服务器性能较好;另一方面,为提高速度,NARA的网页制作相当讲究,其网页大都以文字为主,较少使用图片,少量使用的图片也经过预先的技术处理,适合网络浏览的需要。
2 良好的网络馆藏档案信息检索系统——NARA网站上的ARC
一个档案网站要达到良好的档案服务效果,必须具备针对馆藏档案信息有效的网络档案信息检索系统,突破以往档案利用中较难逾越的时空障碍,使用户进行远距离检索,降低检索成本、提高检索效率。NARA网站上的ARC就是网络档案信息检索系统的典型代表,其特点是使用简单、成果高效。
NARA网站自建成后,其网络档案信息检索系统已经经历了二代。第一代名为NAIL(NARA Archival Information Locator,NARA档案信息定位器),是一个针对NARA精选馆藏数据库进行检索的网络在线系统。第二代名为ARC(Archival Research Catalog)即在线档案研究目录,用于对馆藏档案信息进行检索,检索对象是NARA馆藏档案信息、缩微出版物的目录信息及部分全文、照片、地图、录音、录像等的数字副本。ARC自使用以来,经历了数次升级。最新的一次升级意义重大,它使得ARC具有崭新的外观和改良的导航工具。
2.1 ARC的检索途径
ARC系统主界面让利用者感觉相当熟悉,因为它是仿效网络搜索引擎Google的界面设计的。升级后的ARC检索对象分为四个大类:一是针对馆藏档案著录信息进行检索;二是针对馆藏档案数字副本(Digital Copy)进行检索;三是针对人名进行检索;四是针对组织机构进行检索。其中前两类又都分为简单检索和高级检索两种检索方式。ARC最初只有一种统一的检索,随着其数字副本数量的不断增加,有许多利用者希望专门针对有数字副本的馆藏档案信息进行检索,所以,数字副本检索从统一检索中分离出来。另外,ARC又提供了专门针对档案中涉及的人名和组织机构名进行的检索。这两项检索在之前的NAIL系统中没有作为检索途径,可以看出,信息技术的应用可以使得对档案内容的揭示更加详细。
在ARC的主界面上,是针对这四个大类统一进行关键词检索。如果点击Search Options,则可进入次级检索界面,分别针对四大类中某一类别进行检索。
ARC的主要的检索途径包括:关键词、数字化形式(digitized images)、日期、人名、主题、物理典藏(即保存机构)等。不同的检索途径,从不同的角度揭示档案的内涵。其中关键词是ARC最主要的检索途径。关键词是直接表达档案内容的、最主要的特征信息。此外,ARC还提供了主题检索途径。关键词与主题词不同,主题词是针对主题标引的内容采用人工语言进行检索,而ARC的关键词采用自然语言检索。自然语言毕竟对检索效率有一定的影响,因此在ARC系统中关键词与主题检索并举,自然语言与人工语言并重,以满足不同层次利用者的要求。ARC系统升级后,其分类主题以列表的形式列举出来以方便用户选择检索。
2.2 ARC的数据质量
对于网络档案信息检索系统来说,高质量的数据是高质量的检索系统和高效率检索的基础和保证,数据必须完整、准确、规范、内容新颖才能提高检索系统的利用率。ARC系统可以说是全球档案网站中数据质量最高的一个检索系统了。原因包括以下几点:
2.2.1 数据收录范围大。目前数据收录范围已经达到馆藏档案的63%。
2.2.2 多级著录。其著录级别涉及文件组合(Record Group,类似于我国的全宗)、文件汇集(Collection,于文件组合外基于形成者、主题、语言、媒体、收集者等某种文件特征,人为地将文件汇集一起,而不论文件来源的分类形式)、文件系列(Series,类似于我国的分类)、案卷单元(File Unit)、文件,实现了多级著录。
2.2.3 著录项目完整。著录项目包含了档案内容信息和著录级别等各种背景信息及相关信息,有些文件的著录项多达70余项,提示档案内容相当完整;ARC升级后,还新增了一项功能,如图1所示,即在检索结果中,可以针对当前记录所属的上一级著录级别内某一项目内的文件进行检索。图1中得到的是关于某一文件汇集的著录项目,这个文件汇集下面包含3个系列,紫圈圈起的部分,表示可以在这个文件汇集内做二次检索。例如,你想找一条肯尼迪总统的档案记录,找到后通过链接访问到该份档案所属上一级案卷单元,你发现这个案卷单元还有许多关于肯尼迪总统的档案或许对你有用,这时你可以利用ARC提供的功能,只针对该案卷单元进行检索。
图1.在检索结果内针对所属上一级著录级别内的内容进行检索
2.2.4 数据更新快。ARC的数据每周更新一次,更新时间在每周周末。每年数据更新量在44万份档案左右。
2.2.5 检索结果部分提供全文。ARC包含大量档案的数字副本,即数字化的档案全文。NARA对一些利用率高或利用价值大的档案进行了数字化,利用者可通过ARC检索结果直接利用数字化档案。目前,ARC能提供的数字化档案副本达到142000份。
考察ARC的数据质量,有助于我们在档案网站建设中提高对数据的关注程度。档案信息要成为网络中有用的信息资源,必须有一定数量的积累,更应达到一定的质量要求。信息数量少、质量问题多,是构不成可资利用的信息资源的。
2.3 ARC的功能特色
ARC本身还具备一些功能特色。如:一个检索系统涵盖若干机构的档案信息;提供了不同层次的检索方式;一个检索途径涵盖若干著录项;提供了一些新型的检索途径;提供了一些新功能;在检全率与检准率的矛盾中侧重提高检全率;完善的系统帮助等。
与ARC相比较,当前我国的网络档案信息检索系统主要是建立在应用数据库基础之上,揭示文件题名、时间、形成者等的目录式检索系统。功能尚不完善,检索方式不丰富。较为重视对档案外部形式的整理,对内容的开发较少。仅以二次档案信息为处理与检索对象,只能检索文本档案的目录信息,条目信息量有限。不能检索特殊载体类型档案和全文信息。对ARC的分析与研究,有助于我们在档案网站建设过程中提高网络档案信息检索服务的质量。
3 丰富的在线档案展览——NARA网站上的Exhibit Hall
档案展览是档案信息资源开发利用的有效方式之一,它围绕特定的主题,将馆藏各种载体的档案向社会进行陈列和展示。档案展览在服务社会、进行档案宣传、普及档案知识、培养潜在利用者、增强社会档案意识、促进经济和社会发展等方面都具有重要作用。档案展览若能与网络结合,即在档案网站上进行档案展览,可以更好地发挥档案展览的作用一一其内容将更加丰富和生动,受众范围将大大扩展,影响程度会大幅度提高。
国外多数档案网站建设,都相当重视建设在线档案展览。每一个档案网站,几乎都将本档案机构的档案精品数字化,放在网络上进行展览。
NARA网站上的在线展厅Exhibit Hall就利用网络空间进行的档案展览。其间展示了NARA及所属机构主要是国家档案馆所拥有的各类珍贵档案的数字副本。
展览的一级主题,左边为图标,右边为文字说明。这样的一级主题目前共有32个。进入每一主题,有些下面有次一级主题,最后看到的是关于每一主题的展览内容。展览内容有文字说明,对展览主题进行深入介绍;有图片,图片是缩略图,点击后可以放大查看。这些图片都经过了精心的处理,效果清晰;有些展览中还可播放相关的声音和视频。
展览的主题内容如美国三大档案“独立宣言”、“美国宪法”、“人权法案”;林肯总统签署的《解放黑奴宣言》;托马斯·爱迪生关于白炽灯泡的专利申请;拿破仑亲笔签署的路易斯安娜地区购买协议;珍珠港事件相关档案;黑奴贩运清单;极地探险日志;南北战争时期的历史照片;第二次世界大战期间破译的日军密码电报、日本无条件投降书、从纳粹德国缴获的官方文件;肯尼迪总统被刺案调查文件、水门事件有关材料、空间探索与航天开发资料、尼克松总统访华照片,等等。内容丰富生动,充分体现了国家特色。
4 多类型机构共建网站(兼多语种网站)——加拿大国家图书馆与国家档案馆网站
加拿大国家图书馆与国家档案馆(Library and Archives Canada,简称LAC)网站的封面如图2所示。从这个封面可以看出该网站的特点是整合。其一,它是多语种并存的档案网站:其二,它是多类型机构整合的网站。
图2.加拿大国家图书馆与国家档案馆网站封面
4.1 多语种并存的档案网站
LAC网站是多语种并存的档案网站,它是英文与法文并存的档案网站。一个档案网站如果能以多种语言提供档案信息,则可扩大这些信息在世界范围内的影响和利用范围,有利于宣传档案工作,有利于充分发挥网络优势。有许多档案网站都能提供多语种版本,而LAC网站是其中的典型代表。加拿大的官方语言是英语和法语两种语言,所以其网站具有英文、法文两种语言文字版本。
4.2 多类型机构整合的网站
LAC网站是多类型机构整合的网站。其网站上整合了加拿大国家图书馆与国家档案馆的文献信息。
近几年,国际上图书馆界与档案界在多项领域均有合作,逐步强化了图、情、档一体化的发展趋势,随着信息技术和网络的发展,图、情、档三者又出现了融合的趋势,国外许多档案机构与图书机构进行了联合或是整合。如:美国总统图书馆就是典型的“三位一体”机构,馆中有图书、档案文件、文献材料,并有大量的声像档案和图书;再如:在澳大利亚,图书、情报、档案一体化的实体大量存在,该国的档案都保存于图书馆中,国家图书馆被赋予情报职能,成为全国的情报中心。
在这种发展趋势下,加拿大国家档案馆与加拿大国家图书馆于2004年5月正式合并,组建成立了加拿大国家图书馆与档案馆。它的职责是:保存国家文献遗产,向现在和未来的加拿大人提供持续的知识资源;向所有人开放,对社会、文化和经济进步作出贡献。由于机构的调整,加拿大国家档案馆网站也与国家图书馆网站整合,形成了新的加拿大国家图书馆与国家档案馆网站。该网站融合和整合了图书与档案信息,对于社会公众来说,国家图书与档案信息可以通过同一门户、以整合为一体的形式获得。
LAC网站的出现不是偶然的,事实上,国外许多档案机构网站上包含了大量图书信息;而许多图书馆网站(如“American Memory美国记忆”数字图书馆网站,http://memory.loc.gov/)同样包含大量档案信息。
在国外,档案工作与图书馆工作有合作的传统。以美国为例,“美国档案工作者在与图书馆工作者和信息科学专家的相互影响方面也更有广度和深度。例如,一部分美国档案工作者和图书馆工作者合作,有意识地影响诸如微软公司这样的电子巨人对软件的研究,以便为档案信息管理系统和图书信息管理系统提供软件服务,从而使得百万用户能从系统中应用到标准的可用软件”。[2]
5 积极关注和应用新技术——英国国家档案馆的RSS Feed
随着信息技术的发展,不断有许多新的技术应用到档案网站的建设中来。国外一些档案网站建设技术化水平高,能够及时应用一些新的技术来提高档案网站的服务水平。英国国家档案馆的RSS Feed就是其中一例。
RSS(Really Simple Syndication,真正简易聚合)是网站和其他站点之间共享内容的一种简易方式。它本质上是一种通用的内容发布标准,是基于XML标准的对Web内容进行包装和投递的技术规范。
RSS的作用一是对网页内容的一般属性(如标题、摘要、URL等)进行描述,这样更容易对网页内容进行分类;二是赋予网站用户一种与对特定主题感兴趣的任何用户交流信息的能力,使用户可以从一个或多个网站选择性地订阅自己喜爱的、汇总过的内容,将用户定制的内容定时传给用户并自动更新,实现对动态内容的有效传递和有目的的分发。用户借助支持RSS的内容聚合工具软件,在不打开网站页面的情况下阅读支持RSS输出的网站内容;三是让一个网站与其他网站之间更方便地交换信息、共享信息,促进信息资源整合。
RSS的能力主要表现在三个方面:一是实现网络信息的“推(Push)”服务,这是RSS有别于以往任何一项网络技术的最本质的特性;二是针对个体用户而言,它实现了高效的信息“聚合”功能;三是信息发布的低成本性。提供RSS Feed在技术实现上比较简单,对于内容的RSS包装又是一次性的工作,所以采用RSS技术进行信息发布成本很低,长期的边际成本可以忽略为零,这是其他信息发布方式所无法比拟的。
对于网络内容订阅者来说,可使用的RSS“聚合工具”即RSS阅读器来观看聚合后的信息。在英国国家档案馆提供的RSS Feed中,包括英国国家档案馆的新闻与事件,定期公布的新开放档案信息(What's New)等。对于网络档案信息利用者来说,假设所有的档案网站都可以提供这样的RSS Feed,那么利用者就可以根据自己的需要独立整合自己感兴趣的档案信息,聚焦自己关心的问题,将网络中各个档案网站上零散的显性知识加以分类并使之系统化,便于对所需档案信息的管理、搜索和分享。
6 人性化服务——NARA网站的用户分类
国外的许多档案网站很好地体现了国外档案工作的服务理念,即人性化服务和个性化服务。所能提供的档案服务较细致,比较到位。以NARA网站和澳大利亚国家档案馆网站为例,他们将档案网站上的用户或称档案信息的利用对象进行了详细的分类。
NARA网站的用户分类如图3所示,包括:普通公众;系谱学者和家谱档案利用者;退伍军人及其家庭利用者;教育者与学生;研究者;文件管理者;档案保管者与档案专家;信息安全专家;联邦政府职员;国会议员;出版业者和新闻记者。
点击这些分类的链接,可以进入为不同档案信息的利用者准备的页面,在这些页面中向不同类型的利用者介绍本网站能为他们提供什么样的信息,他们能用这些信息做什么,怎样得到相应的信息服务,并集合了针对该类档案信息利用者所能提供的信息和全部服务。
图3.NARA网站的用户分类
7 注重网站细节——澳大利亚国家档案馆的网站地图
国外档案网站在设计和实现中比较注重细节,在易用性和方便性方面都做得比较好。在此,仅以澳大利亚国家档案馆的网站地图为例来进行这方面的说明。
网站地图(Site maps)是对网站内的档案信息进行组织,建立索引,以方便网站用户了解整个网站的全貌和内容逻辑。它是针对网络信息提供的检索手段。网站是用超媒体技术组织的,当网站内容庞大时,利用者容易迷失其中。一般国外网站都为用户提供了网站地图及站内搜索引擎,这也是档案网站应该提供的功能之一。
档案网站提供网站地图,便于网站访问者明确本档案网站内的各类信息的位置。提供内容索引,便于以内容为线索访问网站。国外多数档案网站都提供了这项服务。澳大利亚国家档案馆的网站地图设计合理,较为详细和易于操作。
它以图书目录形式组织本网站内信息,其目录级次达到了六级。每条目录都是超媒体链接,可以直接链接入相关网页内容当中。这样,档案网站用户可以一目了然地获悉澳大利亚国家档案馆的网站的整体架构,轻松自如地点击地图节点链接到相关信息内容。我国目前提供这项服务的档案网站还比较少。北京市档案馆网站在改版后增加了这项服务。从网站地图中可以概览整个档案网站的信息组织情况。
来稿日期:2009-10-10