都柏林核心:21世纪图书馆编目标准?_元数据论文

Dublin Core:21世纪图书馆编目标准?,本文主要内容关键词为:编目论文,图书馆论文,标准论文,世纪论文,Dublin论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G250.73[文献标识码]A

随着网络的飞速发展和普及,网络信息资源数量越来越大,而对它们的组织、整理和检索、利用则日益困难。以往,对网络信息资源的组织,整理主要存在着两种类型:一是众所周知的搜索引擎(SearchEngine),这些搜索引擎通过Web爬行者(Web Crawlers )、 蜘蛛(Spiders)或蚂蚁(Ants )等网络机器人自动搜索并生成相关信息资源的描述信息,然后存入数据中供检索使用;二是由图书馆员或其他专业人员通过诸如MARC等图书馆界使用的著录标准对信息资源进行著录。但是,面对日益庞大的网络信息资源,这两种方法的效果都并不理想。在这样的背景下元数据(Metadata)和元数据规范中的代表Dublin Core应运而生。

目前在我国图书馆界对Dublin Core 元数据也越来越重视, 只在2001年的上半年3月、5月、6月就分别在北京、上海、 广州召开了有关Dublin Core 元数据的研讨会。 笔得有幸参加过此类研讨会, 下面就Dublin Core元数据作一些介绍并与传统的MARC格式相比较。

1 元数据(Metadata)和Dublin Core

1.1 元数据(Metadata)简介

元数据通常被定义为“关于数据的数据”(data about data)。 通过Metadata,我们能够了解到某个网站的资源类型、Web页的标题、 作者、主题、关键词以及内容摘要等信息。

尽管Metadata是网络环境下产生的新名词,但是它的理念却不是新的,而且功用与图书情报界一直所做的书目(卡片或机读格式如MARC)的功用大体相似。 围绕着Metadata, 在HTML和XML 环境下产生了多种Metadata规范,如Dublin Core,PICS,Web Collections等等,而且各学科领域也有各自的Metadata规范,但是最受关注且应用最为广泛的是Dublin Core(都柏林核心)。

1.2 Dublin Core简介

Dublin Core元数据规范是一项描述信息资源的国际标准,1994 年由OCLC的一位科学家Stuart Weibel提出,至今已召开了6次研讨会,并以第一次专题研讨会(即“OCLC/NCSA Metadata Workshop”)的开会地点都柏林(Dublin)命名。Dublin Core 的目的是寻求一套简洁而有弹性,且非专业图书馆人员也可轻易掌握和使用的信息资源著录格式,以提高网络信息资源的开发利用率。Dublin Core 研讨会不仅有图书情报界的专家参加,而且还有出版界专家、SGML专家、图像专家、档案专家、网络标准制定者等多个学科领域专家参加。经过几次会议的讨论,总共产生了15个著录元素,包括有标题(TITLE)、作者(CREATOR)、主题词(SUBJECT)、描述项(DESCRIPTIONS)、出版者(PUBLISHER)、合作者(CONTRIBUTOR)、类型(TYPE)、格式(FORMAT)、 识别符(IDENTIFIER)、来源(SOURCE )、 语言(LANGUAGE )、 关联项(RELATION)、覆盖范围(COVERAGE)、权限(RIGHT)。 整个元素集都是可扩展的,每个元素具有可重复性和选择性。

1.3 Dublin Core的特点

Dublin Core的元素是结构化的,有层次的,支持字段检索, 提供对特定资源足够全面的描述信息,使用户不用真正链接到检索资源本身就能对资源有全面的了解。Dublin Core的主要特点有:

1.3.1

简单易用性:那些未经专门编目技术训练的作者或网站建立者等人员也可利用Dublin Core进行资源描述, 使得他们的资源更易检索。15个组成元素大多数有一般的语义学含义,用它进行资源描述可粗略等同于做目录卡片。但是Dublin Core 的出现并不是为了取代描述模式更加丰富的MARC/AACR2, 只是为了给编目人员和非编目人员提供一种更加简单的资源描述模式。

1.3.2 语义的互用性:在INTERNET网上, 不同的描述模式对信息的检索存在着学科领域的限制界线,如:图书馆、博物馆和地理信息系统机构就采用不同的标准进行资源描述,所以,推行一套可普遍采用的描述符来进行资源内容的统一描述可增加跨学科的语义上的互用性。例如:作者(author)与创建者(creator)可认为是同等含义。 Dublin Core就是目前在INTERNET资源发现方面最受关注的方案。

1.3.3 国际一致性:在Web网上的资源发现方面能够得到国际范围的一致认可是进行有效的资源发现工作的基础和关键。Dublin Core 在此方面得益于英国、美国、法国、德国、瑞典、丹麦、澳大利亚、日本等诸多国家的支持。

1.3.4 灵活性:Dublin Core最初是为了作者本人进行资源描述的需要,但它也吸引了正式的资源描述团体如图书馆、博物馆的注意,而且编目专家希望Dublin Core能给更详细的资源描述模式如MARC 格式提供一种更经济的选择。Dublin Core 在表现附加的结构和进行更详尽的语义学描述方面有足够的灵活性。

2 MARC之发展

几十年来,世界上大多数图书馆编目采用MARC格式都没有多大的改变,但是,随着数字图书馆和互联网的出现,越来越多的电子资源和网络资源需要加工整理,这种偏重于印刷型资料分编的MARC格式已很难适应数字图书馆和网络资源的分编要求。为了适应这种要求,近几年来美国国会图书馆和OCLC对USMARC进行了多次局部修改,主要有以下几方面的修改:

2.1 扩大网络信息资源的涵盖范围

原来USMARC对网络信息资源的涵盖范围较小,只包括电脑文件与软件等。现已将网络资源的涵盖范围扩大到不仅包括电子资料资源(如电脑文件、软件、数据库、书目数据库等),还包括联机系统与服务资源(如FTP文件传输地点、远程登录地点、电子布告栏、 校园信息系统等)。对网络信息资源涵盖范围的扩大,使USMARC几乎可以处理所有的网络信息资源。

2.2 采用5—字段记录资源格式的内容

与印刷型文献相比,网络信息资源的格式呈现多样化,如Web 页中,既有以HTML语言编制的ASCll文件,也有与其它Web页相连接的文本、图像、声音等信息内容,因此,USMARC采用5—字段记录资源格式的内容。

2.3 增设了856字段

为了实现从书目信息到文献本身全文信息的检索, USMARC 增设了856字段。该字段记载了被链接的电子资源的主机地址、 电子资源名等具有检索、获取意义的信息,建立了从书目记录向全文,多媒体电子资源的链接。856字段的设置,开创了编目的新时代, 它的超文本链接有助于用户获得和链接网上资源。随着INTERNET的发展,856 字段不断地被修改和完善。

3 Dublin Core与MARC之比较

如S.Gradman在64届IFLA大会的论文“书目数据与元数据的比较:是新瓶装旧酒吗?(Cataloging vs.Metadata:old wine in new bittles?)”中所述,“元数据既不是玩字谜游戏, 更不是‘新瓶装旧酒’。”元数据这一术语产生于不同于图书馆工作的信息环境。所以,与全球范围最成熟的传统机读编目格式MARC相比,它们具有以下区别:

4 Dublin Core元数据的实例分析

目前INTERNET网上的网页,大多数都带有符合Dublin Core 规范的元数据。下面是用Dublin Core 规范对“北京大学”网页加以描述的一个实例。

〈META NAME="DC.title" CONTENT=“广东外语外贸大学”〉

〈META NAME="DC.subject" CONTENT=“(SCHEME=keyword )大学,广东,高校,外语,外贸”〉

〈META NAME="DC.creator" CONTENT=“(TYPE=name)广东外语外贸大学”〉

〈Meta NAME="DC.author" CONTENT=“(TYPE=email )webmaster@gdufs.edu.cn”〉

〈META NAME="DC.date" CONTENT =“(TYPE =creation )1996—01—01”〉

〈META NAME="DC.format" CONTENT=“(SCHEME=imt)html”〉

〈META NAME="DC.identifier" CONTENT=“(TYPE =url )http://WWW.gdufs.edu.cn”〉

〈META NAME="DC.language" CONTENT=“(SCHEME=iso639 )chi”〉

〈META NAME="DC.right" CONTENT=“2000—2001广东外语外贸大学”〉

Dublin Core的著录元素大部分在MARC中都可找到相对应的项目, 即使是identifier项在修改后的MARC中也可用856字段来表示,right项在MARC中一般可在$210字段中反映。但是,由于Dublin Core格式简单,特别是网页制作者等非专业编目人员容易掌握,所以Dublin Core 很快得以广泛应用。

5 结束语

面对瞬息万变的网络信息资源,图书馆专业编目人员如果继续沿用现有过于繁琐的著录标准(如MARC)来组织和整理的话,整理速度会远远落后于网络信息增长的速度。所以图书馆应用Dublin Core 元数据规范来整理网络信息资源是大势所趋。那么,Dublin Core 元数据是否会取代MARC而成为唯一的编目标准呢?笔者认为答案是否定的,21世纪的图书馆编目标准将会是Dublin Core 与MARC 并存的局面。 因为DublinCore的出现并不是为了取代描述模式更加丰富的MARC,MARC格式在网络环境下也在不断的完善和修改,而且目前大部分图书馆都存有数以万计的MARC格式的书目数据,如何使Dublin Core元数据与MARC 格式书目数据相互转换呢? 美国国会图书馆和拥有全球最大的MARC 书目数据库的OCLC目前正积极致力于这个方面的研究。

标签:;  ;  ;  ;  

都柏林核心:21世纪图书馆编目标准?_元数据论文
下载Doc文档

猜你喜欢