RDA:从内容标准到元数据标准,本文主要内容关键词为:标准论文,内容论文,数据论文,RDA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
《资源描述与检索》(Resource Description and Access,简称RDA)在2004年开始编制时,是作为《英美编目条例》(AACR2)的替代品或升级版,也就是新版编目规则或称元数据的内容标准。自2007年起,与RDA编制同步进行的还有另一项工作,即RDA的元数据注册。此项工作的主要目的是让RDA同时也作为元数据的结构标准,即通常所称的元数据标准,承担“作为图书馆数据未来跨越现行基于MARC系统时的桥梁”[1]。2014年1月,RDA注册元素集得到RDA开发联合指导委员会(JSC)批准发布,标志着RDA正式成为一种元数据标准。在2014年6月JSC最新修订的政策声明中,明确RDA注册为RDA内容之一[2]。 1 背景 在RDA历时五六年的编制过程中,介乎于激进与保守之间的各种观点相互碰撞。导致RDA走向元数据标准的是对图书馆适应环境变化的考虑。当前图书馆编目及目录所处的环境,与编制AACR2的1970年代已经完全不同。随着越来越多不同来源的书目信息进入用户的使用环境,甚至进入图书馆的书目系统,对图书馆编目或目录的要求已然发生改变。就图书馆界内部而言,以前追求的是书目信息的标准化或质量控制,现在则更多考虑编目效率与成本控制;就外部而言,以前图书馆是书目信息的主要提供者,现在网络书店、搜索引擎等新兴书目信息提供者正在逐渐加入甚至取代图书馆的位置。进入21世纪后,《加州大学书目服务再思考》《印第安那大学书目未来白皮书》和《改变目录性质、与其他发现工具集成》等先后发布,美国图书馆界的这些报告正是对这一环境变化的思考。图书馆只有提供更多内容上独特、格式上能够互操作的数据,才能在互联网时代保持图书馆的存在。用“书目控制未来工作组”最终报告的说法,“单一环境如图书馆目录中描述的一致性,与各种环境间进行连接的能力相比,正变得不那么重要”[3]10。这就是RDA由内容标准走向元数据标准的大背景。 在微观层面,两件事和一个会议直接促成RDA的元数据注册。第一件事是美国国会图书馆(LC)于2006年12月成立“书目控制未来”工作组,成员来自LC以外的图书馆学界、专业协会、OCLC以及Google、微软等互联网公司,希望为未来书目信息工作指明方向。工作组在美国召开数次会议,了解包括用户在内的各方看法,最终报告于2008年1月正式发布。报告反映了LC管理方早先对RDA的不满,提出“暂停RDA工作……LC/JSC/DCMI联合探索建模和提出‘书目描述词表’”[3]29。当然,在工作组成立到报告发布的一年间,报告中建议的“书目描述词表”即RDA的注册工作已经启动。第二件事是D-LIb Magazine在2007年1/2月号发表《RDA:20世纪编目规则》,在历数各方对RDA编制的不满之声后,提出重要观点:“重新整理编目规则不是图书馆的正确起点”,“更好的……是设立一个新目标,实现顶层一致:模型、基本原则与一般规则,而将细节留给专业社区。”[4]换言之,现在需要的不是一个详尽的内容标准,而是一个元数据标准——也就是可以取代MARC格式的标准。 暂停已历数年的RDA编制,显然不是JSC所能接受的。作为元数据领域最新标准的制订者,面对危机,必须提出解决之道。JSC的应对之策是在完成RDA编制的同时,如后来书目控制未来工作组最终报告建议的那样,与DCMI联合探索建立模型、提出“书目描述词表”(元数据标准)。正是在此背景下,JSC与都柏林核心元数据行动(DCMI)于2007年4月底5月初在不列颠图书馆举行了数据模型会议(后称“伦敦会议”),会议建议:开发RDA元素词汇,基于FRBR和FRAD开发RDA DC应用纲要,采用RDF/RDFS/SKOS公开RDA取值词表[5]。会后JSC和DCMI联合成立工作组DCMI/RDA Task Group(以下简称“工作组”),由RDA方的Gordon Dunsire和DCMI方的Diane Hillmann担任共同主席,Karen Coyle和Jon Phipps为小组成员,开始RDA的元数据注册工作。 2 内容 根据伦敦会议的建议,RDA注册包括两类:一是元素集(element set),二是取值词表(vocabulary)。工作组在2008~2009年间与RDA编制同步,在开放元数据注册(Open Metadata Registry,简称OMR)网站完成了RDA注册,包括元素集8个、取值词表约70个。本文主要针对作为元数据标准的元素集。 作为意在取代MARC的元数据标准,RDA注册为语义网和关联数据应用而设计,RDA元素集采用资源描述框架《RDF)注册。注册项目包括标签、名称、URI、描述、评论、类型(类或属性)、父类型(上位类或上位属性)、领域(即应用范围)、范围(即取值范围)、状态(批准情况:新提出或发布)、语种和附注等。 2.1 类和属性 RDA本身的基础是《书目记录功能需求》(FRBR)及《规范数据功能需求》(FRAD),整个框架基于FRBR/FRAD的三组实体以及实体的特性(attributes)和关系(relationships)。由于FRBR的实体-关系模型为“契合语义网的关键部分”[1],这为RDA以RDF形式注册打下了很好的基础。 RDA注册元素集采用RDF类(class)和属性(property),8个元素集可归为4类,分别是[6]: (1)RDA用FRBR实体,沿用FRBR所有实体并有所扩充,增加FRAD的“家族”,以及《面向对象的FRBR》(FRBRoo)中的“代理”(agent)等。实体均定义为“类”或“子类”,如第2组的个人、家族、团体为“代理”的子类。类与子类可作为RDF三元组中的主词或宾词。 (2)RDA元素,针对FRBR的三组实体,即RDA第1组元素、RDA第2组元素和RDA第3组元素。元素来自RDA正文的实体“特性”,如正题名(Title proper)、责任说明(Statement of responsibility)等。元素被定义为RDF“属性”或“子属性”,可作为RDF三元组中的谓词。 (3)RDA关系,针对FRBR的三组实体,即RDA作品、内容表达、载体表现、单件关系(第1组实体关系),RDA个人、家族、团体关系(第2组实体关系),RDA概念、事件、实物、地点关系(第3组实体关系)。关系用语来自RDA的附录J、K、L关系指示词,通常是双向的。以“改编”关系为例,如作品A被改编为B,则作品B为A的改编本,在RDA注册中,分别用标签“Adapted as(Work)”和“Adaptation of(Work)”表示。关系被定义为RDF“属性”或“子属性”,可作为RDF三元组中的谓词。此时主词和宾词属同一组实体,如作品A——Adapted as(Work)——作品B。 (4)RDA职能,指附加给名称(代理)的特性,针对资源与代理关系,即第1组实体与第2组实体间关系。职能用语来自RDA附录I关系指示词,为资源到代理的单向关系,如创作者(Creator)。职能被定义为RDF“属性”或“子属性”,可作为RDF三元组中的谓词。此时主词为资源,宾词为代理或其子类,如作品A由个人B创作:作品A——creator——个人B。 2.2 类和子类 FRBR第2组实体“个人”“家族”与“团体”在编目中属于“名称规范”范畴,在职能方面具有共性,比如都可能是作品的创作者、内容表达的贡献者等。因此,工作组决定增加“代理”类,第2组的三个实体作为“代理”的子类,以便在“代理”层次建立关系,而不必对每个实体重复相同的关系,如不必分别建立“创作者(个人)”“创作者(家族)”和“创作者(团体)”等。同样,对若干出现在每个第2组实体关系中的属性,如“附注”“咨询源”和“识别状态”,基于效率的相似理由,也采用代理类[1]。 与第2组实体中的“代理”类似,工作组针对第3组增加了“主题”类,原来的4个实体“概念”“事件”“实物”“地点”作为其子类。 2.3 集合项 在RIDA中,FRBR第1组实体中的一些元素被设置为集合项,即作为一组一起使用,包括8个:出版项、发行项、制造项、生产项、抓取地点和时间、学位论文信息、版本项、丛编项。体现在RDA元素分析表中[7-8],非集合项元素的类别为“元素”(如责任项),如其下有元素,则类别为“元素子类型”(如与正题名有关的责任说明);集合项的类别也是“元素”(如版本项),其下元素的类别则为“子元素”(如版本标识)。这是卡片目录中先组思想的遗存。 RDA注册把集合项作为语法编码方案(RDA Syntax Encoding Scheme),定义为RDF数据类型的“子类”;集合项的下属元素定义为集合项的“子类”,而非如其他元素那样定义为“属性”。除前述8项外,还有一个类似的“地图图像表示”,单独定义为“类”[9]。 2.4 通用属性(general properties) RDA完全建立在FRBR基础上,因而其所有元素与关系(职能)均系于相应的FRBR实体,如“责任说明”元素为“载体表现”的特性,“创作者”指与“作品”的关系。在RDA注册中,部分属性/子属性在标签中标明对应的FRBR实体,如“改编为”既有“Adapted as(Work)”,也有“Adapted as(Expression)”;部分属性/子属性标签则没有标明所属的FRBR实体,如前述“Statement of responsibility”(责任说明)和“Creator”(创作者)。 为使RDA注册能有更广泛的应用前景,不限定在图书馆界使用,工作组设计了与语义网完全兼容的“通用属性”,即标签不带FRBR实体的属性。为此,针对标签中指定FRBR实体的属性,RDA注册另行创建了不指定FRBR实体的通用属性,与FRBR绑定的属性为其子属性。如“改编为”,除“Adapted as(Work)”和“Adapted as(Expression)”外,另创建不指定实体的“Adapted as”。 2.5 RDA注册的作用 以RDF注册的RDA元素集,可以“在图书馆界中使用,也可作为图书馆数据未来跨越现行基于MARC的系统时的桥梁”[1]。作为元数据标准,RDA元素集可作为各种书目应用的元数据方案,更适用于关联数据相关应用,使书目数据从以“记录”为单位,细化到以“三元组”为单位。 图1是采用RDA元素集、以三元组表达Gordon Dunsire作品《RDA与语义网》的RDF图(部分),其中每一条三元组都可以通过相同URI的主词或谓词,与本地系统或互联网上的其他三元组关联。RDA:从内容标准到元数据标准_元数据论文
RDA:从内容标准到元数据标准_元数据论文
下载Doc文档