数字环境下国际信息资源识别的新发展_元数据论文

数字环境下国际信息资源标识的新进展,本文主要内容关键词为:信息资源论文,新进展论文,标识论文,环境论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2011-02-21

中图分类号 G43 文献标识码 A 文章编号 1002-1965(2011)06-0098-05

0 引言

在网络时代和数字化时代信息的标识的作用日益突出。我国2002年启动的科技部“我国数字图书馆标准与规范建设”项目,对“数字资源唯一标识符应用规范”进行了系统、深入的研究,并提出了我国数字资源唯一标识符的发展战略和管理框架[1],但由于当时国际信息资源标识体系标准尚未完成,国内对唯一标识符的实践尚处于初级阶段,导致我国近年来对信息资源标识的相关研究和实践或停留在理论探索阶段,如走中国DOI发展之路[2],知识网络、知识链接和知识服务研究[3]等,或局限于在行业、部门或组织内部,如中国广播影视数字版权管理论坛制定的数字版权管理唯一标识符DCID[4],我国国家电子政务标准化总体组制定的政务信息资源标识符编码[5]等。2009年我国相继发布了关于信息资源标识的国家标准:GB/T23730.1-2009《信息和文献工作——中国标准视听资料号(ISAN)》、GB/T 23730.2-2009《信息和文献工作——中国标准视听资料号第2部分:版本标识符(V-ISAN)》、GB/T 23732-2009《信息和文献工作—中国标准文本号(ISTC)》、GB/T 23733-2009《信息和文献工作——中国标准音乐作品号(ISWC)》,对中国视听资料、文本资源、音乐作品等信息资源标识符的结构、分配、管理等进行了规定,为我国数字资源标识符体系建设提供了技术指南。本文意图通过对国际标准化组织数字资源标识新进展的总结性研究,为我国信息资源标识国家标准的实施和管理提供思考。

1 当前国际信息资源标识体系

当前,以字母字符串为代表的标识符在信息资源管理中具有重要的作用,他们通过分配给信息资源唯一的识别符号,并通过附带的元数据来描述信息资源,从而达到信息身份识别、信息管理、信息检索、信息交换等目的,为信息资源的利用、管理与存储提供了有效的技术手段[6]。在数字环境下,信息资源标识符作为数字信息资源的“条形码”,在电子出版物网络环境下的获取、网络信息资源组织、知识产权管理等方面正起到越来越重要的作用。

自20世纪70年代以来,为了实现信息资源识别的全球性和唯一性,国际标准化组织ISO/TC46/SC9“识别与描述”制定了一系列关于信息资源编码的国际标准,如ISBN、ISTC、ISSN等,他们从信息资源的不同粒度,对特定类型的信息资源进行标识,以达到不同的应用目的和需求,其基本情况见表1。

从表1中还可看出,ISBN、ISSN、ISMN等标识对象为信息资源的物理实体,不同出版形式、电子出版物格式等外部特征的改变均分配不同的号码。ISTC、ISWC、ISAN等标识对象为信息资源的抽象内容实体,只有内容发生实际改变才分配新的号码。

2 国际信息资源标识的趋势和新进展

数字技术的发展使信息资源标识体系处于一个全新的环境:出版物数字化已成为不可逆转的大趋势,信息资源标识体系面临与采用条形码、RFID技术的物品编码体系的兼容;知识链接、知识网络对信息标识体系的“可操作性”的要求,信息资源标识体系面临从“静态”向“可操作性”的功能转化;网络环境下个性化的服务需求使信息资源标识体系之间的互操作越来越迫切和必要。为应对这些趋势和挑战,国际信息资源标识组织采取了以下应对措施。

2.1 建立中心注册数据库 国际信息资源标识标准中均规定了成立维护机构来对注册数据进行管理和维护,一般采取国际、国家、区域分级管理模式。目前,除ISRC外所有的国际标准都要求提供标识符的注册元数据。为适应应用领域的扩展,ISO 2108:2005中增加了关于ISBN元数据的相关要求,标准实施后ISBN国际中心要求ISBN国家中心和个人中心上传ISBN号的全部元数据资料,以便建立统一的中央数据库。至2010年,国际ISBN机构已发展了170多个国家ISBN中心及160多个国家级或区域注册机构,2009年版国际标准书号目录(PIID)列有92万个出版商和国际ISBN中心分配给他们的ISBN前缀信息[7]。

截至2010年5月,ISAN中心数据库已有60万个ISAN注册记录,包括8.7万部电影,34.5万集连续剧,7.2万部纪录片,4.8万个电视节目[8];ISSN中心数据库已有150.4万条ISSN注册数据,其中标记为ISSN-L的数据有4.923万条[9];2008年,ISWC国际机构和CISAC(国际作者作曲者协会联合会)开始对ISWC中央数据库进行整合和清理,其清理包括以下3条原则:标识符必须是唯一的,标识符应能被其他机构所获取,标识符在商业活动中是强制性的,至2010年初,中央数据库CSI(Central Search Index)已包含了2 200万条ISWC注册数据[10];ISTC国际中心于2009年建立了标准文本登记系统STRS,至2010年5月已有5 000部英文文本作品注册了ISTC号[11]。

2.2 信息资源标识系统与应用信息系统的联动实践 信息资源标识符具有以下四种功能:定位功能,确定目标资源的位置;标识功能,是资源的唯一标识标签;聚集功能,将同一主题的资源聚集到一起;区分功能,可标识同一资源的不同版本。在纸本环境下,资源标识符表现为可读写的字符串,辅助实现对印本资源的管理;在电子环境下,很多资源标识符同时以条码的形式表示出来,如ISBN条码、ISSN条码,与物流信息化管理相兼容;而在网络环境下,标识符注册系统可实现与很多信息系统的链接,帮助实现了数字环境中资源标识、定位、链接和知识产权管理等多项功能。

国际信息资源标识组织很早就开始了标识符的应用研究,ISSN国际中心利用ISSN和URN的功能上的相似性已于2000年左右实现了ISSN的URN的功能,通过查找按URN语法标记的ISSN,可以返回符合条件的元数据及摘要信息,或连续性资源的数字版本。ISBN也于2001年实现了其URN功能。但这些努力在随后的网络资源中并未得到大规模的应用。近年来,随着DOI在网络文本资源的成功应用,ISBN、ISSN开始与其进行兼容尝试。为了在网络环境下更好地发挥ISBN的功能,如定位最佳的下载电子图书的地址,动态跟踪数字产品的销售情况等,DOI中心与ISBN国际中心于2009年达成采用ISBN-A来标识电子应用下的图书。ISBN-A由DOI维护机构分配,采用将ISBN号包含在DOI中的结构方式。见以下示例:

ISBNDOI

978-1-2345-9999-0——→10.978.12345/99990

为支持OpenURL服务及与DOI、URN等进行互通,ISO 3297:2007标准中规定了ISSN-L这一在不同介质的连续性资源之间建立联系的功能或机制,并在附录E描述了ISSN在DOI、OpenURL、URN、SICI、EAN bar codes等标识体系中的应用语法。ISSN-L同时使得ISSN成为ONIX for Serials的识别码成为可能,在电子刊物的销售中将更大程度发挥其功能。

2.3 国际信息资源标识符的互操作研究 为了更好地发挥信息资源标识符的功能,2006年ISO TC46SC9成立了标识符互操作特别工作组,探讨了ISOTC46 SC9家族标识符间的互操作的具体含义,提出解决信息资源标识符互操作的几种逻辑方式:元数据互操作,建立不同标识符间的逻辑关系,为不同标识符用户提供一体化综合服务,并提出应用ISO/IEC 21000-6的本体数据字典实现标识符互操作的机制[12]。2007年,标识符互操作工作组汇报了其工作进展,包括建立标识符核心元数据映射模型,对SC9标识体系中未制定的静止图像标识符标准的行业进展关注等[13]。2008年互操作工作组就标识符与产权信息管理问题与世界知识产权组织举行了研讨会,并继续致力于建立各种类型的TC46SC9标识符间关系模型[14]。2009年,标识符互操作工作组向SC9汇报了工作进展,工作组专家FX Nutall提出了一个现实的、简单的SC9标识符互操作框架:ISBN与ISSN间可用ISTC来进行关联,CISAC(国际作者和作曲者协会联合会)建立的中心数据库CSI来链接ISWC和ISRC,视听作品国际数据库IDA(the International Database on Audiovisual works)可链接ISAN和ISRC,国际权利人信息号IPI(Interested Party Identifiers)可链接ISNI及ISWC,进而实现所有SC9标识符的链接。SC9主席Sam Oh提议进行标识符的主题图研究。DOI国际基金会主席Norman Paskin建议将标识符互操作与RDA/ONIX框架融合[15]。2010年标识符互操作工作组报告正在建立不同标识符间的元数据结构的语义链接来实现标识符的互操作[16]。

3 几点启示

3.1 管理和服务模式将成为决定信息资源标识符是否被接受的关键因素 在信息资源标识体系中,特定信息资源标识符是为了解决特定需求而设立的,如ISBN主要为了出版物的发行需要,ISSN主要为了解决期刊等连续性资源的交流和管理,网络环境下标识符已从“标签”作用延伸到信息资源的描述、识别和获取等各个方面,涉及出版、图书馆、互联网等各个行业。在出版领域,由于ONIX等标准的广泛应用,传统信息资源标识符已从产品模式向服务模式的思想转变,如由学术出版商组成的CrossRef联盟提供的参考文献链接服务,使出版领域在内容服务方面渗入到传统图书馆服务领域。信息资源标识符维护机构已从专业代码机构垄断转变为专业代码机构(如ISBN国际中心、ISSN国际中心、ISRC国际中心)与技术实力机构(如DOI维护机构)并存的局面。以OpenURL为代表的信息内容提供者与链接服务提供者合作的链接服务模式,昭示着第三方的知识链接与图书馆、出版之间的合作已取得实质性进展。

因此,单纯从行政管理的角度来推行信息资源标识符(如我国的ISBN、ISSN、ISRC管理模式)已不能充分发挥标识符的巨大潜能,密集的web技术的整合应用、资源优势和技术优势、有效的服务、永久性、可操作性和互操作性将是影响信息资源标识符成功的关键因素[17]。针对标识符领域的发展给信息资源揭示和获取所带来的革命性变化,我国的出版界和图书馆界应高度重视,迎接挑战,制定合理的发展对策,实施有效的管理和服务模式。

3.2 信息资源标识符的互操作研究将成为知识组织领域的下一研究热点 信息资源标识符与元数据和对象数据相结合,已成为数字信息资源识别和发现的重要技术手段。当前的信息资源链接模式包括组织在其体系内创建的数据链接,如清华同方的“知网节”技术提供的个性化服务和知识服务,我国国家图书在数字图书馆工程建设中采用CDOI唯一标识符规范来实现国图的物理资源和数字资源的无缝链接和集成化服务[18]等。以及因商业需要在商业伙伴共享数据库间维系的数据链接,如国际作者作曲者协会联合会(CISAC)维护的音乐作品批准码(The Music Works License Identifier,MWLI)等。

鉴于信息资源标识符在电子商务、版权管理、政务公开、舆情监督、信息服务等领域的广泛应用,信息资源标识符的互操作已为知识组织领域所关注,如英国赫尔大学的RIDIR项目建议采用ontology建立高层互操作数据词典的方式来获取丢失信息和本地数据[19]。Norman Paskin为欧洲数字保存项目撰文[20]中指出:标识符互操作可分为句法互操作、语义互操作和团体间互操作三种类型,句法互操作可通过系统间遵循同一技术规范来保证,语义互操作可通过建立结构化元素集及结构化本体等保证,团体间互操作可通过标识符维护机构签订技术合作协议等实现。

由于数字信息资源标识的粒度不断细化及向灰色资源、政务资源、知识产权敏感资源的不断延伸,我国的信息资源标识符建设应从信息资源本身生命周期出发,跨越行业、部门管理的障碍,并首要解决以下问题:我国的所有信息资源标识体系是否全部纳入国际信息资源标识体系,所有信息资源都可进行标识并将其元数据与全世界进行交流和共享;是否建立国家层面的唯一标识符体系并进行本地解析和服务;如何实现各行业、各组织间的信息资源标识符互操作实践等。

标签:;  

数字环境下国际信息资源识别的新发展_元数据论文
下载Doc文档

猜你喜欢