我国DOI系统的应用研究与发展:从战略规划到国内外合作_doi论文

中文DOI系统的应用研究与开发——从战略规划到国内外合作,本文主要内容关键词为:中文论文,战略规划论文,国内外论文,系统论文,DOI论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

DOI:10.3772/j.issn.1673—2286.2009.08.005

1 背景

国际DOI联盟IDF(International DOI Foundation)的代表、数字对象唯一标识符DOI(Digital Object Identifier)体系的创始人Norman Paskin博士指出:DOI系统是网络内容的永久标识体系,它可以标识物理的、数字的或抽象的实体。DOI系统具有永久性、唯一性、可解析和瓦操作性等特征。它提供了用于管理知识内容的框架,通过将用户和内容提供商结合的方式来促进电子商务,实现各种媒体权益的自动管理。采用DOIs,使网络环境下的知识产权管理变得容易和方便,可实现构建自动化服务和电子交易。DOIs适用于所有版权创作物,它的元数据概念体系可以描述知识产权[1]。

DOI系统自1997年出台以来,在知识内容管理方面得到了广泛应用。以CrossRef为例,通过基于DOI的引文链接系统可以提高期刊的利用率和显现度;通过DOI元数据中的权益(Rights)描述,可以实现知识内容的权益管理,它是网络环境下实现数字内容权益保护的最有力的技术手段。

尽管DOI体系得到了技术上的认可,但是DOI在中国的推广应用还面临着极大的问题。一是向国外DOI注册机构,比如CrossRef的付费高,二是目前的DOI解析机制,有潜在的信息安全问题。所以,国内的应用现状是:CALIS、CNKI等机构参照DOI技术,只构建自己内部的标识体系。这种内部体系,实现了本地内的链接功能,不能充分发挥DOI特征优势。为实现国内各内容管理机构之间的中文资源链接、实现中文与外文资源的链接以及基于DOI体系的权益保护等应用,需要从国家层面构建中文内容的永久性标识体系,从而提高中文内容的国际显示度、实现知识内容权益的有效管理。

在这一客观需求的前提下,2007年3月,中国科学技术信息研究所(Institute of Scientific and Technical Information of China,简称ISTIC)和万方数据(Wanfang Data)共同申请成为IDF的中文DOI注册管理机构(Chinese Registration Agency,略称DOI的中文RA),并开始了开发运营工作。ISTIC & Wanfang Data为了促进DOI存中国的普及,在科技部资金的支持和长期发展的战略规划下,利用中文DOI注册中心的平台(门户网站)[2],与国内外相关机构合作,启动了一系列的研发项目和标准研究。

本文围绕中文DOI系统的应用研究这一主题,介绍一些在国际合作前提下的研发成果,包括标准化研究活动。具体内容是:第2部分介绍中文DOI应用研究与开发的整体战略规划;第3部分具体介绍各个研究项目、国际合作及标准化活动。它们是中文DOI注册系统的研发、与美国CNRI国际合作以及科技部精品科技期刊、中国新闻出版总署的“数字对象标识符标准体系”的预研研究、中国版权保护中心的基于DOI版权保护研究;第4部分为目前面临的课题和今后的展望。

2 中文DOI应用研究与开发的整体战略规划

ISTIC & Wanfan Data将DOI作为改善中文期刊低影响力、有效促进中文数字内容权益管理的重要手段,在科技部研究经费的支持下,积极策划中文DOI的发展策略。图1是中文DOI有关项目和标准化研究的战略规划,ISTIC & Wanfang Data研究开发了中文DOI系统,并以此为基础与美国CNRI(3.2节)、瑞典隆德大学图书馆DOAJ(3.3节)和日本科学技术振兴机构(3.3节)进行国际合作。同时在国内推进精品科技期刊(3.3节)、“数字对象标识符”标准体系的预研研究(第3.4.1节)、基于DOI的版权保护研究(第3.4.2节)。第3节主要介绍中文DOI有关项目的研究开发、标准活动,及其与这些研发工作相伴的国内外合作。通过这一系列的战略性活动,加深了DOI的研究、推广及其应用。

图1 中文DOI有关项目和标准化研究的战略规划

*注:椭圆代表项目名称、虚线方框代表国际合作机构、实线方框代表国内合作机构

3 中文DOI相关研究项目及标准化活动

3.1 中文DOI系统

ISTIC & Wanfang Data开发运作的中文DOI系统是DOI的应用平台和门户网站,其开发理念是通过与国内外有关机构的合作,推广中文DOI的注册和管理,促进DOI在国内出版业界和内容服务业界的应用,实现中文文献之间的连接及其中文与英文文献之间的连接。

中文DOI系统的设计目标不仅是提供DOI的注册服务,还要在其上构建DOI的中文应用平台和门户,提供基于DOI的附加价值服务。为此,中文DOI系统开发分为二期。第一期:2007年4月-2008年3月,设计目标是构建基于DOI的中文期刊链接系统;第二期:2008年4月-2009年7月,设计目标是增加注册内容的类型,增强核心功能,提供增值服务。

在二期的开发中,与美国CNRI(Corporation for National Research Initiatives,美国国家研究推进机构)进行了国际合作,研究基于Handle System技术的DOI解析,及基于DOI的DRM实验系统的开发。与CNRI的合作细节参见第3.2节。

如图2中文DOI系统构成和功能概念图所示,中文DOI系统是中文DOI的门户,主要功能有DOI注册、DOI解析、DOI和元数据查询、用户管理、操作管理等。DOI注册、DOI解析、DOI和元数据查询说明如下。

如图3所示的DOI注册流程,①具有DOI前缀的内容所有者(例如,杂志出版商)依照中文RA的规定,将其内容(期刊论文,或科学数据)的DOI编码和元数据上传;②中文RA网站注册上传的DOI和元数据:③为提供增值服务和数据服务,在数据库中存储DOI元数据;④为基于Handle System进行DOI解析,将DOI的Handle数据(DOI和RUL)储存在DOI的目录中。

DOI解析是用户向Handle System发出DOI解析要求时,返回URL地址。DOI和元数据查询是利用部分DOI数据检索对应的DOI或者全部元数据。

截至2009年3月末,在中文DOI系统中注册的数量依内容种类分,统计如下:

●杂志论文:超过93万条。仅次于CorssRef,在IDF注册的DOI件数已经跃居世界第二位。预计每年至少以10万条以上的增量递增。目前,涵盖中文重要科技期刊约2000类。其中,中华医学会杂志119种,精品科技期刊323种(件数40万),23类为大陆发行的英文杂志。

图2 中文DOI系统构成与功能概念图

图3 DOI注册流程

●科学数据:1万5千条。国家自然科学e平台上的科学数据。

●图表:少量试验。

除此之外,中文DOI系统还完成了以下的规范:

●中文DOI的编码规定;

●中文DOI注册数据的有关规定。

3.2与美国CNRI Handle System的国际合作

ISTIC & Wanfang Data与美国CNRI Handle System合作的理由不仅仅为了DOI的解析,是在于CNRI所提供的网络基础技术:Digital Object Architecture(DOA,数字对象架构)和Identifier and Resolution Services(标识符及解析服务)。

3.2.1 DOA

数字对象架构DOA提供网络环境中数字信息的管理手段。数字对象具有独立于机器和平台的构造。具有准确标识、访问、保护的功能。数字对象不仅含有信息要素,还涵盖数字化论文、视频或音频等数字对象有关的唯一标识符和元数据。元数据包含对数字对象的访问限制、所有者、许可契约等描述。

3.2.2 标识符和解析服务

Handle System是提供了因特网上有效、可扩展、安全标识符和解析服务的分布式信息系统,是含有开放协议、名称空间和协议参照实现的系统。协议可实现利用分散计算机系统保存任意资源的标识符(称为Handle),在资源发现、访问、认证或利用时,将这些Handle解析为必要的信息。需要时,这一信息可以更新以反映被标识资源的当前状态,而不需要改变标识符本身。也就是说,即使资源场所和其他有关状态信息发生变化,标识符名称不变。Handle System技术的原版系统由美国国防部高级研究计划局(DARPA)支持开发[3]。

图4简洁地显示了Handle System在网络信息管理中解析系统的作用。

图4 网络信息管理中解析系统的作用

Handle System的特征可以归纳如下:

●提供基础性网络标识符解析功能;

●理论上为集中式、物理上为分散式处理,弹性高;

●对应数据类型多;

●解析速度和信用性高;

●安全性保障机制;

●开放、定义良好的协议、良好的数据模型。

以上特征使得Handle System成为网络应用的基础。例如,出版和数字图书馆等。其中,IDF是Handle System中最有影响力的应用。

ISTIC & Wanfang Data于2007年3月开始运营DOI的中文RA,同年10月,在中文DOI研究应用领域开始与美国CNRI合作。目标是基于CNRI的Handle System在中国建立先进的、与国际标准一致的数字对象标识符系统。并以此来促进中国数资源的共享和利用、促进新闻出版业的版权保护。对CNRI而言,通过Handle System的中文DOI应用,可以拓宽其在中国的应用。中美双方都表示了在数字版权保护方面的更密切的合作。为此,基于DOI的DRM(数字权益管理)实验研究在2008年12月前,完成了在中文DOI系统上的开发。

在介绍基于中文DOI(或HR,Handle System)的DRM试验系统的之前,简单地说明一下基于DOI的DRM系统。如图5显示,通过DOI的导入,实现了DRM系统中DRM链条上各个部分的集成和互操作。从出版商对内容分配DOI、DRM内容打包和安全封装/加密、内容运营商、DOI元数据存储、内容传播/交易/集成、权益交易、电子商务、最后,终端用户基于验证和权益许可利用内容,在这一链条上,通过DOI,实现了DRM系统的统合,达到权益保护。

图5 基于DOI的DRM(Case Study)[4]

DOI在DRM系统中发挥着重要作用。ISTIC &Wanfang Data利用CNRI的DOI的解析技术,在中文DOI系统上构建了DRM试验系统。该实验系统如图6所示,在Handle System中注册权益元数据,利用Handle解析,显示这些元数据。实现了基于DOI的DRM试验系统,在一定程度上实现了权益保护。具体过程如下:

图6 基于中文DOI系统的DRM试验系统

① 客户端向Handle发出请求;

② Handle系统将URL返回客户端;

③ 向资源的重新定向;

④ 向Handle系统发出权益元数据的查询要求;

⑤ 返回权益元数据;

⑥ 资源系统依据权益元数据生成不同的Web页面。本试验资源对象为科技部精品科技期刊(预计Open Access,OA)。本试验设计了3类的访问权限。分别如图7虚线椭圆中所示,它们是:可全文访问、可访问书目数据、无访问许可。

⑦ 基于权益许可,生成不同的Web页,返回到客户端。

在权益元数据设计之际,研究了2种典型的资源提供的方式:知识共享型(CC,Creative Commons,创作共用)和电子商务型。由于精品科技期刊的构建理念是在版权签约之上实现OA。所以,本试验原则上采用知识共享型资源提供的设计理念。基于OA的开放程度,分成3种访问的许可,设计了权益元数据试验用的Schema(如图7)。

图7 中文DOI元数据中的权益元数据Schema[5]

●全文(full text)OA

●书目(bibliography)OA

●无许可(no license)

今后将依据精品科技期刊OA、各种内容资源系统的实际权益需求,设计较为复杂的权益元数据Schema,用以支持应用DRM系统的开发。

3.3 精品科技期刊项目

——Chinese Key STM(Science,Technical and Medicinal)Jonrnal

精品科技期刊项目的立项背景:

目前我国有6000种以上的重要科技期刊,其中,45%的论文由政府资金资助完成。因此,出现了构建OA平台公开这些由政府资金支持论文的要求,通过共享政府资金成果,可以提高科技期刊传播的效率。ISTIC作为科技部所属的唯一国家研究所,在将优秀科研成果迅速发布于精品期刊的方针下,积极推动国家资金援助成果的OA化。这可以促进中文论文向全球的传播,提高中国科技的世界影响力。对于不具开发运行电子出版系统能力的杂志社,可提供统一的期刊流通平台,这也是精品科技期刊项目的目标。

目前,ISTIC在构建精品科技期刊之际,导入了DOI,实现了期刊间的链接。同时,如上节所述,作为试验性DRM系统,构建了以精品期刊为访问对象、具有权限管理功能的系统。

精品科技期刊平台的需求设计如图8所示[6-7]。

图8 精品期刊平台的概念图

精品科技期刊项目中,为参考日本科学技术振兴机构JST的J- stage[8](日本科技信息发布、流通综合系统)累积10年的运作经验,ISTIC & Wanfang Data与JST建立了合作关系,参考了其学术杂志遴选基准等方案。同时,在OA、链接系统以及基于DOI的DRM系统等广泛领域,也保持着与JST广泛的交流与合作。

此外,国际上科技期刊OA的提供,首数瑞典隆德大学图书馆DOAJ[9](开放存取期刊目录,OA的期刊收集平台)项目,在DOAJ中,OAJ(开放存取期刊)被认为是Web上可以自由利用的高品质期刊。DOAJ的理念是,通过OA提高科技期刊的认知度和利用的方便性。DOAJ的最终目标是覆盖所有语言地区和领域的科技期刊,它采用品质控制系统来保证期刊内容,是用户OA期刊的一站式服务体系。截止到2009年底,DOAJ收藏的科技杂志为3960种。目前可以检索到1415种期刊的文章,为265,290篇文章。

在科技部资金的支持下,自2008年起,ISTIC和DOAJ的开发机构隆德大学图书馆,以非营利性合作方式启动了精品科技期刊OA平台的国际合作,实施信息和数据的互交换。

综上所述,通过国内外需求的广泛调研和国际合作,在科技精品期刊OA平台上,引入了DOI链接和基于DOI访问权限控制的技术,中国科技精品期刊正迈向中文科技信息广泛传播和合理利用的轨道。

3.4 标准研究与数字内容版权保护

3.4.1 中国新闻出版总署“数字对象标识符”标准体系的预研研究

新闻出版总署在管理网络出版内容之际,非常重视互联网上内容的知识产权保护和防止侵权的问题。为实现现行法律对版权的保护,要依赖各种技术。其中,对数字对象的标识符体系寄予了极大的期待。2008年4月起,将DOI作为典型的内容标识符体系之一,启动了“数字对象标识符”标准体系的预研研究。作为DOI的中文RA,万方数据积极参加了这项研究工作。

该研究对内容标识符体系的种类、技术特点及应用进行了全面研讨,特别是对被国际出版业广泛利用的DOI体系进行了重点研究。同时,还分析了中国出版业界的技术情况、数字内容标识符应用性和必要性。作为制定中国新闻出版业界的数字资源标识符标准体系的参考,提出了可能的技术路线,以期为正式的标准研究奠定基础。

3.4.2 中国版权中心基于DOI的版权保护研究

由于网络出版的自由性和虚拟性,版权管理正面临着严峻的挑战。我国“著作权法”规定了作品的权利人享有作品网络传播的权利,从2006年7月1日开始实施的“网络传播权利保护条件”吸收了国内外经验,是专门针对网络传播的法律。然而,这些法律在运行中都遇到了不能回避问题,例如,权利所有证明的困难、权利侵犯事实证明的困难、取证成本高等等。这些对网上数字资源的出版、交易和流通,都有着负面影响,不仅是有许多侵权的行为,对国家创新也有严重影响,不利于网络出版的健康发展。

中国版权保护中心设想通过数字作品权益所属的明确描述来解决这一问题,开始了结合DOI/Handles版权保护的研究。以下是主要的研究课题:

①基于DOI的知识产权保护原理;

②基于DOI的DRM系统的版权保护;

③DOI/Handles与DRM结合的解决方案,包括:标识符体系的标准、加密、数字水印、数字签名等技术;

④Case Study,日本cIDf(多媒体内容保护框架)。

通过上述研究,得到了如下基于DOI数字内容版权保护的主要结论:

①可以明确描述数字内容消费者的权益;

②传播数字内容、重复使用内容之际,权利者可以得到经济的报酬;

③数字内容交易之际,可建立一个利用记录的保存系统,以便跟踪;

④可用于监视数字内容的非法利用;

⑤可建立一个共同的标识体系,查询权益元数据的状态。

同时认为,直接引进国外DOI技术,存在潜在的信息安全问题。建议吸收国际先进和通用的技术,创建中国自主的唯一标识符体系,来具体实施中国的版权保护。

4 课题与展望

4.1 课题

中文RA运营2年以来,遵循战略规划,在系统开发、标准活动、国内外合作方面取得了一定的成果。但是,目前还有很多有待解决的课题。

(1)各中文DOI系统之间,如何超越行业的壁垒,实现横向合作?

(2)非赢利中文DOI系统在国家资助结束之后,如何维持?即向IDF付出的高额费用如何通过DOI的附加价值服务来吸收?

(3)中国新闻出版总署如何推进数字对象唯一标识符体系正式的标准化研究?

(4)如何基于国家法律,开发实用的DRM应用系统,保护各种权益?

4.2 展望

即使面对以上课题,中文DOI系统的方针是:不断摸索,不断推进。今后的主要研发计划是:

(1)中文DOI系统功能的扩展和优化:

●科学数据的注册及服务;

●学位论文,E- book,会议论文等科技数字资源的注册和服务;

●DOI多重解析;

●……

(2)中文DOI的继续推广:

●面向更多出版社、编辑部;

●面向数字图书馆;

(3)扩大合作:

大学CALLS、国家图书馆、信息服务商、开发商等。

收稿日期:2009-05-15

标签:;  ;  ;  

我国DOI系统的应用研究与发展:从战略规划到国内外合作_doi论文
下载Doc文档

猜你喜欢