关于建立中文内容唯一标识符规范的研究_doi论文

建立中文内容唯一标识符规范研究,本文主要内容关键词为:标识符论文,中文论文,内容论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2011-03-02

[分类号]G255.75

1 国内外数字对象唯一标志符现状

1.1 美欧DOI系统应用现状

The Digital Object Identifier System(简称DOIs)是美国全国研究创新联合会根据美国出版协会的要求定制开发的系统,是Handle System在信息和出版行业的应用[1-4],其建立的初衷是提出因特网环境下知识产权管理和保护的解决方案[2,5]。

1.2 日本的内容标识符

cIDf[6](Content ID Forum,内容标识符论坛)于1999年成立,通过嵌入式内容标识符(Content ID)与数字水印技术来保护知识产权和数字内容权益。目前已有180多家机构加入其中。cIDF以Handle System解析系统为底层支撑技术。日本cIDf起始应用于视频和图像,在规范中对DRM(Digital Rights Management,数字版权管理)技术考虑得较为全面,实现了真正的数字权益保护。

1.3 中国台湾地区的LIPS-DOI

台湾资讯处理系统实验室的准DOI系统,(Language and Information Processing Lab,简称LIPS-DOI)是由陈光华教授于2003年建立的[7]。此系统讨论“数位物件辨识系统于中文资讯之应用”,使之与美欧DOIs接轨,成为在台湾地区使用的低成本的准DOI系统。LIPS-DOI系统也是采用Handle System解析系统作为底层框架。

1.4 我国对数字对象唯一标识符的应用及研究现状

2007年3月,北京万方数据股份有限公司联合中国科学技术信息研究所向IDF(国际DOI基金会)申请成立了唯一的中文DOI注册中心,开展中文正式出版期刊及少量科学数据的DOI注册登记工作。中国内地截至2009年12月,系统中共注册125万余条DOI,依内容种类统计如下:中华医学会杂志119种,精品科技期刊323种(件数40万),23种是中国大陆发行的英文杂志[2]。

2 国内外数字对象唯一标志符系统评述

2.1 美欧的DOIs应用与研究评述

2.1.1 DOIs单一解析功能已成功广泛使用,DOIs多重解析功能仍在试验阶段 美欧等国的DOIs是给数字对象分配显性的标识码,在单一解析中,通过解析系统将显性标识码转换为数字对象实体的URL链接,以获取原文。单一解析已经广泛应用在引文与原文链接中[3-5]。DOIs多重解析提供了更多的服务内容与诱人的前景,但目前多重解析功能仍处在试验阶段,主要面临两大问题:①DOIs多重解析功能的技术实现草案和规模化应用方案的不成熟;②在DOIs解析过程中涉及多种机构和团体,如何给不同利益体分配适当的权利与义务,使整个DOIs链条在最小的成本下发挥最大的效益是必须面对的问题[2]。

2.1.2 对知识产权的保护不能单独依靠DOIs,对信息监管比较薄弱 DOIs现在实行的仅仅是唯一标识符分配方案,即将唯一码授权给出版机构的每一个数字对象实体,并通过中间的解析系统进行跳转。这可以提供从出版源头进行知识产权保护的方案,但并没有将DOI与DRM方案相结合[1],完成真正意义的版权保护还需其他的技术。目前DOIs不能达到真正意义的版权保护,不能限定非法用户使用,也不能有效地防止信息内容被恶意篡改或偶然修改造成的信息内容缺失或改变等信息失真的情况。因此对信息的监管比较薄弱。

2.1.3 DOIs的单一解析在中国特定国情下实施困难 DOIs忽略了美欧与国内(指中国大陆)出版格局的差异,并且为此我国还需付出高昂的费用。因为美欧一些大型学术文献数据库商同时兼有传统出版商与网络出版商的双重身份,知识产权归属清晰,利用DOIs的单一解析功能就能方便地进行版权管理。国内的传统出版商和网络出版商是分属于不同的利益团体,DOI的注册与缴费是面向传统出版商,而使用DOI的最终受益者是网络出版商和数字资源的使用者,整个利益链条上的付出与回报不均衡,势必造成DOIs在国内推广的困难。此外,国内大部分期刊同一内容出现在不同数据库中的几率很大,DOIs单一解析指向哪一家数据库的页面必然存在不小的争议[2]。

2.2 日本cIDF规范评述

日本cIDf规范中通过DCD实现保护,如果数据是在DCD(Distributed Content Descriptor,分布式内容描述符,是知识产权一个子集,与数字内容一起发布)插入后被人篡改过,就可以进行用户合法性的判断,从而达到版权保护的目的。此外,日本cIDf规范附录中还有对数字内容交易处理的流程,包括B2B、B2C、B2B2C等多种方式,可对现有的网络交易流程的各种形式进行信息传播、信息交易的监管,是一个值得研究和参考的标识符规范系统。

2.3 中国台湾地区的LIPS-DOI评述

LIPS-DOI系统最大特点是低成本的建设和维护费用[7];采用Handle System解析系统,利于与美欧资源的整合;与DOI具有相同的功能,可以看成是DOI的兄弟,是个准DOI系统,从长远来讲有可能成为DOI在台湾地区的中文代理。

2.4 中国国内万方DOIs应用评述

中国内地的万方中文DOI系统,属于IDF的下属注册代理机构,永远要给IDF交费,在目前的形态下不可能与DOI处于平等的地位[9,14-15]。这种模式下,费用不但高昂且每年IDF有权利向上调整价格,同时考虑到国家信息安全等因素,更多的研究者及版权管理机构倾向建立中国自己的数字对象唯一标识符系统。

3 国内建立基于内容的中文数字对象唯一标识符规范必要性

3.1 国内网络信息现状对数字对象唯一标识符系统的需求

目前我国的期刊网络出版还不是真正意义的网络出版,上网全文必须等纸质印刷出版以后才能发行。而真正意义的网络发表科技论文却因没有获得类似ISSN、ISBN等唯一、公开、标准、公认的“标识身份”而得不到广泛一致的认可[15];网络信息资源管理标准不统一给信息利用造成不便;信息监管问题亟待解决;网络支付成为知识产权保护中的重要环节。这些均需要唯一标识符的配合,不难看出在中国建立数字对象唯一标识符(Chinese Content Identifier,CCId)系统的需求已经毋庸置疑。

3.2 DOI可能引发出版格局的调整,是否跟从美欧模式需时间检验

出版界人士认为DOI可能是引发国内外出版格局调整的因素,因此国内面对行业调整应全面客观地考察国内外情形,特别是非英语国家。德国的乌苏拉·劳腾伯格对德国及欧洲网络出版现状的分析[10],国内出版界陈少华对中国、北美、欧洲以及亚洲其他国家等出版业现状的分析[11-13],不约而同地认为全球出版业的产业链调整势在必行[9-10]。DOI将对世界出版业格局改变产生重要影响,国内DOI走哪条道路的问题,不仅涉及图书馆的管理与整合,更关系到国内出版界在世界出版业的席位问题。

综上分析,虽然万方的中文DOI已经成为全球仅次于CrossRef的第二大DOI注册中心,其前景似乎也很美好,但缺点是我国必须为此长期付出大量的注册费和使用费,并且关键技术掌握在别人手中,不利于国家信息安全。况且美欧的DOIs商业模式能否在我国很好地发展,尚需时间检验[2,8]。

3.3 中国内地网络信息资源管理对基于内容的唯一标识符需求强烈

国内相关部门信息管理与版权保护实施中对唯一标识符的呼唤。同时Web2.0的环境下,网络信息发布的来源和主题越来越自由和多元化,网络舆情监控与信息失真的问题日益凸显,利用数字对象唯一标识符跟踪监控数字内容、判断信息真伪的实际网络需求则更为强烈[14]。加强网络信息监管,净化网络信息环境,不仅是信息管理部门的需求,也是社会诚信机制建设的必然要求。随着电子商务产业的繁荣,使用唯一标识符技术可以从源头上解决目前日益严重的诚信问题。DOI不仅提升了电子商务行业的价值,而且还使用户及各经营主体从中受益,对我国的诚信机制建设将起到关键性的作用[14]。促进信息社会的健康稳定发展,进而有利于实现社会的和谐与进步,对数字对象唯一标识符需求强烈。

4 国内建立基于内容的中文数字对象唯一标识将规范可行性

尽管国外的DOIs与cIDF已经较为成熟,然而对于国内的数字对象唯一标识符系统发展方向还莫衷一是,但这些研究为基于内容的CCId规范的研究做了铺垫,提供了前期成果。

4.1 国内研究者的研究及主要观点

4.1.1 科技部“我国数字图书馆标准规范建设”项目 该项目之子项目“数字资源唯一标识符应用规范”基于Handle System开发唯一标识符系统[5],建立了中国本土的唯一标识符(Chinese Digital Object Identifier,在该项目中简称为CDOI)系统。该项目参考美欧DOIs从资源管理的角度探讨了国家图书馆唯一标识符系统。

4.1.2 中国新闻出版总署“数字对象标识符标准体系的预研研究” 该项目对被国际出版业广泛利用的DOIs进行重点研究,同时还分析中国出版界的技术情况,是从国内出版界角度对正式出版物的唯一标识符进行探讨。

4.1.3 中国版权中心“基于DOI的版权保护研究”项目 针对目前国内数字资源出版、交易和流通有许多侵权的行为,从版权保护的角度出发,试图探讨正式出版数字作品权益归属的明确描述问题。

4.1.4 “建立中国数字对象标识体系的研究与应用”项目 该项目是科技部国际科技合作项目,其研究对象即是万方注册的中文DOI系统。在中文DOI的基础上,研究使用权益描述语言(Rights Expressing Language,简称REL)实现基于DOI的互操作性DRM体系,以期扩大万方DOI系统的应用。

4.1.5 教育部科技发展中心“网络出版科技论文的DOI标识”专项系列课题 在修订现行参考文献规范(GB7714—2005)基础上,为网络发表科技论文开发设计了参考文献模版,该模版中将唯一标识符作为参考文献单独著录字段。另一项目在此基础上开发设计了参考文献模版,有利于加速国内网络发表论文的中文唯一标识符在参考文献中的标引工作的推广与普及。

综上,国内研究者认为不仅应考察美欧等国家的DOIs,也应考查其他非英语国家和地区的唯一标识符方案。国内探索者们开辟了3条不同的道路:①跟随美欧DOIs的步伐,全国的数字资源都在中文DOI系统上进行标识和解析,如万方的中文DOI注册中心;②基于Handle System的底层解析架构,自主开发中文数字资源唯一标识符系统,通过租用Handle System解析系统实现解析;③自主开发中文数字资源唯一标识符系统,自主开发中国自己的解析系统实现国内资源的解析与定位,当需要与国外资源实现解析时,国内的解析系统与Handle System对话,完成与国外资源有关的解析[2]。根据什么原则、如何建立,则需要考察各个系统的优劣及存在的问题,探索可行性是必不可少的过程。

4.2 国内建立基于内容的CCId规范可行性

4.2.1 大量研究成果为CCId规范建立提供了理论保证 考虑到DOIs在中国的推广应用还面临着一些问题,诸如费用高、信息安全等因素,许多国内研究者认为:中文数字对象唯一标识符系统的建立与发展迫在眉睫,自主开发中文数字对象唯一标识符是一条康庄大道。同时,业界研究者的研究为国内自主建立唯一标识符系统提供了基础,大量研究成果可以用作系统建立时的参考。

4.2.2 CCId规范站在国家层面,推行困难问题可以得到有效解决 现行国内万方DOI平台在美国IDF注册成为国内DOIs代理机构,当然也存在上述诸如费用高、信息安全问题,且这种模式推行难,更要紧的是整个国家信息战略可能被其牵制。但如果在国家层面建立CCId技术方案,则上述诸问题均可以解决。国家层面的CCId平台下,国内各大数据库商,各大OA平台、机构知识库等,处于同一层面,有利于公平竞争,在国家层面制定相应政策即可顺利推行。首先,在参考文献中加入CCId码,原文获取即可解决;原文解析位次按出版商意志或其他方案(如注册时间、注册元数据质量等)决定;国内各大数据库商、各大OA平台、机构知识库的注册、组织与管理更加顺畅;国家层面数字资源长期保存战略问题迎刃而解;国家层面为国内数字资源建立了“身份证”,是促进国内版权作品合法分发、信息监管与有效支付平台的一项必备的基础建设[2]。

4.2.3 CCId规范下费用问题可以得到有效控制与解决CCId规范自主开发中文数字资源唯一标识符系统,自主开发国内的解析系统[2]。这种模式下解析费用分为两部分:国内部分参考文献基于国内解析系统解析,不存在交给国外的费用;如果需要解析到国外资源时,则通过国内解析系统与Handle System解析系统对话,国外参考文献的原文定位可以基于Handle System解析,这种情形国内真正要解析的数量并不大,如果按一个机构算的话,一定的解析数量内,其每年注册前缀费用只有50美元。即使超过规定解析量时,这种模式下平均单条解析费用比向IDF注册交费模式下少得多,且不存在再给IDF缴各种其他费用的问题[3,8]。

4.2.4 CCId规范下国家信息战略高度问题可以得到有效解决 项目组站在国家层面研究和思考问题,提出自主设计解析系统,自主设计CCId方案。当单纯国内解析时与国外Handle System解析系统及DOIs没关系,国家层面各种信息操控方便,不会出现受制于人的局面。当需要解析到国外数字内容时,国内解析系统与Handle System解析系统对话,此时CCId规范的高度与DOIs、日本cIDF、中国台湾地区LIPS-DOIs处于同一层次,也会比现行的方案具有主动权。如图1所示。

图1 国内自主设计解析系统China Handle示意

5 结论

笔者总结国内研究人员的研究成果,并通过认真严谨的思考,认为:我国建立数字对象唯一标识符系统的原则应有如下两条:①适合中国国情,不生搬硬套;②以最小的建设成本获得最大的应用效果[2]。

根据我国国情,并借鉴DOIs、cIDF、LIPS-DOIs的成功经验,笔者及项目组认为应采用第3种方案,即:自主开发解析系统,自主建立基于内容的中文数字对象唯一标识符(CCId)规范。这种方案下,如果解析只需在国内完成,则不存在给国外交费问题;如果需要解析到国外内容,则国内解析系统与Handle System对话,只需交费给Handle System,不需向IDF缴各种费用。

标签:;  ;  ;  

关于建立中文内容唯一标识符规范的研究_doi论文
下载Doc文档

猜你喜欢