数字对象标识符系统在数字版权保护中的应用研究,本文主要内容关键词为:数字论文,标识符论文,版权保护论文,对象论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 DOI的发展状况
网络环境下数字化信息资源的版权保护不仅要依靠法律和行政手段,还应该与技术手段相结合,以弥补单一保护手段的缺陷。Digital Object Identifier(DOI)系统即是实现数字化信息资源版权保护的信息技术之一。
DOI系统设计的最初目的就是把它作为一种帮助版权所有者管理知识产权的工具。1994年美国出版协会(Association of American Publishers,AAP)建立了“技术实现委员会”(Enabling Technologies Committee),试图设计一种既能保护数字作品版权又能保障出版者利益的系统,决定第一步先引进一种行业性标准的电子出版内容识别符以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。该系统以美国全国研究创新联合会(The Corporation for National Research Initiatives,CNRI)研发的“The Handle System”作为支撑技术,对数字化出版物提供持久和可靠的识别符[1]。DOI系统在1997年法兰克福图书博览会上首次亮相,以后逐渐引起了出版界的重视。1998年国际数字对象标识符基金会(International DOI Foundation,IDF)成立,专门负责有关DOI的政策制定、技术支持、名址注册等业务。
经过十几年的迅速发展,目前在国外,DOI系统在数字资源唯一标识符领域已经得到了广泛认可,拥有8个注册代理机构[2]和几千个使用单位,跨越了美国、欧洲、亚洲和澳大利亚,应用领域也扩展到政府部门和非英语国家,法文、德文、西班牙文、意大利文及韩语等都有所发展[3]。西方超过70%的出版商加入了DOI系统。以DOI注册代理机构之一的CrossRef为例,截止2008年11月5日,加入CrossRef的出版社和学会有2 664个,图书馆1432个;覆盖刊物21 364种;注册DOI数量超过3 386万个;2008年10月DOI在CrossRef中的单月检索量达到1189余万次,终端用户解析量超过2 302万次[4]。2000年DOI的编码规则被美国国家标准协会(ANSI)确认为美国国家标准(ANSI/NISO Z39.84-2005)。2005年IDF 向ISO/TC46/SC9(国际标准化组织/信息与文献技术委员会/识别与描述分委员会)提交新工作提案——数字对象唯一标识(DOI),拟申请国际标准。经IS0/TC46/SC9投票批准,成立第7工作组起草DOI国际标准草案,几易其稿[5]。2008年4月该草案被批准通过,再根据各成员国进一步投票的结果,预计2009正式的标准将被发布[6]。
在国内,只有少量拥有较高质量英文刊的出版社,例如高等教育出版社、中国科学出版集团等加入了DOI系统,还有部分出版社的英文刊通过出售英文版的销售权,由国外出版商代理并注册DOI[7]。2007年3月,北京万方数据股份有限公司联合中国科学技术信息研究所向IDF申请成立了唯一的中文DOI注册中心,共同开展中文DOI的注册登记工作。目前,中文DOI注册中心已经为科技部精品科技期刊全文数据库项目中的300种精品科技期刊、中华医学会的115种医学期刊、《浙江大学学报》、《测绘科学》等多个领域的学术期刊开展了DOI注册与链接服务[8],已注册DOI数量为25万条。相对于国外的情况,DOI系统在中文数字资源中的应用才刚刚起步。
2 DOI系统的组成
2.1 编码规则
DOI系统的编码规则[9]规定了一个DOI命名组成的形式和顺序。一个DOI命名可以分配给任何形式的数字对象,只要有将其作为单独的对象加以区分的必要,也不管它是否是一个数字对象中的一部分。一个DOI命名在DOI系统中必须是唯一的。
2.2 元数据框架
DOI命名是标识数字化对象的符号,从符号本身不能获得该对象的任何信息,只能作为定位工具使用。与DOI命名相关联的元数据,则提供了与数字对象有关的许多信息,包括版权所有者的信息、数字对象存储的URL等。只有在DOI系统中使用元数据,才能实现数字资源版权的管理。DOI系统多重解析功能的实现也要依靠元数据描述来检索和确认解析结果。因此,元数据是DOI系统的重要组成,也是DOI技术大范围推广应用的关键[10]。IDF采用<indecs>框架作为DOI系统的元数据模型[9],后升级为场景本体构造(COA)以支持管理元数据的功能[5]。
2.3 解析系统
DOI系统所采用的解析技术是由CNRI开发的能够长期对网上信息实现可靠管理、定位、获取的分布式系统——Handle System[9,11]。它与DOI系统的功能目标非常一致,即标识符的唯一性、永久性,多重解析能力,命名域可扩展性,分布式服务和管理模式,高效的解析服务[10]。
2.4 管理模式与有关规则
DOI系统由非赢利性组织国际DOI基金会(IDF)和其任命的注册中心负责管理。IDF对DOI系统的运行管理各个细节规定了详细的标准,从而保证了DOI系统成为具有一致性、预见性、受控制和可持续发展的社会基础设施。
3 DOI系统对数字资源内容的版权保护
3.1 现实保护模式
目前基于单一解析技术,应用广泛的保护模式如图1所示。
图1
DOI系统对数字内容的版权保护机制(现实模式)
1)出版商向DOI注册机构(Registration Agencies, RA)申请注册,成为正式会员之后,才能对所拥有的数字化信息资源进行内容保护。DOI注册机构受IDF的委托受理DOI的注册事务,并提供已注册DOI信息的存储、解析和检索服务[12]。IDF规定只有数字对象的版权所有者才具有注册权,从出版源头确定唯一标识符,避免了命名体系的混乱,并最大限度地保护了版权所有者的利益。
2)出版商为其出版的每一数字对象编制一个含有标识出版商本身的注册人代码(Registrant Code)的DOI命名,并将其附加到描述该数字对象的元数据上。每一条数字对象的元数据必须符合DOI系统核心元数据规范(the Kernel Metadata Declaration),并包含相关的其他信息(如版权信息和数字对象存储的URL等)。
3)每个数字对象的DOI命名、元数据及其URL信息一起被出版商送往RA进行注册,系统将对其格式和内容进行检查和校验,对不符合要求的数据,将告知提交数据的用户文件中存在的问题,并停止处理;校验合格的数据将进入元数据数据库及DOI目录库,完成DOI注册。DOI目录库中的DOI命名及URL等将用于DOI的解析,DOI系统的元数据数据库中的元数据可用于元数据和DOI的检索等。数字对象的DOI一旦注册就不能修改其编码命名了[13]。当同样的数字对象内容已经被登记注册,就不能再在RA上重复注册了,这样就保证了DOI和数字对象内容一一对应的关系,保护了版权所有者的利益。
4)当个人用户在网络上检索某一数字资源的内容时,不论是通过出版商或数据集成服务商发布的数据库查询页面,还是通过搜索引擎,或是其他检索途径,呈现在用户眼前的检索结果都是这一数字资源的DOI链接,而不是其内容存放的URL地址。点击DOI链接,查询请求就会被传送到DOI注册中心的服务器上。该服务器通过解析系统查询DOI目录数据库,为用户返回单一的URL页面,一般是出版商网站上的相关信息页面或其指定的其他资源页面。用户通过此页面来获取相应的数字资源。由于DOI系统仅存储描述数字资源的元数据,而不存储数字资源内容,避免用户随意下载,保护了著作者和出版商的版权。
5)当出版商将其数字产品版权转让或出售时,即某一数字资源的物理位置发生了变化,出版商应及时将这一数字对象改变后的元数据(主要是其相关的URL)上传到DOI系统的服务器,系统将对数据的时间戳进行比对,只有当提交的元数据的时间戳比系统中原有数据新时,才进行修改操作,即用提交的修改数据代替系统中原有数据。这样将保持DOI系统数据的完整性,使数字对象内容一直处于DOI系统的保护之中。
3.2 理想保护模式
单一解析技术下的DOI系统只能简单地为用户提供一个URL,实际情况是一个数字资源可能有多个复本并存储在不同的机构和服务器中,因此无法独立解决合适版本(Appropriate Copy)的问题。在Handle System多重解析[9,14]技术的支持下,DOI系统对数字资源内容的版权保护机制正在探索向更完善、更理想的模式发展。理想保护模式如图2所示。
图2 DOI系统对数字内容的版权保护机制(理想模式)
1)、2)、3)流程与现实保护模式相同。
4)当个人用户在网络上检索某一数字资源的内容时,不论是通过出版商或数据集成服务商发布的数据库查询页面,还是通过搜索引擎,甚或是其他检索途径,呈现在用户眼前的检索结果都是这一数字资源的DOI链接,而不是其内容存放的URL地址。点击DOI链接,查询请求就会被传送到DOI注册中心的服务器上。该服务器查询DOI元数据数据库检索到该DOI记录和相关元数据。有关数字对象内容的元数据(包含版权信息及内容使用权限信息等),与随查询请求一并传递过来的与特定的语境(用户权限)有关的元数据进行互操作,判断返回值。通过底层技术Handle System的多重解析功能支持,给用户返回不同的页面信息。①对于授权用户而言,如果是允许正常使用的数字资源,则查询DOI目录库,将该数字对象存放的URL返回给用户以获得该资源;否则返回相关元数据中保存的摘要信息,并说明无法获得该数字对象内容的原因。②对于非授权用户则在返回页面中显示该数字对象的摘要信息,并提供其他的访问选择如付费订阅、文献传递、联系版权人等[15]。由于DOI系统在数字对象存放服务器与使用用户之间起到了中转站的作用,这样就防止了非授权用户链接获取数字对象内容实体的情况发生,实现了DOI系统保护数字对象内容的目的。
5)当出版商将其数字产品版权转让或出售时,即某一数字资源的物理位置发生了变化,可能在多家数据集成服务商的数据库中都存放有该数字资源的内容实体,或者是一家数据集成服务商的多个服务器上都存有该数字资源内容实体的复本。出版商应及时将这一数字对象改变后的元数据(主要是其各个复本的URL)上传到DOI系统的服务器,系统将对数据的时间戳进行比对,只有当提交的元数据的时间戳比系统中原有数据新时,才进行修改操作,即用提交的修改数据代替系统中原有数据。这样将保持DOI系统数据的完整性,使数字对象内容一直处于DOI系统的保护之中。
4 DOI在数字资源版权保护其他方面的应用
4.1 DOI在数字版权保护技术中的应用
数字版权保护技术(Digital Rights Management,DRM)是指在网络及数字化环境下,以一定的方法,如加密技术、数字签名、身份认证、数字水印等,使数字内容的权利主体获得对其客体的控制权,从而防止非授权使用,保护权利所有人利益的一种综合性技术体制[16]。
数字对象唯一标识和元数据是DRM系统互操作的必要条件。不同的DRM系统所采用的技术标准或授权文件的描述标准互不相同。使用不同DRM系统进行保护的数字对象内容,需要安装各自相应的客户端软件才能正常使用。各个DRM系统间如果不具备互通性,就会成为一个相对封闭的系统。用户被迫购买同样内容的不同版本,以此来满足在不同设备上使用的需要;或在不同的客户端软件之间频繁切换,以此来使用不同DRM系统所保护的数字对象内容。缺乏互操作性给用户带来极大的不方便,最终可能导致用户放弃使用被DRM保护的数字对象内容,因此,不同DRM解决方案的互操作是十分必要的。DOI提供了数字内容的唯一标识符,相同数字内容的DOI在不同的DRM解决方案中保持一致,为DRM互操作提供了前提条件。
此外,IDF正积极参与数字版权相关标准的制定工作,力争使DOI成为版权许可技术标准(例如ONIX-PL标准和ACAP标准)的内嵌标准[17]。通过对数字对象内容的标识,DRM系统可以实现对数字对象版权状态的持续追踪,如版权所有者、用户,等等,以监测数字资源的获取和使用情况。由此可见,DRM技术应与DOI技术相结合,除了共同使用数字对象内容的标识符命名外,还可以建立互操作的元数据标准模型,互相支持,互为补充,形成系统完整的数字版权保护体系。
4.2 DOI系统为版权服务提供了基础架构
DOI系统可对不同粒度的数字对象提供标识符,例如,可给一期电子期刊的每篇论文各赋予标识符,也可给一本电子书的某些章节或图表提供标识符,甚至为一组科学数据提供标识符。这样,就为数字内容的版权管理及满足用户不同层次的信息需求提供了更多的选择,同时也为数字对象的生产者和销售商提供了更多的商业机会。内容生产者和销售商可应用DOI技术对不同粒度的数字对象进行版权管理,可根据用户的需要对数字内容进行不同形式的包装,从而为他们带来更多的利润[18]。
IDF注册代理机构之一的澳大利亚CAL公司启动的Coursepack项目是利用DOI进行数字版权服务的典型案例。CAL对出版商的数字内容进行了深层次的标识,从期刊文章到书的章节和图表。用户通过查询阅览,确定并下载不同粒度的数字对象内容,用户使用量得到了统计,CAL可以据此向版权所有者支付版权费用[19]。
DOI系统为版权费用的自动化收取和分发提供了基础的数字化架构,它在数字版权服务中的应用将对数字信息产业链中的利益分配产生巨大的影响[20]。
5 结束语
网络环境下解决数字化信息资源的版权保护问题,一方面需要知识产权制度进一步完善,另一方面应充分利用现有的信息技术保护措施。随着DOI系统的逐步发展与普及,DOI技术在数字化信息资源版权保护方面必将具有广泛的应用前景。此外,DOI系统的应用提供了数字资源长期保存和永久定位的基础,促进了各种数字资源的集成和融合,建立了动态的、开放的、互动的知识链接体系[21],为实现数字资源的整合与共享创造了条件。因此,开展中文DOI系统的工作,是中文数字信息资源建设的重要组成部分,是实现国内外各数字文献生产商资源共享的前提,是推动各数字文献生产商增值服务的保障,必将推动我国数字信息资源建设进入良性发展阶段。DOI系统今后将会在网络上不同的有版权归属的数字化信息资源领域得到空前的发展。
标签:版权保护论文; 元数据论文; doi论文; 数字技术论文; drm数字版权保护技术论文;