开放数据许可协议及其在图书馆领域的应用,本文主要内容关键词为:图书馆论文,协议论文,领域论文,数据论文,许可论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
0 引言 数据已成为宝贵的公共资源,当前开放数据运动如火如荼。开放数据运动号召解锁政府、企业、非营利机构,甚至特定的个人数据[1],以让数据发挥更大的价值。自2007年起,每年的W3C年会都设有研讨“关联开放数据”分会场,其“关联开放数据项目”的目标是使互联网最终成为全球性数据空间。W3C呼吁个人、机构以关联数据的原则和标准开放自己的原始数据。为帮助政府科学规范地开放公共数据(public data),2009年9月8日,W3C eGov Interest Group公布《开放政府数据指南》文件[2],提供开放政府数据的标准和方法。比如鼓励政府以XML、RDF、CSV格式发布原始数据并提供结构化数据,采用元数据、语义标注等方法描述和组织数据,利用URI、RDF技术使之形成人和机器都可读的关联数据。 目前很多国家和地区都在互联网上开放了部分公共数据。2013年6月18日,八国集团首脑在北爱尔兰峰会上签署《开放数据宪章》,各国表示要进一步向公众开放可机读的政府数据[3]。据美国政府数据网站data.gov统计,截至2014年1月12日,开放数据运动已覆盖44个国家和地区。英国开放知识基金会(Open Knowledge Foundation)2013年10月发布的开放政府数据普查结果显示,在对70个国家和地区政府的数据开放情况(包括预算、支出、选举、污染等10个领域)的普查中,英国和美国位居第一和第二,第三到第五是丹麦、挪威和新西兰[4]。 从来没有任何一个时代像今天的网络时代这样能让数据如此高速流动,数据所产生的价值也从来没有像今天这样更直观、更为人所认知,开放数据运动对数字时代图书馆的数据政策、数据管理造成的影响也是空前的。与此同时,尊重知识产权与促进数据开放两者之间的矛盾也从来没有像今天这样尖锐过。图书馆如何在这样的环境下促进数据的有效传播和利用?利用怎样的开放数据许可协议才能保障数据的合理公平使用?本文在对现有开放数据许可协议进行调研的基础上,分析图书馆界开放数据许可协议制订和使用的案例,以期对我国图书馆界参与数据开放运动提供参考。 1 文献调研 学界对开放数据的研究众多,如谭健探讨了开放数据在学术交流、Web2.0时代信息组织中的愿景,介绍了开放数据在电子政务中的应用现状,以及非营利性组织、企业对开放数据的推动情况[5];傅蓉分析了开放数据的内容是什么、开放数据的创作者有谁、经费来源于何处等[6]。 学界对开放数据许可协议的研究较少,有的简要涉及许可协议的内容,如洪京一[7]、曹凌[8];有的综合探讨开放数据许可协议的种类、特点、应用等,如张春景等[9]分析了CC(知识共享)家族、ODC(开放数据共用组织)、OGL(开放政府许可协议)等常用协议;傅蓉[10]分析了开放内容许可协议的定义、基本特点以及各种协议之间的区别。有的学者还对特定的许可协议进行了分析,如傅蓉[11]概述了知识共享许可协议的由来、协议内容和使用情况等,剖析了其中的非商用性使用条款的实用性,认为非商业性是该类许可协议最受欢迎的条款,但也存在问题。 参与开放数据运动的机构为更好地服务于公众,对开放数据设置了许可协议,在参考现有开放数据许可协议的基础上,准许组织和个人再利用这些数据,并明确了利用者和再利用者应做什么、受哪些限制。从这些文献可以看出,部分学者对开放数据的讨论涉及许可协议说明,但大多并未深入探讨;另一部分专门探讨许可协议的学者大多致力于内容、特点、类型与应用等探索,集中于许可的内容、应用方面的论述,结合案例来分析协议的较少,亦不够深入细致。学界对图书馆在开放数据许可协议方面的探讨并不多见,主要集中于数据服务、存取等的研究。比如,张峥嵘、刘亚丽[12]认为在开放数据服务方面,图书馆需转换角色,向用户提供馆藏目录、数据监管、开放获取、知识发现、语义分析等服务。再如,赵海荣[13]分析了中国知网和万方数据的开放存取研究进展,采用文献计量学和社会网络分析方法,对我国发表的开放存取论文进行定量描述和分析,展现了我国开放存取研究的整体图景。由此可见,学界对图书馆开放数据许可协议有待进行深入研究。 2 开放数据许可协议与数据开放 根据英国开放知识基金会(Open Knowledge Foundation)[14]的定义,开放(Openness)需具备三项基本元素:一是非歧视性。数据若开放,则应对任何人都开放。二是机器可读性。数据若开放,则应是机器可读格式。三是开放授权性。数据若开放,则其对应授权条款应确保使用者自由免费访问、获取、使用、加值、演绎、拷贝、传播的权利。 基于上述定义,不难看出,相较于数据共享,开放数据更秉承开源社区倡导的平等、自由的价值观。开放数据强调的非歧视性和开放授权性打破了传统数据共享中设定的“共享条件”和“特定共享方”的限制。相对于政府推行的信息公开,开放数据强调的机器可读性、明确赋予数据使用者的自由增值利用(包括商业使用和非商业使用)和分享传播权利更好地刺激了公众对数据资源的需求,并鼓励公众对数据增值利用。《开放数据宪章》提出开放数据五原则:开放数据是基本原则;注重质量与数量;让所有人使用;为改善治理而发布数据;发布数据以激励创新,承诺并推进本国数据资源的开放。 目前开放数据(Open Data)并没有统一的定义,不同的组织、机构对开放数据理解的视角不一。Wikipedia认为开放数据对每个人来说,可以不受商业条款、拷贝权、专利权等相关规定束缚,能够自由地利用及再出版一些数据;开放数据包括非文本材料,如地图、基因数据、化学合成数据、数学科学公式[15]。欧盟基于“政府数据开放”的视角加以定义:“开放数据是指公共机构产生、收集或支付的所有信息,包括地理信息数据、统计资料、气象资料,由政府资助的研究项目的数据,并包括数字图书,这些公共数据可以随时访问和咨询,也可以重新再利用。”[16]也有学者认为,开放数据是指按照用户特定的需求、一定的互联网协议和规则对Web数据进行存储和组织的活动,而利用来自不同的数据源或不同的数据类型的数据,最终目标是实现信息在网络空间的开放、共享与重用,以寻求数据最大可能的获取与重用[17]。总的来说,这些组织、机构与个人对开放数据内涵的理解能够达成这样的共识:数据不受版权与专利等限制,可以被任何人自由获取。 开放数据运动的主要实践者是政府,英国、美国等发达国家率先开展开放数据运动。图书馆在开放数据运动中扮演着重要角色,一些图书馆已经建成开放数据库或正在着手开展该项目,如欧洲数字图书馆、大英图书馆、德国国家图书馆。然而,随着开放数据运动的蓬勃发展,数据如何开放再利用、制定什么样的许可协议等成为图书馆必须思考的问题。此外,许可协议的制定也为开放数据运动的进一步发展作了环境上的准备。 3 开放数据许可协议的类型 不同性质的组织因不同的目的而制定不同的许可协议,本文从政府与非政府两个不同的类型来说明。 3.1 政府制定的许可协议 开放政府许可协议OGL(Open Government License)是政府制定的许可协议代表,该协议由英国政府于2010年发布,目的是将政府拥有的公共数据提供给大众及企业使用。其中OGL1.0的内容近似于知识共享的以相同方式共享协议的CCBY和ODC-BY,涵盖的信息范围很广,包括皇家版权、数据库和源代码,并且授权使用者不限于英国本土。它还提供机读格式,提供工具自动发现的数据。OGL1.0的内容主要包括[18]:(1)需标明信息提供者提供的信息来源及声明,还需提供本协议的网页链接。如果信息提供者没有提供声明,或者信息来源署名的提供者很多,但多数提供者的信息并没有运用在产品或应用中,则可以仅列如下文字:“Contains public sector information licensed under the Open Government License v 1.0”,但绝不可声称这些信息已得到信息提供者的许可,也不得误导或扭曲信息本身或来源,且要合乎Data Protection Act 1998或The Privacy and Electronic Communications法令。(2)授权终止条款:如果未符合以上规定,授权则自动终止。(3)信息的授权范围不包括个人资料;在法规下不允许公布或揭露的信息;LOGO、图示(除非已整合至文件或数据集本身);军事图标;第三方人授权于信息提供者的权利;知识产权,含专利、商标、设计权;身份信息,如英国护照。(4)授权用户不限于英国。 3.2 非政府组织制定的许可协议 3.2.1 知识共享组织CC 知识共享组织(Creative Commons,CC)于2001年成立,创始人是劳伦斯·莱斯格,该组织的唯一目标是在默认的限制性规则日益增多的今天,构建一个合理、灵活的著作权体系。其制定的许可协议是针对特定的创作性作品而设立的,如网站、学术、音乐、电影、摄影、文学、教材等作品。该组织制定的许可协议认为知识共享的理念和著作权是紧密联系的。传统的著作权有两种极端:一是“保留所有权利”;二是“不保留任何权利”,即公有领域。知识共享组织试图在两者中间广大的灰色地带保留弹性,使得创作者可以保留部分权利,思考知识产权在信息时代的意义。知识共享提供多种可供选择的许可形式及条款组合(见表1)[19],创作者可与大众分享其创作,授予其他人一定条件下再传播的权利,却又保留其他权利。 与传统的版权保护机制相比,知识共享许可同样具有法律效力,在承认和尊重创作者版权的前提下,知识共享许可主张对知识创造成果合法地分享、使用和演绎,其“部分权利保留”的版权许可模式赋予著作权人更多的灵活性。比如,允许创作者自愿根据著作权法赋予的权利,授权他人在满足特定条件限制下复制、展览、表演、放映、传播、修改和发布其作品;允许著作权人只对其作品的某些片段、照片、图片等单独授权。 但是,该组织也制定过“不保留任何权利”的许可。比如,CCO 1.0通用公众领域贡献声明(Creative Commons CCO 1.0 Universal Public Domain)主要内容[20]为:著作的所有者及对该著作相关的其他人,在法律许可的范围内,抛弃著作权法所规定的权利,包括所有相关或相邻的法律权利,并宣告将该著作贡献至公众领域;允许复制、修改、发布或展示此作品,亦可进行商业利用,完全不需要经过许可;公众领域贡献声明(CCO)在任何情况下均不影响任何人的专利权或商标权,亦不影响他人对该著作可能享有的权利以及对该著作的使用方式,如形象权或隐私权。除非另有声明,协助著作公开的人员并不担保,对此著作的所有使用亦不承担责任,此免责声明在法律允许的范围内做最大程度的适用。当使用或引用该著作时,不得暗喻或提及著者及其他相关者。 3.2.2 开放数据共用ODC 开放数据共用(Open Data Commons,ODC)主要为数据库的使用而设立,它是开放知识基金会的一个项目,由其咨询理事会运行。ODC是指在数据开放过程中,用以规范、约束、明确数据拥有者、发布者以及使用者在获取、传播、利用、再生产数据时的权利和义务的一种知识产权许可类型。 开放数据共用包括三种类型:公共领域贡献和许可(PDDL)、开放数据库许可(ODBL)和开放数据共用署名许可(ODC-BY)。“公共领域贡献和许可”针对公共领域的数据库及其内容,明确了作品接受方和贡献方各自的职责;规定该协议所涵盖的范围和协议的法律效力、合法权利所包括的内容,权利不能涵盖的范围,详细说明对版权和数据库权利的贡献、弃权和许可。同时还规定了与其他权利的关系,如不能随意使用所有人的专利和商标。“开放数据库许可”是允许用户无偿共享、修改和使用数据的许可协议。“开放数据共用署名许可”是2010年6月24日发布的数据库特定许可协议,类似于知识共享署名许可协议。开放数据共用署名许可和开放数据库许可的大部分内容几乎相同,不同之处有两点:在序言部分减少解释性说明,文本更简洁;在应用条件部分删除了关于“相同方式共享”的条款内容。 4 图书馆领域的开放数据许可协议应用案例分析 数据是决定图书馆服务有效性的关键因素,是关系图书馆服务模式变革和创新、提高个性化服务水平和增强服务透明度最重要的战略资源。开放数据运动对数字时代图书馆的数据政策、数据管理造成的影响越来越大,图书馆应该以更加开放的姿态向社会开放公共数据。为了梳理公共图书馆的开放数据应用现状,在开放的基础上规避侵权风险,笔者选取国际上具有代表性的4家图书馆或机构,即英国大英图书馆、欧洲数字图书馆、德国国家图书馆,以及学术出版与学术资源联盟SPARC,对其开放数据的应用及许可协议进行调研及分析。 4.1 英国大英图书馆 图书馆开放数据运动的技术手段一般表现为关联数据,大英图书馆的开放数据关联开放英国国家书目数据(Linked Open British National Bibliography,简称Open BNB),基于英国《国家信息基础建设条例》建立,包括已出版的和将要出版的书刊和其他整合资源。大英图书馆元数据中心(Collection Metadata)为这些开放数据制定了如下数据许可协议:(1)数据的使用。基于Creative Commons CCO 1.0 Universal Public Domain Dedication,该馆称其没有这些数据的所有权或拷贝权,也就没有权力对这些数据的再利用进行限制。(2)数据支持和分享。该馆竭尽所能地为读者提供准确且高质量的数据,读者如果对这些数据有任何问题、建议或意见,或需要分享数据的使用情况,皆可联系该馆相关人员。(3)数据责任。该馆不承担任何有关数据损坏的责任,详情参见Creative Commons CCO 1.0 Universal Public Domain Dedication许可条例。(4)其他元数据的说明。在该馆可搜索下载其他元数据,但须作为非商业目的之用,详细使用许可参见该馆Collection Metadata页面。 该馆制定的许可协议并不具备法律效力,而是基于善意要求使用者遵守的规则约定。该馆对这些开放数据不具备所有权、拷贝权等,在参考英国相关法律条例以及CCO 1.0公众领域贡献声明的同时,尽可能地服务于大众。该馆在这些数据的公开行为中扮演的只是“中介”作用,在原始数据与大众之间搭建桥梁,促成大众信息与原始数据之间的对接、利用与反馈。 大英图书馆在数字资源利用方面,除遵循英国版权法和国际版权法的规定外,也在图书馆网站上发布了与版权相关的公告[21],声明该馆有义务保护馆藏资源,他人损坏或盗窃馆藏资料会触犯刑事罪。为减少损毁风险,该馆遵循英国法律对馆藏资源的复制进行了限制规定,其中涉及版权的规定是读者不能复制被告知侵权(版权、专利或其他所有权)的馆藏资源。与之相对的,仅有用于非商业性研究的在版权内的单一复本可以复制。这一复制行为不能损害版权所有者的权益。 大英图书馆在关于图像服务请求的网站上也有公布涉及版权的相关声明,主要内容是该馆致力于保护他人的知识产权。大英图书馆并不保证图像服务所提供的材料不会侵犯第三方的权益。确认版权问题和其他相关事项合法是提出图像服务需求方的责任。依据英国版权法,1874年以后出版的材料或未公开出版的材料受到知识产权法的保护,若需要使用这些材料,需要提供版权所有者的许可证明[22]。至于版权期满的材料,无论是已经由大英图书馆数字化了而原件已超过版权保护期限,还是大英图书馆正在安排或挑选进行数字化而原件已超过版权保护期的材料,大英图书馆都拥有所有权利。因此,这些材料的冠名、收益或其他任何知识产权均属于大英图书馆所有,用户需向大英图书馆的相关部门咨询协商。 4.2 欧洲数字图书馆 欧洲数字图书馆对其收录的数字(数据)资源的许可协议有明确规定,其中包括对许可协议的介绍、数据交换协议、使用公共领域贡献宣告(CCO)等内容。 (1)许可协议介绍。欧洲数字图书馆许可协议使得与信息和业务相关的权利实现了标准化。该协议制定于2011年,由4部分组成,致力于使用户与数据提供体系之间的关系变得透明(见图1)[23]。 图1 欧洲数字图书馆许可框架介绍 第一步是数据交换协议(DEA)。DEA建构了欧洲数字图书馆与数据提供者之间的关系。自2012年7月1日起,DEA代替了所有该馆与数据提供者之间的协议。 第二步是使用公共领域贡献声明(CCO)。DEA建立了欧洲数位图书馆发布的元数据,这些元数据来自使用公共领域贡献声明的数据提供者。 第三步是用户贡献度条款。这些条款适用于对该馆有所贡献的用户。这些条款的发布使得欧洲数字图书馆能够使用用户提供的内容,并能够与其他欧洲数字图书馆馆藏的内容和数据进行整合。 第四步是EDM——欧洲数字图书馆数据模型的权利领域。欧洲数字图书馆数据模型说明需要何种格式的数据,以便欧洲数字图书馆可以使用这些数据。 (2)数据交换协议(DEA)。DEA是欧洲数字图书馆许可协议的核心,建立了两条主要规则,这两条规则与元数据及内容的知识产权(IPR)有关:一是所有提交给该馆的元数据将会依据CCO条款被发布为公开数据;二是每个可供使用的数字对象均需要有一个描绘其版权状况的权限声明。 (3)使用公共领域贡献声明(CCO)。CCO弃权证书是由知识共享组织开发的合法工具,使数据再利用不受限制成为可能,这意味着任何人都可以以任何目的没有任何限制地使用欧洲数字图书馆发布的元数据。 4.3 德国国家图书馆 德国国家图书馆的关联数据服务(linked data service)项目正在建设之中,涵盖德国所有书目数据和规范数据、整合过的规范文档以及文献记录等[24],届时公众可以通过该馆的云端享受到高质量服务,可以非常方便地利用这些数据。不过,该馆只对该数据库中的整合规范文件以及文献记录两项子数据库作了许可协议的说明,规定公众领域贡献声明(CCO 1.0)适用于此两项子数据库,声明不保证这些元数据以及所提供的链接是否完整、是否有连续性、有无瑕疵,也不能担保使用者不会侵犯第三方的权益,如拷贝权、人权。 4.4 学术出版与学术资源联盟SPARC 学术出版与学术资源联盟(Scholarly Publishing and Academic Resources Coalition,SPARC)由学术与研究性图书馆联盟建立,目的是创造更加开放的学术交流系统,更快更广泛地享有学术研究成果,以增强研究成果影响力,增加研究投入回报值;战略目标是减少获取、分享使用学术资源的障碍。SPARC开放的资源主要是期刊文献,也包括数字化数据和开放教育资源等研究成果。SPARC针对这些研究成果的利用制定了许可协议:“SPARC研究数据分享政策的初始化”(SPARC Research Data Sharing Policy Initiative)[25]。为更好地实施该政策,SPARC成立咨询委员会,成员来自不同利益团体,提供重要指导。该政策实施的原则与根据为百慕大原则(Bermuda Principles)、八国集团开放数据宪章(G8 Open Data Charter)、世界经合组织关于开放获取公共资助研究数据的方针(OECD Principles and Guidelines for Access to Research Data from Public Funding)、潘顿原则(Panton Principles)、开放数据工程(Project Open Data)、英国研究理事会关于数据政策的一般原则(RCUK Common Principles on Data Policy),以及一些重要研究机构的数据分享政策等。除以上这些原则与根据外,为使数据合法地被使用者再传播及利用,还应遵守一些许可协议,可参见联合信息系统委员会颁发的《开放数据许可使用手册》(Licensing Open Data:A Practical Guide)或知识共享“许可选择工具”(the Creative Commons “Choose a License” tool)[26](见图2)。 图2 知识共享许可选择工具 联合信息系统委员会是英国高等教育、继续教育和技能部门为数字化服务与问题解决而建立的非营利组织,其制定的《开放数据许可使用手册》仍然是以知识共享组织制定的协议为准,主要参考版本是“署名-非商业性使用-禁止演绎2.0[27]英国:英格兰和威尔士”(CC BY-NC-ND 2.0 UK)[28]。 为规范其许可协议,SPARC为研究原创者制定了“实施开放数据的政策”,说明开放数据运动的涵盖范围、数据存储在哪里,以及隐私等问题该如何解决等。 5 结语 传统共享方式可以通过借阅时限、收取复印费用、珍贵资料不予共享的方式来尽可能减少版权冲突,但是开放数据中共享的数据更有可能发生版权侵犯。因此,完全无限制的、大范围的、跨系统的数据共享无法在短期之内实现,必须在建立可行的数据共享版权约束机制的前提下。欧洲数字图书馆、大英图书馆、德国国家图书馆制定的许可协议都援引、参考了CCO 1.0公众领域贡献宣言,即知识共享许可类型中的一种;SPARC也参考了知识共享家族中有限制的许可协议;其中欧洲数字图书馆和SPARC的许可协议最翔实,由此建构起来的协议明确了使用者与数据提供体系之间的关系,版权也得到了明示。因此,在版权问题上,这几家机构都参考了知识共享家族协议,前三家不保留任何权利,而后一家保留一定的权利。 传统图书馆现有的信息资源共享大多是在系统内进行,包括同级图书馆之间、各级图书馆之间、高校图书馆系统之间、科研系统之间、总分馆之间,而跨级图书馆乃至于图书馆与其他机构的共享几乎没有。从以上图书馆的开放数据许可协议的阐述中可知,并没有对共享的范围作出限制,信息资源共享只是一种“信息提供者”与“信息需求方”之间的简单的平衡关系。根据这一理念,信息共享的范围将更广,图书馆、博物馆、文化馆、政府、企业、信息提供商和服务商、用户都可以成为共享主体,图书馆可以与系统之外的资源进行互换,信息流生产者、发布者、收藏者和用户能够形成完整的信息资源链条,不同的结点都可以进行资源共享。 引用本文格式 杨敏,夏翠娟,徐华博.开放数据许可协议及其在图书馆领域的应用[J].图书馆论坛,2016(6):91-98,141.开放数据许可协议及其在图书馆领域的应用_图书馆论文
开放数据许可协议及其在图书馆领域的应用_图书馆论文
下载Doc文档