科学数据完全与公开获取政策及其借鉴意义,本文主要内容关键词为:意义论文,政策论文,科学论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
〔中图分类号〕G31 〔文献标识码〕A 〔文章编号〕1002-1167(2006)02-0001-05
在创新时代,科学数据是重要的战略资源,在建设创新型国家的历史进程中发挥着不可替代的作用。2004年中共中央办公厅发34号文件要求大力加强信息资源的开发利用工作。科学数据是信息资源的重要组成部分。所谓科学数据,一般指各类科技活动产生的原始性、基础性数据及按照不同需求加工后的数据集和相关信息,它既包括各部门大规模观测、探测、调查和试验工作所获得的长期积累和整编的海量科学数据,也包括广大科技工作者长年累月的研究工作所产生的大量科学数据。① [1] 我国是一个科学数据的大国,但还不是科学数据强国。大量宝贵的科学数据没有发挥应有的作用。因此,科学界强烈要求科学数据共享。但是,采用什么机制促进科学数据的共享却一直是学术界和决策层探讨的课题。本文认为,美国对国有科学数据采取的“完全与公开”政策值得我们借鉴。
1 “完全与公开”(full and open)政策概述
1.1 “完全与公开”政策的起源
完全与公开原则的美国科学数据公共使用的一项国策。它的政策基础是美国信息自由法(Freedom of Information Act)。该法的主要条款编入了美国法典第五编第552节,从1967年开始实施。美国国会曾于1974年、1976年、1986年及1996年对该法进行了重大修改。这部法律标志着美国政府第一次在成文法中保障了公民以个人名义取得政府信息的权利。信息自由法要求美国政府信息以公开为原则,以不公开为例外。美国1976年版权法也规定美国政府的作品不受版权保护。这两部法律为日后美国实行“完全与开放”的数据共享政策奠定了法律基础。
美国政府在20世纪90年代初就把科学数据共享作为其21世纪科技和综合国力领先战略的重要政策。目前,美国除了对危及国家安全、影响政府政务和涉及个人隐私的数据和信息实行强制性保密外,其余的数据和信息均纳入共享管理的范畴[2]。
20世纪70年代,随着计算机的发展,美国科学数据库的开发迅猛发展,到1975年,美国已经开发了177个大型数据库[3]。当时这些数据的使用主要存在两个问题,其一是科学界不能及时得知政府近期又更新了哪些数据库;其二是大部分数据库的要价太高,提高了科学家科学研究的成本。随着科学数据的急速积累,到80年代末期,科学界对数据共享的呼声越来越大,要求政府采取措施改变现状。最终引起国家重视、并使政府下决心改变管理状态的是美国国家航空航天局专家组1989年关于建立国家级数据中心群的建议报告。建议同时指出,联邦政府应该长久、稳定地资助国家级数据中心群,采用“完全与开放”的数据共享政策,积极推进科学数据的流动和应用。
美国国家级科学数据共享的总体思路是将“完全与开放”的数据共享政策作为美国联邦政府在信息时代的一项基本国策。联邦政府统筹规划科学数据的管理,充分发挥各个部门的作用,利用行政、财政、政策和法规全面推进数据共享的工作,通过数据的流动和应用激励美国经济的发展,确保美国在21世纪信息时代处于世界领先地位。
1.2 “完全与公开”政策的内容
基于完全与公开的原则,美国许多联邦机构和组织都提出了自己的标准。但其基本思想是一致的,即对于国有公益性科学数据,不加歧视地平等提供服务,在费用上尽可能低廉。即使不能免费也以不超过复制和发行的成本为底线[4]。总统科技政策办公室于1991年7月发布了“全球变化研究数据管理政策声明”,该政策声明旨在促进全球变化研究相关数据的完全与公开获取,是美国联邦政府首次明确提出将“完全与公开”的数据共享政策作为国家科学数据共享的基本国策。“全球变化研究数据管理政策声明”包括七方面内容[5]:
(1)美国全球变化研究计划需要确立一项提前开始并长期坚持的任务:建立、维护、验证、描述、接受访问、分发高质量的数据。
(2)数据政策的基本目标是:全球变化研究的全部数据,必须对所有全球变化研究人员实施“完全与公开”的共享政策。
(3)对全球变化研究长期有价值的数据必须存档。对每一个全球变化数据参数,必须至少建立一份详细的存档。数据获取、保存和清除优先权的设置程序和标准需由国际国内的参与机构制定。必须制定一套清除数据的程序,以防重要数据的清除和丢失。
(4)数据存档必须包括一些容易被用户获取的辅助信息,如数据的所有权、质量评估、查找和获取数据的指导和帮助。
(5)数据格式、数据载体、数据处理和传输应尽量采用已有的国际和国内标准;
(6)数据应以尽可能最低的价格提供给全球变化研究者,以实现数据“完全与公开”的获取政策。收费首要的原则是,不得高于满足某一特定用户需求的边际成本。
(7)数据专用:有些数据需要由数据生产者优先使用,以验证数据质量或享受其法定的优先权。但任何资助数据生产的政府机构,在合同中必须明确规定数据生产者的专用期限,超过这一期限,数据必须公开。
在“全球变化研究数据管理政策声明”的附录中,对以上七条的内容做了补充说明。按照“完全与公开”的数据获取政策,数据会经常被免费或以复制和发行的边际成本提供给研究者使用。总之,基本原则就是,全球变化研究者需要使用的数据,不应进行商业的、以营利为基础的定价。1997年,美国白宫总统科技政策办公室的环境和自然资源委员会根据已经提出的“完全与公开”的若干解释,提出了定义。即科学数据“完全和开放的使用可以定义为在没有歧视的基础上以不超过复制和发行成本的费用无限制地使用。”由此可见,“完全与公开”政策的内容包括没有歧视、不超过复制和发行成本的费用、无限使用三个方面。按照“完全与公开”的获取政策,科学数据对公众开放时不应有任何歧视,根据美国“信息自由法”和“版权法”的规定,每个公民都依法享有获取和使用信息的权利;作为政府资助产生的科学数据,其获取的费用应控制在复制和发行的成本内,不能以营利为目的;同时,获取的科学数据作为个人研究使用时,可以无限使用。
1.3 “完全与公开”政策的效益
美国科学数据“完全与公开”政策的实施,对促进科学数据共享,实现科学数据的科学价值、经济价值和社会价值,为科学研究提供强有力的保障,促进经济增长及保障美国在信息时代的领先地位,确保美国21世纪国家发展和科技发展战略目标的实现都具有十分重大的意义。科学数据最大价值实现的根本途径不是发生在数据本身的交易中,而是在数据流动和数据广泛应用的过程中。按照“完全与公开”政策的要求,美国国有科学数据均可以在没有歧视的基础上以不超过复制和发行成本的费用无限制使用,这极大地促进了美国的经济增长和社会进步。
“完全与公开”的科学数据共享政策已经使地球科学、生命科学、材料科学等多个领域受益,同时极大地刺激了美国经济的发展。在1991—1995年间,美国平均每年经济增长率为1.6%,1995—1999年间,平均每年经济增长率为2.7%。在“完全与公开”的数据共享政策实施后的后五年比前五年平均每年多增长1.1%。根据美国经济学家的计算,其中,0.2%来自于计算机和半导体硬件的改进,0.5%则是由于数据和信息的传输和应用产生的效益[6]。
科学数据“完全与公开”获取政策不仅促进了美国经济的迅速增长,也取得了巨大的社会效益。由于政府数据向公众开放,政府与公众之间在许多问题上达成了共识。例如,美国国家环保局将每年花费近4亿美元采集的有关美国各地环境的数据公开上网,这些数据包括各地的饮用水、大气、废物、有毒物等有关信息[7]。这些信息的公布使公民增强了对环境保护的意识,增加了全民对污染企业监管的力度。政府环境保护的决策和具体政策的支持率一直处于较高的比例。
2 “完全与公开”政策的应用
美国科学数据“完全与公开”获取政策在许多政府和其他组织中得到采纳和应用。美国管理与预算办公室(Office of Management and Budget,OMB)第A—130号公告修正案确立了联邦信息资源的管理政策,该公告包括了与1991年“全球变化数据管理政策声明”相一致的联邦机构的执行指南和要求,将“完全与开放”政策应用到联邦信息资源的管理中[8]。该公告指出,机构有责任向公众提供与其职责一致的信息,机构履行职责的方式主要有:(a)按法律要求提供描述机构组织、活动、计划、会议、记录系统的信息和其他信息资源,以及公众获取这些机构信息的方式;(b)在信息自由法和隐私法案条款下,提供对机构档案的访问,并收到这些法案的保护;(c)在履行机构职责必要或适当的情况下,提供类似的其他信息[9]。1993年7月的OMB第A—130号公告还指出,政府信息是一种有价值的自然资源;政府与公众间信息的自由流动对民主社会至关重要;联邦信息资源应保护公众对政府信息的获取;对科学和技术信息的公开与有效交换促成了科学研究的成功以及联邦研究与发展基金的有效使用[10]。
美国国家研究委员会(National Research Council,NRC)在其研究报告中指出要遵循的一个原则是“数据的价值在于使用。对科学数据的完全与公开获取原则应被采纳,作为公共资助研究所产生的科学数据交换的国际标准。科学数据完全与公开获取和使用中的公共利益应与对国家安全、个人隐私和知识产权保护的合法考虑取得平衡。”[11]
美国科学促进协会(American Association for the Advancement of Science,AAAS)在其“数据库知识产权保护宣言”(Statement on Intellectual Property Protection for Databases)中提出[12],数据库保护的特别权提案或任何会阻碍科学数据完全与公开交换的提案都将不利于科学进步;在所有科学活动领域,完全与公开交流对研究成就的取得和教育的成功都十分关键;知识产权法不能成为科学思想和信息完全与公开交流的障碍。
美国环境保护局(U.S.Environmental Protection Agency,EPA)在其信息源管理政策手册(IRM Policy Manual)第21章“公众对信息的获取政策”中强调了公众对EPA所有信息的获取[13]。该章第5条中规定,EPA的信息创造、收集、保存和管理方式都应有利于公众对信息的获取和信息的传播。
美国航空航天管理局(National Aeronautics and Space Administration,NASA)地球科学部门(Eearth Science Enterprise)的数据管理声明(Statement on Data Management)中将数据的完全与公开获取作为基本原则之一[14]。该声明指出,NASA致力于及时与所有用户完全与公开共享从美国政府资助和拥有的系统中获得的地球科学数据,所有地球系统部门的任务、项目和授权计划必须包括利于实施这一原则的数据管理计划。对政府所有或资助系统产生的数据,NASA将实施无歧视的获取原则,使所有相同数据使用目录中的用户能得到平等的对待。NASA还将为地球科学部门的数据制定合理的获取价格并鼓励使用。NASA及其政府合伙人的数据将以传播的成本定价,除非这种定价会过分地抑制使用,就会低于传播成本。NASA将力求使价格及获取政策与声明中的原则一致。
美国地质调查局(United States Geological Survey,USGS)在其数据获取政策中也指出,USGS的政策是使其科学和工程研究成果能被所有公众获取,并最大限度地服务公众,而不是为任何特殊群体、公司或个人的利益服务。[15]
1994年美国气象协会在其协会手册中指出,“促进气象卫星数据和国家气象中心的产品免费向国际提供作为美国的长期政策。”[16]
“完全与公开”政策在国际科学界也产生了深远的影响,许多国际组织倡导并应用了“完全与公开”政策。[17]
1990年世界气象组织(WMO)作出执委会决议,要求成员重新承诺在国家气象服务方面“免费和无限制的进行基础气象数据和产品国际交换”。[18]
1990年第二届全球气候会议(SWCC)发表科学与技术声明:数据应该以不超过复制和发行成本的价格提供。气候研究线索需要的完全与开放地球和其他相关数据的完全与公开交换是必要的。[19]
1990年国际陆地生物圈计划(IGBP)发表IGBP报告指出:数据应以尽可能低的价格提供。作为第一原则,不应当高于复制与发行成本。[20]
1990年地球观测卫星委员会(CEOS)指出“数据应当无歧视性并能完全获取的方式向全球提供”。[21]
1991年经济合作与发展组织(OECD)部级公报提出,要促进环境数据和信息的完全与公开交换。[22]
1992年5月建立美洲国家之间的全球变化研究协会协议指出,要促进完全、开放、有效的数据和信息交换。[23]
1992年6月联合国环境和发展会议第21项议程要求科学家和决策者之间完全、开放的数据和信息共享。[24]
1992年6月气候变化框架协定提出,促进完全、公开、及时的信息交换,包括与气候变化相关的科学、技术、社会经济和法律信息,以及不同战略引起的经济和社会影响的信息。[25]
1992年12月地球观测卫星委员会(CEOS)决议提出,卫星数据应该对从事全球变化研究、气候与环境研究和监测的所有用户实行无歧视的开放。所有项目产生的卫星数据不应该有排外使用期。[26]
1993年1月全球气候观测系统(GCOS)提出,要确保全球气候观测系统数据在非商业的科学和应用领域实现无限制的国际交换。数据应该以尽可能低的价格提供给用户。[27]
1993年3月联合国政府间海洋委员会(IOC)全球海洋计划数据管理政策指出,本政策的宗旨是促进对满足质量要求的海洋数据的完全与公开的共享。本着完全与公开原则,数据应该以尽可能低的价格提供给海洋研究人员,定价的第一原则是不超过满足特定用户要求所发生的复制和邮寄费用。[28]
1993年4月世界气候计划政府间会议(Intergovernmental Meeting of the World Climate Programme)气候议程宣言(Statement on the Climate Agenda)提出,为数据标准化、数据的完全和公开交换建立国际协作框架。[29]
1994年12月国际社会科学学会全体会议(International Social Science Council General Assembly)的社会科学数据管理政策(Social Science Data Management Policy)指出,其基本目标之一是实现所有数据库,对所有社会科学家,实行完全与公开的共享。数据应该以尽可能低的价格提供给研究人员,定价的第一原则是,不超过满足特定用户要求所发生的复制和邮寄费用。[30]
1995年6月政府间海洋委员会第18次会议提出,要继续培养快速、完全与公开交换数据的观念。[31]
3 对我国的借鉴意义
美国科学数据“完全与公开”获取政策对科学数据的共享和科技进步具有十分重要的作用,对我国的科学数据共享也具有重要的借鉴意义。
3.1 应通过法律制度保障科学数据公开
国家的立法保障是科学数据完全公开的制度基础,科学数据开放依赖政府的推动。目前,美国已经形成了以“完全开放”为基本国策的数据共享法规体系[32]。其中,制定信息公开法对于科学数据的公共获取具有突出重要的意义。美国信息自由法确立了政府信息以公开为原则,以不公开为例外的模式。政府信息具有公共财产的性质,一切人具有同等享受的权利,不受申请人资格的限制。政府对拒绝提供的信息负有举证责任。这些规定对于保障信息公开是一种法律制度。1996年10月,国会通过了“1996年电子信息自由法修正案”。1998年行政令要求根据政府信息变化对“个人使用公共信息指南”及时更新。1999年,国会修改有关条例,要求把由政府资助大学、科研单位、医院等非赢利机构科学研究产生的数据管理纳入科技基金管理合同。1999年修改后的“联邦信息资源管理政策”,详细规定了联邦信息资源管理,包括强化信息共享。美国科学数据共享的三个具体管理条例是联邦政府资助并委托的非赢利机构科学研究产生的数据管理条例、联邦政府投资私有企业所产生的数据共享管理办法“联邦获得条例”、对联邦政府的数据进一步详细规定的“联邦政府信息管理条例”。美国联邦政府通过这一系列立法过程,建立和不断完善以“完全与开放”为科学数据共享基本国策的法规体系。
我国科学数据主要产自政府或国家科学基金资助的研究。我国政府掌握了国家80%的信息资源,其中包括宝贵的科学数据。通过法律制度保障这些资源的公开是势在必行。
3.2 通过公益性开发与市场途径结合的方式实现对科学数据的增值开发
科学数据是信息时代一种可增值的资源,我国的科学数据开发应采用公益性开发与市场途径结合的方式。从目前情况看来,一些数据库采用高定价政策,结果用户少,市场小,限制了数据库服务业的发展;而另一些数据库采用低定价政策,使得用户增多,但建库单位亏损,只能靠政府资金支持,无法调动建库者的积极性[33]。对商业投资产生的科学数据和数据产品,如何进行商业化运行也没有摸索出一个适合中国国情的模式来。中国数据在国际数据市场上的份额约为全球的1%。数据供求的市场调节机制基本处于失灵状态。我国在科学数据的开发和共享中,应通过公益性开发与市场途径结合的方式,通过合理定价、市场机制、公平竞争和禁止垄断实现对科学数据的增值开发。加快信息资源开发利用市场化进程。积极发展信息资源市场,发挥市场对信息资源配置的基础性作用。打破行业垄断、行政壁垒和地方保护,营造公平的市场竞争环境,促进信息商品流通,鼓励信息消费,扩大有效需求。
3.3 在科学数据开发利用过程中应妥善解决知识产权问题
在科学数据开发利用过程中,应妥善解决知识产权问题,保护科学数据的产权以及科学家获取科学数据的权利,只有这样才能进一步促进科学数据的开发利用。
由于我国科学研究的经费主要来自政府,获得的科学数据的产权不够清晰,获得科学数据的成本很高。例如价值上亿元的海洋监测船,科研、石油、地质、水产等部门各有一艘;大型遥感卫星数据接收站,仅北京地区就有3台,而同样的设备整个欧洲才有两台。在一些单位,国家出钱购买的科研装备成为单位或部门的“私有财产”[34],获得的科学数据自然成为各个单位的财产。由于科学数据的成本太高,加上产权不清,科学数据不能建立有效的市场机制。加大保护知识产权执法力度,严厉打击盗版侵权等违法行为。健全著作权管理制度,建立著作权集体管理组织。完善网络环境下著作权保护和数据库保护等方面的法律法规。
3.4 在科学数据开发利用过程中应处理好与数据保护的关系
科学数据的开发利用过程中,应处理好与数据保护的关系,注意保护国家机密、军事机密、科学机密和个人隐私。为实现科学数据的最大价值,必须对其实行共享管理,“完全与开放”的共享政策为科学数据的开发和利用明确了方向,但在科学数据的开发利用中,必须注意对各种机密和个人隐私的保护,否则将损害他人利益以及国家利益。
3.5 完全与开放政策需要技术与标准支持
科学数据共享实施“完全与开放”政策需要技术支持,包括标准支持。科学数据建设过程中只有拥有良好的技术支持和完善的标准制度,才能实现“完全与开放”的共享。我国的科学数据共享难以取得长足发展的原因之一就是缺少适当的技术共享平台,没有完善的数据交换标准和管理制度。尽管国家科技计划的一些项目直接用于获取数据的支出高达项目总经费的50%,但由于缺乏健全的数据管理制度,项目结束后,科学资料仍会因离散分布而丢失损毁,无法共享,不能充分发挥其应有的作用。建立信息资源开发利用标准化工作的统一协调机制,制定信息资源标准、信息服务标准和相关技术标准。突出重点,抓紧制定信息资源分类和基础编码等急需的国家标准,并强化对国家标准的宣传贯彻。
注释:
①美国NIH对生物医学和行为研究产生的数据作了以下定义:“目前的项目管理政策声明将数据定义为任何介质上记录的信息,包括书面材料、胶卷、录制的声音、图片复制品、作图、设计或其他图形演示、操作手册、表格、框图、工作流程图、设备描述、数据文件、数据记录或计算机程序(软件)、统计记录以及其他研究数据。”见:从VHP看医学科学数据共享政策的重大意义和实施。http://shgy.jhgl.org/sjgx/listnews.asp