国内外科学数据管理办法研究进展
柏永青1,2,3杨雅萍1,3*孙九林1,3
(1.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;2.中国科学院大学,北京 100049;3.中国科学院地理科学与资源研究所国家地球系统科学数据中心,北京 100101)
摘 要: 科学数据是信息化时代重要的战略资源,高效管理和广泛流通是提升科学数据资源价值的关键途径。信息技术的快速发展和科技计划的大量投入促使科学数据资源数量日益激增,对信息时代的科学数据管理提出了更大的挑战。随着工业社会向信息社会的转变,国内外对科学数据管理的重视程度也在不断提高,各类数据管理机构和政府支撑部门通过建设数据集群、完善保障措施、优化发展理念、加大资助力度等方式,不断推动科学数据管理和共享走向成熟。本文通过综合调研国内外科学数据管理的理念、政策、实践及成果,分析总结了国际上科学数据管理的先进经验,对标我国同类研究中存在的问题与挑战,提出了未来一段时间内中国科学数据管理发展的方向和建议:(1)建议持续规范各类科学数据资源管理,完善保障机制,提升标准化程度;(2)建议加强对数据资源的深层次挖掘,实现从数据到信息、知识、智慧和决策的升华;(3)建议加强数据科学技术人才培养,从政府层面落实数据科学家计划,为科学数据管理提供人才支撑;(4)建议拓宽国际合作渠道,加强合作的力度和广度,提升现有国家科学数据中心的国际影响力,为我国数据科学发展建设提供战略指导,为信息化时代的综合国力提升凝聚核心竞争力。
关键词: 科学数据;数据管理办法;数据共享;数据平台;数据管理;科学数据管理;开放获取;数据评价
1 科学数据与科学数据管理
科学数据是指人类在自然科学或工程技术科学领域通过实验、观测、探测、调查、挖掘等途径获取积累的用于科学研究活动的原始基础数据及衍生数据[1],能够反映客观事物的本质、特征、变化规律[2-3]。科学数据传播速度快、影响范围广、开发潜力大、应用价值高,是信息时代支撑科技创新、管理决策和经济发展等不可或缺的基础支撑,是重要的国家战略资源和各国科技实力竞争的重要资本[4]。科学数据具有巨大的应用和开发价值,并在应用过程中不断增值,发挥科学数据资源最大价值的关键在于对其有效管理和广泛共享。因此,抓好科学数据高效管理,是面对全球信息化和知识经济的发展,实施数据支撑可持续发展的必然选择[5]。
科学数据管理是指利用计算机、信息和网络等技术对科学数据进行收集、存储、加工处理和共享应用的过程[6]。科学数据管理贯穿科学数据的全生命周期,通常包括数据的获取、集聚、保存、加工、发布共享和应用等[7]。如图1 所示,科学数据在整个生命周期过程中涉及众多数据科学理念和方法,通过循环流动,实现了从数据到价值的转变,联通了数据—>信息—>知识—>理论—>决策—>效益的价值链。早期的科学数据的管理经历了漫长的以天然材料或纸质为载体的手抄、印刷阶段,主要开展以立卷、归档为主体的保管档案活动和以供给为导向的被动服务。从20世纪50年代开始,基于科学研究的计算机系统和数据传输系统不断发展成熟,同时也催生了各类管理信息系统,信息技术的迅猛发展加速了科学数据的高效能存储、处理、加工和传播[5]。随着区块链、大数据、人工智能和机器学习等新技术的发展和应用,目前科学数据的管理已经走上信息化、规范化、便捷化、一体化的道路。国内外对科学数据管理的重视程度不断提高,在科研机构成立了大规模的科学数据中心,政府和行业部门也发布了完善的科学数据管理办法,各类数据出版期刊的影响力不断扩大,数据产权保护机制不断完善,科学家个人数据共享的意识也不断增强。
1.4 统计学分析 本研究采用SPSS 19.0统计软件进行统计,计量资料用表示,采用t检验;计数资料用例(%)表示,组间比较采用χ2检验,P<0.05差异具有统计学意义。
图1 科学数据全生命周期图
Fig.1 Life cycle diagram of scientific data
在Web of Science 文摘数据库中以“data management”为主题词进行检索,截至目前共有75,292条与数据管理相关的公开发表记录,其中科技期刊论文28,841 篇,会议论文25,277篇,专利发明25,140项。随着信息技术不断进步和发展,数据管理的技术和方法也在逐步走向成熟。图2 统计了过去四十年数据管理相关的出版物数量变化情况,21世纪以来数据管理类成果数量快速增长,其中1980-1989 年、1990-1999 年、2000-2009 年和2010-2019 年四个十年中数据管理相关出版物数量分别为860条、8,353条、27,937条和37,916条。图3和图4分别展示了数据管理相关成果最多的20 个国家和地区以及10 个学科方向,结果表明数据管理研究更多地发生在中国、美国和欧洲等科学研究和信息技术较发达的国家和地区,科研信息化已经成为21 世纪科技创新的战略举措。其中中国和美国的出版物数量占据全球数据管理类成果总量的37%以上,接近于排名3-20 的18 个国家出版物数量总和。就学科而言,计算机科学和工程学成为信息化程度最高的学科领域,工程和信息技术为科学数据管理提供技术支撑,同时数据管理过程中的多学科交叉现象较为明显。
图2 Web of Science数据库中不同年份“Data management”相关的出版物数量
Fig.2 Number of publications related to"data management"in different years in the Web of Science Database
随着全球各行业领域对科技活动的投入不断增大,科学数据的数量呈倍数甚至级数增长,信息时代的数据管理成为当前各领域科学研究所面临的核心问题,也将成为未来数据科学发展壮大的关键保障。本文通过对国内外各类科学数据管理办法、政策、法规及模式开展深入调研,总结国际上在科学数据管理实践过程中积累的先进经验和理念,发现我国科学数据管理研究存在的问题和面临的挑战,提出未来一段时间内中国科学数据管理发展的方向和建议,为我国数据科学建设提供指导,提升我国数字化时代的核心竞争力。
2 国外科学数据管理办法发展现状
鲁列斯三角形可以紧紧地嵌在一个正方形内部,即正方形的各边上都有鲁列斯三角形边缘上的点,如图2.设鲁列斯三角形的顶点A、B、C间距离为1cm,则正方形边长也是1cm.鲁列斯三角形三个顶点沿着正方形边界行进一周的过程中,正三角形ABC的外心T也在运动.
企业要想从根本上提高自身的财务管理水平,就需要建立健全财务风险管理制度。而现在的大多数国有施工企业都没有一套完整的财务风险管理体系和严格的规章制度,虽然设置了风险管理制度,但是内容却过于简单,执行力也较低,只注重会计核算,而忽视了对财产进行分析以及对收入和资产的管理。因此,在企业的管理过程中,财务管理的优势并没有得到充分的发挥。除此之外,国有施工企业并没有将权力分散到财务管理部门,权力高度的集中在高层的管理者手中,导致财务人员对财务管理项目不能及时有效的进行审计和监督,最终造成资金的浪费,财务风险的加大。终究以上,其原因都是由于缺乏健全的财务风险管理制度。
一般说来,一千位教师就有一千种讲课设计。宽泛地说,这些同文本的个案设计都算作是同课异构。但是我们并不能说同课异构是随心所欲地构造教学。无论怎样创造性地开展教学,也都离不开对文本内容、文本特征和教学手段最优化的考虑。
图3 Web of Science数据库中不同国家/地区“Data management”相关的出版物数量
Fig.3 Number of publications related to"data management"in different countries in the Web of Science Database
图4 Web of Science数据库中不同学科“Data management”相关的出版物数量
Fig.4 Number of publications related to"data management"in different disciplines in the Web of Science Database
(1)科学数据管理工作起步较早
2013 年12 月,欧盟正式启动“地平线2020”计划,旨在整合欧盟各国的科研资源,提高科研效率,促进科技创新,进一步推动欧盟“开放科学”战略[24]。2016 年4 月,欧盟发布《通用数据保护法案》,赋予公民“知情权、访问权、反对权、个人数据可携权、被遗忘权”五种权利,为公民隐私数据保护提供法律保障[10]。2016 年10 月,法国政府颁布了《数字共和国法案》(Digital Republic Law),该法案除保障互联网用户对数据的无偿获取和使用外,更加注重保护用户个人隐私[25]。2018 年12 月,美国国会通过《开放政府数据法案》,推动“非敏感”政府数据公开,并在各联邦机构任命首席数据官来监督数据开放工作。
(2)已建成大量持续运行的科学数据管理机构
数据管理机构是开展科学数据管理的责任主体,通过制定数据管理规范和搭建数据管理平台来实现科学数据的高效管理。国际科学联合会(ICSU)是目前科学界最有权威的非政府国际组织,在其指导下成立了众多科学数据相关组织和机构[12]。其中,世界数据系统(WDS)以确保广泛的数据获取、长期的数据管理和便捷的数据服务为发展宗旨,截止2019年9 月,WDS 共有122 个成员组织,包括80 个正式成员、11 个网络成员、11 个合作伙伴、20个协作成员;科学与技术数据委员会(CODATA)作为目前最重要的科学数据国际组织,在提高数据质量、加强数据管理和推动数据传播方面都取得了众所瞩目的成绩[13]。
1985年,NSF为促进大学及政府机构的研究工作,建设了国家超级计算机应用中心、圣地亚哥超级计算机中心和匹兹堡超级计算机中心等六个超级计算机中心,长期为科学研究提供数据和计算需求[14]。美国从1990 年开始建设分布式、高效使用的国家级数据中心群,对公益性科学数据实行“全面开放”共享[15]。1995 年美国联邦政府正式启动国家级数据信息共享网络项目,由白宫直接协调管理,进一步为国家数据中心群建设提供了政府保障[16]。
在学科领域方面,国际上率先成立了大量数据集群中心和国际科学计划。如社会科学领域的南非开普敦大学DataFirst数据中心、生物学领域的美国Dryad 数据仓储、面向基因科学的美国生物技术信息中心GenBank 数据中心、地球科学领域的哥伦比亚大学CIESIN 数据中心、德国PANGAEA 数据中心、美国橡树岭国家实验室分布式存档中心、美国国家冰雪数据中心、日本气象厅世界温室气体数据中心和法国斯特拉斯堡天文数据中心等,以及世界气候研究计划(WCRP)、国际地圈生物圈计划(IGBP)、国际全球环境变化人文因素计划(IHDP)、国际生物多样性计划(DIVERSITAS)等都在开展科学研究的过程中,广泛积累和传播科学数据及其产品,在国际上形成了较大影响力。
(3)数据管理政策机制较为完善
多元数据形态和内容为科学数据的统一管理提出了较大的挑战,为保障数据资源科学管理和有效共享,国际上陆续出台了各类信息和数据管理相关的法律、政策和机制,推动了数据管理从无序到有序、从单一到整体、从封闭到重用的发展。美国在1966 年颁布实施了《信息自由法》,为科学数据的管理及共享奠定了稳固基础[17-18]。1993 年3 月,联合国政府间海洋委员会(IOC)出台《全球海洋计划数据管理政策》,规范了海洋领域科学数据管理的方式[19]。1995 年7 月,欧洲议会通过《数据库法律保护指令》,以法律、法规和行政条例的形式提升知识产权保护力度[20]。1997 年6 月,ICSU和CODATA 联合成立数据与信息特别任务组,从法律、经济和科技等方面提出科学数据共享及数据库权益保护的建议,并在2000 年联合发布“全面开放(Full and Open)”的数据共享核心原则[21],为推动科研教育领域数据资源免费共享、跨界流动和无限重用提出了科学指导。
科学数据的开放共享为科研成果的广泛传播和重复利用打通了渠道,而强制性开放获取逐渐成为主流科研机构的数据管理举措。美国科学基金会2010 年1 月出台的项目指南规定所有被资助的项目在提交的申请书中必须包含不超2 页的数据管理计划,对项目成果数据的类型、数据标准、数据获取和共享政策、数据存档与保存计划等进行详细描述[2],作为项目执行期和结题后数据管理的依据。为推动联合国气候变化委员会全球气候服务框架实施,世界气象组织(WMO)和IOC 于2011 年出台《全球海洋气候资料系统2020 发展战略和实施计划》,通过在全球范围内建设全球海洋和海洋气候资料中心,并发起海洋数据标准示范,制定统一的国际海洋标准来促进全球海洋资料和信息的便捷管理与共享[22-23]。
回溯科学数据管理的发展历程,科学数据的概念最早产生于“国际地球物理年”(1957-1958 年)期间的世界数据中心(WDC)建立初期[8]。1960 年,美国成立国家大气研究中心,最早开始对地球科学数据的建模、收藏和保存工作[9]。1971 年,美国卫生部、能源部与国家科学基金委员会(NSF)共同资助创建的蛋白质数据银行(PDB)是最早的数字数据馆藏。1995年,英国经济和社会研究委员会出台数据管理计划,要求对其资助产生的科学数据进行高质量管理,实现长期保存并尽可能对外共享[10]。2009年5月,美国政府启用data.gov网站,为公共数据资源的采集、发布、管理、下载等提供了完整的科学运作体系[7]。2011 年,科学数据管理作为研究主题之一在欧洲数字图书馆理论与实践国际会议上展开讨论。同时,英国成立数字管理中心主办每年的专业期刊和学术年会[11]。
(4)科学数据管理理念不断创新
以科学数据价值最大化为需求导向,随着信息化技术的日益成熟,科学数据管理已从实践探索走向全面布局,数据采集和归档、共享和重用、元数据格式和类型等多方面的标准规范逐步完善,科学数据管理理念不断走向创新[26]。2001 年10 月,在英国国家空间中心“数字档案、图书馆和e-Science”研讨会上首次提出数字管理(Digital Curation)概念,实现了数据管理和数字保存的统一整合。微软首席研究员、图灵奖获得者Jim Gray 在2002 年倡导创建数据馆藏机构来保障科学数据的永久使用,并在2007 年提出基于科学数据全生命周期的数据管理涵盖标准制定、数据映射、元数据创建、语义注释和文献链接等过程[27]。2007年NSF 启动DataNet 计划,昭示着数据管理作为一个新兴研究领域的兴起[28]。2014 年1 月,在荷兰莱顿举办的“Jointly Designing a Data FAIRPORT”学术研讨会中提出“可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)”的FAIR 原则,成为现代科学数据共享的基本理念[10]。
随着国家对科学数据管理与共享的重视程度不断提高,我国科技资源管理工作不断取得新进展。1982年,科学数据库及信息系统作为后10 年的重大基础需求和保障被列为中科院“七五(1986-1990 年)”重点建设项目,于1987 年启动建设,并获得了1997 年“中国科学院科技进步一等奖”和1998年“国家科技进步二等奖”,形成了以研究所为单元的科技资源建设和管理模式[42]。从20 世纪初开始建设的地球系统科学数据共享国家平台构建、关键技术与应用服务项目获得了2014 年“国家科技进步二等奖”,推动了我国科技资源管理和共享研究的长效发展。从2014 年开始,CODATA 中国委员会、国家科技基础条件平台中心、中科院办公厅每年组织召开一次“中国科学数据大会”,为科学数据管理与开放共享政策、技术应用、知识产权保护及基础设施建设等提供新思想、汇聚新能量。
3 国内科学数据管理办法发展现状
半个世纪以来,我国投入大量资金和精力开展了大规模的测绘、地质调查、气象观测、海洋观测、水文观测、环境监测、地震监测等科技事业性工作,通过一系列科技计划支持了各行业领域的科学研究。随着各类科技资源管理与服务政策机制不断完善与成熟,我国先后建设了一批国家科学数据中心、国家生物种质与实验材料资源库、大型科学工程、重点实验室、工程中心以及野外观测研究网络,对各类科技资源进行了整合管理和共享服务,在支撑科学研究、经济发展和生态保护方面取得了显著成效。
(1)国家对科学数据管理的重视程度不断提高
科学数据的管理和共享一直是我国科技和科技管理工作者的关注重点。1982年,中国科学院正式提出科学数据库及其应用系统建设项目。1999年,科技部在科技基础性工作和社会公益性研究专项中,启动了科技基础数据库建设。2001 年10 月,科技部率先提出“实施科学数据共享工程,增强国家科技创新能力”的建议,并先后启动气象、地球系统、水文、海洋、地震、国土、农业、林业、人口健康等9 个领域科学数据共享试点工程,从国家层面上翻开了我国科学数据管理和共享新的篇章[37]。
2004 年,中科院发布《中国科学院科学数据库数据共享办法(试行)》,从科学数据共享管理机制、数据共享角色、数据共享方式和知识产权保护等角度规范了科学数据管理的原则、权利和义务及其行为规范[21]。同年7 月,科技部等四部委联合印发《2004-2010 年国家科技基础条件平台建设纲要》,大力推动了我国科技资源整合共享[38]。2005 年,科技部联合财政部设立平台建设专项,成立国家科技基础条件平台中心,推进科技基础条件平台和科学数据资源的专业化管理。2015 年9 月国务院印发《促进大数据发展行动纲要》,明确提出发展科学大数据工作,积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据成果逐步开放共享,标志着我国科学数据管理和共享进入新的历史阶段[39]。
家庭教育问题往往是 “于细微处见精神”,需要年轻父母对问题能明察秋毫并防微杜渐。但不同个性的家长,对家庭教育问题的觉察力有较大的差异。比如,情绪型性格的年轻父母,处理事情习惯“大大咧咧”且容易被情绪左右,对孩子的照管和教育情绪化严重,常常出现粗枝大叶不细心的毛病,对细节的敏感度和关注度不够,遇事急躁不冷静,他们容易忽略孩子和家庭生活中的很多问题。而理智型性格的年轻父母,又可能出现过度关注,过度敏感,导致对家庭教育问题的觉察不客观。
(2)科学数据中心建设逐步走向完善
长期以来,中国科学院一直是国内科学数据管理平台建设和实践的先行者,在国家各部委、各行业部门的支撑下,我国科学数据管理机构不断发展壮大。从2001 年建成第一个气象科学数据共享试点工程开始,我国各学科领域科学数据共享工程及数据管理平台逐步完善。“十一五”(2006-2010年)期间,科技部、财政部共支持14 个科学数据共享平台建设,构建了由主体数据库、科学数据中心或数据网、门户网站构成的三级结构的数据管理与共享服务体系[37]。“十二五”(2011-2015 年)以来,气象、地球系统、农业、林业、地震、人口健康等6 家数据共享平台纳入国家科技平台体系,持续开展运行和共享服务工作,并获得财政部、科技部给予的后补助经费支持。
基于科学数据明显的资源属性和在日益激烈的国际竞争中的主动性,许多发达国家和地区以及国际科学组织已开展了以全生命周期为主要导向的科学数据管理工作,通过出台数据管理政策、成立数据管理机构、搭建数据管理平台、培养数据管理人才、创办数据出版期刊等方式推进科学数据管理工作。通过总结,国外科学数据管理办法发展主要体现在以下四点:
2012 年3 月,中国工程院启动中国工程知识中心建设项目,截至目前已建成1 个总中心和27 个专业分中心的组织架构体系,汇聚和挖掘了我国工程科技相关领域大量数据资源,为国家工程科技领域重大决策、重大工程科技活动、企业创新与人才培养提供信息支撑和知识服务,实现了从信息——数据——知识——智慧的深层次挖掘和全站式服务。2018 年2月,中国科学院启动A 类战略性先导科技专项“地球大数据科学工程(CASEarth)”,为资源、环境、生物、生态等领域学科深度融合、地球大数据集成管理、政府宏观决策等提供了科技支撑[40-41]。2019 年1 月,CASEarth 项目面向全球发布地球大数据共享服务平台,集数据管理、计算挖掘与共享服务为一体,推动形成地球科学数据共享新模式。为规范管理国家科技资源共享服务平台,完善科技资源共享服务体系,2019 年6 月,科技部、财政部发布《国家科技资源共享服务平台优化调整名单》,公布了20 个国家科学数据中心和30 个国家生物种质与实验材料资源库,从此拉开了我国国家级科学数据中心建设的序幕。
(3)科学数据管理的探索与实践成效显著
随着知识产权保护的重视程度不断提高,数据出版成为当前科学数据管理和共享的新举措,数据论文和数据期刊的出现进一步推动了科学数据管理和共享[29]。各大出版集团和期刊也积极研究制定相应的数据出版政策[30],通过“数据提交、同行评审、数据发布、数据永久存储、数据引用和数据影响评价”等环节发布科学数据,分配统一的资源标识符(如DOI等),在保护数据生产者权益的基础上,推动科学数据资源的最大化使用[31]。2001年,CODATA 创办数据科学杂志Data Science Journal,旨在出版科学研究领域数据及数据库的管理、传播、使用和再利用的论文[32]。从此,数据科学作为一门独立的学科在科学界正式被确定下来。美国地球物理学会及旗下全部学术期刊要求作者必须把论文关联的原创数据在论文发表前公开出版在AGU 认定的全球203 个数据仓储中心之一。Earth System Science Data要求所有提交的数据论文都要经过严格的同行评议,以保证数据的真实性和准确性[33-34]。Springer Nature为旗下期刊制定了四种类型的数据共享政策,从鼓励不强制、鼓励共享且须提供数据可用性声明、强制性要求共享数据和明确要求对数据进行评审等方面提出了科学数据发表的多级要求[35]。Nature 出版集团在2014 年发行数据期刊Scientific Data,致力于发表有价值的科学数据产品及对应的元数据信息,促进科学数据的开放共享和重复使用,加速科学发现。基于FAIR 原则,Nature Scientific Data 期刊遵循信用(Credit)、重用(Reuse)、质量(Quality)、发现(Discovery)、开放(Open)和服务(Service)六大原则[10]。类似地,Elsevier、Wiley、Taylor &Francis 等出版集团也发布了类似的数据发表政策[36]。
2017 年12 月,《信息技术 科学数据引用》(GB/T 35294-2017)国家标准正式发布,从描述方法、详细说明、引用格式等方面规范了科学数据引用,为数据生产者知识产权提供保障。2017 年1 月,中国科学院国家天文台和阿里云计算有限公司联合共建“天文大数据联合研究中心”,推动了科学大数据与信息网络技术间的深度融合,加速了大数据时代天文学科信息化进程。2017 年10 月,国家科技图书文献中心正式签署开放获取2020 计划倡议《关于大规模实现学术期刊开放获取的意向书》,代表国家级文献情报机构积极参与推动学术期的开放获取。在国际合作方面,中国于1984 年加入CODATA 并成立中国委员会。1988 年开始,中国科学院联合有关政府部门和科研教育机构,陆续组建了世界数据中心中国中心(WDC-D)和国际科技数据委员会中国委员会,包括海洋、气象、地震、地质、地球物理、空间、天文、冰川冻土和可再生资源与环境共9 个WDC 中国学科中心,在科学前沿领域面向基础研究数据开展国内外交流与服务[43-44]。
在数据出版方面,中国科学院地理科学与资源研究所于2014年6月率先创办《全球变化科学研究数据出版系统(中英文版)》,并与地理、资源和生态等领域多家期刊建立合作关系,在出版科技论文的同时实现支撑数据、元数据、数据论文的关联一体出版。2015 年8月,《中国科学数据(中英文版)》在中国科学院计算机网络信息中心创刊,进一步推动了我国科学数据出版与数据引用发展。2018 年2 月,全球地球科学领域首个大数据刊物《地球大数据(Big Earth Data)》创刊,鼓励作者在发表学术论文的同时把数据和算法等存储在被认可的公共存储器中,促进科学数据的共享和利用。此外,科学家个人也愿意把科学数据产品通过国家数据中心等数据管理和共享机构进行发布,如国家地球系统科学数据中心目前已发布了多位国内地球科学领域知名科学家个人及团队生产的数据产品,由国家数据中心管理和保存,并向社会公众进行免费共享。
2018 年2 月,科技部和财政部联合印发《国家科技资源共享服务平台管理办法》,明确了科技平台各级管理部门及依托单位的职责与任务,对各类科技资源共享服务平台的运行服务及考核评价提出了要求。2018 年3 月,国务院办公厅印发《科学数据管理办法》,对政府预算资金支持开展的科学数据采集生产、加工整理、开放共享和管理使用等进行了规范,提出科学数据分级管理、安全可控、充分利用的原则,按照“开放为常态、不开放为例外”的共享理念,对科学数据的生产者和使用者提出了明确要求[1]。2019 年2 月,中国科学院编制《中国科学院科学数据管理与开放共享办法(试行)》,对中国科学院数据管理与开放共享的总体原则、职责分工、管理要求、保障机制及安全保密等方面的内容进行了明确,着重强调了对科研项目和科技论文产生的科学数据的汇交管理,规划了中国科学院科学数据中心体系架构与运行模式。
为了更好地落实水利工程的环保施工,需要建立一些环保机构,同时考虑到环境因素,进行工程施工时,需要加强整个过程的管理和监督。管理机构采取以下措施:(1)完善合同中有关环保的内容,进一步加强施工期间对环境的保护;(2)制定环保规划方案;(3)加强环保工作的监督工作;(4)不断加强环保工作的宣传和培训工作;(6)加强环保项目的验收工作。
(4)数据汇交实践为科学数据管理提供保障
为规范国家重点基础研究发展计划(973)资源环境领域项目数据汇交管理工作,科技部于2008 年7 月成立“973 计划资源环境领域项目数据汇交管理中心”,并发布《973 计划资源环境领域项目数据汇交管理方案》,由汇交中心负责接收、保存、管理973 计划项目产生的数据,并进行对外共享服务[45]。为进一步整合集成国家科技基础性工作专项科技资源成果,科技部于2011 年启动实施了国家科技计划项目科技资源的汇交与共享工作[37],并颁布《科技基础性工作专项项目科学数据汇交管理办法(试行)》,由汇交中心联合各领域国家科学数据中心开展数据汇交工作。截至2019年9月,已有253 个2014 年之前立项的科技基础性专项项目完成数据汇交,汇交数据量超23TB;已有94 个2014 年之前立项的973 资源环境领域项目完成数据汇交,汇交数据量超8TB。对于汇交后满足共享要求的项目成果数据,由国家科学数据中心向公众开展无偿共享服务。
农林院校一体化实践教学体系注重学生能力的培养,反对简单地认为实践教学等同于加强学生动手技能,一体化实践教学协调发展学生“知识+能力+素质”,将教学以能力培养过程进行开展;进行职业分析,确定学生职业的技术、技能、技巧和规范,确定若干“关键技能”,并使之课程化,并进行量化管理,逐步使导游专业操作技能教学知识化、规范化、系统化和科学化;改革学生实习制度,实行专业技能实习校内模拟达标制。突出农林教育的特点,引导学生通过多学科融合创新。
4 国内科学数据管理面临的问题及挑战
随着我国对科技投入力度的不断加大,各类科技计划项目和科学研究工作产生积累了大量科学数据。国家对科学数据管理和共享的重视程度逐步提高,相关政策机制也在不断完善,《科学数据管理办法》的出台更是把我国科学数据管理和共享工作推向了新高度。但和发达国家数据管理进展相比,目前我国这方面的工作还面临较严峻的问题和挑战。
(1)各类科学数据规范化程度不一致
如何保证全社会科学数据资源的持续流动和规范管理,最大限度地发挥科学数据战略资源的价值作用,已成为当前全球科技发展面临的新挑战。因学科的复杂性和交叉性,各类科学数据存在类型、格式、描述和存储方式的差异,导致不同学科领域的科学数据往往难以基于同类标准进行约束和规范。部分数据资源建设缺乏整体布局,大量数据重复生产却使用率极低,数据私人占有现象明显,专业化数据资源建设和服务能力有待提高。
如地球科学领域数据大多涉及空间属性,有其特定的空间数据库格式进行存储,难以用传统关系数据库进行管理和规范,而空间数据库的存取一般都需要专业软件。为了使公众全方位了解数据资源、快速把握数据资源的质量和元数据信息,国家地球系统科学数据中心在长期实践过程中创新性地提出了“六位一体”的数据管理模式,按照数据实体、数据说明文档、数据缩略图、数据分类、元数据表和数据样例的组织方式,规范化管理每一条科学数据,在保证数据安全的前提下为公众提供了全面的数据说明和预览信息,为用户快速搜索、获取和理解数据提供了保障,对系统管理和用户服务都提供了极大的便利。但通过调查发现,目前仍有很多领域的数据资源建设都存在不规范的情况,元数据信息描述不完整时有发生,在最终拿到数据之前无法了解数据内容和质量信息等情况普遍存在,数据资源生产方式、使用流程、精度水平、引用方式等不够明确,数据质量无法保证,从而对科技支撑带来影响。
(2)数据挖掘和再分析能力不足
大量科技投入带来科学数据数量的快速增长,但各类数据资源的利用程度严重不足,甚至许多高价值的科学数据并未在国内得到充分的共享和使用就流向国外。究其原因,一是因为公众对目前科学数据资源的现状不够了解,不知道有哪些数据资源;二是科学数据管理机构对数据挖掘和再分析的能力不足,只是简单地把数据收集起来,难以发现数据背后的价值信息和增值渠道。数据的复杂性不仅体现在数据本身,更体现在多源异构、多时相、多空间之间的交互动态性,需要将长时间序列或者高维图像等复杂冗余数据进行降维或分解,从而挖掘处深层次机理和规律,发挥数据的价值。如何从大量冗余数据中挖掘出可用知识,通过大数据分析得到重要结论,支撑国家重大决策和经济发展,是我国各类科学数据管理机构当前甚至长期的建设任务。
(2)通过风沙对沥青路面各种破坏作用的分析可知,在路面结构设置时必须采取合理的设置方式,采用相应的处理措施。沙基封层的设置可以有效缓解沙漠地区沥青路面此类病害的发生。二级以上高等级沙漠公路沙基以上应设置封层,本文在基层以上设置下封层,可以有效阻止沙漠路面病害的发生。考虑到一级公路交通量大,且沙漠地区温度条件恶劣,故表面层选用改性沥青混凝土面层。
(3)数据管理专业技术人才欠缺
随着信息化、网络化、知识化、全球化时代的融合发展,信息技术成为各学科领域发展和建设的强大支撑。科学数据的生产、挖掘、分析、管理、共享除了需要来自政府的关注和财力的投入,更需要一批经验丰富的科学和信息技术支撑人员[46]。数据价值的挖掘与技术发展紧密相关,不断变化的科研环境又使得数据处理的复杂程度极具挑战性,这对数据人才提出了非常高的能力要求。目前我国在数据领域培养国际化人才方面与发达国家差距甚远,特别是一些关键性领域尚属空白。同时,我国尚未建立对从事科学数据工作人才的评价和激励机制,而现有的针对科研人员的以论文、专利等为主要指标的评价体系,不能适应科学数据资源工作特点。大量从事科学数据生产、加工和挖掘的专业人才,得不到应有的重视和激励,导致大量人才流失,为我国科学数据管理研究带来极大阻碍。
(4)国家科学数据中心的国际影响力有待进一步提升
国家科学数据中心成立初期,虽然在国内各领域已经走在了数据管理和共享的前列,但在国际竞争方面仍然处于并跑甚至跟跑阶段。目前大多国内科学数据中心数据资源建设和发展规划多面向本学科领域、特定研究地区,没有紧跟国家宏观战略和国际合作倡议需求,缺少面向全球的国际数据资源建设,国际合作能力不足。大多世界组织和团体仍然由发达国家主导,中国在全球气候变化、资源开发、环境保护、智能制造等方面的发言权和影响力远远不够。科学无国别,数据无国界,国家科学数据中心作为国内科学研究和经济发展的支撑,理应破除信息枷锁,打通数据壁垒,面向全球发展,提升综合实力。
5 对我国科学数据管理的建议
综上所述,我国的科学数据管理领域实践日趋成熟,但领先发展仍需更多积累和实践,不同学科领域间数据管理水平仍存在显著差异,信息技术的灵活运用与科学数据管理专业人才的培育将是提升科学数据管理发展的重要推动力量,加强各类数据管理机构国际合作能力建设是提升中国科学数据管理和共享走向世界的重要基石。
二是从可行性角度而言,域外国家规章司法审查的实践经验,特别是行政诉讼制度较为发达的西方国家对于行政规章的司法监督方面的具体做法可以给我们提供有益的借鉴,并且将政府规章纳入行政诉讼附带审查并不影响现有司法体制和行政体制的运行与衔接,目前法院在行政诉讼审判依据中将规章作为“参照适用”的定位,本身在某种程度上就有一种“审查”的意味,将规章纳入行政诉讼附带审查也是目前司法体制可以承受的范围,没有改变人民代表大会这一根本政治制度,也不是西方意义上的“三权分立”,根本上都是全面深化依法治国、将权力纳入监督视野的必要举措。
(1)持续规范各类科学数据资源管理
完整统一的科学数据管理和共享标准,是大数据时代加强科学数据交叉融合的重要基础和保障,国家各科学数据中心应根据本领域专业特色和科学数据的特点,着力加强其薄弱环节的管理,制定适合本领域科学数据管理发展需求的标准规范,促进数据资源的高效采集和获取、分析和处理、共享和服务。根据国家《科学数据管理办法》的总体要求,各行业部门在其上级主管部门的统一协调下,设计通用标准体系,衔接各领域专业标准和指导标准,加强科学数据生产、发布、存储、使用环节的标准化和规范化管理。同时,加强行业标准与国家标准、国际标准之间的衔接,加强引入或牵头制定科学数据的相关国际标准,提升科学数据科技创新支撑保障能力。
(2)加强对表层数据的挖掘分析
对海量异构科学数据进行综合分析和深入挖掘,是大数据时代数据密集型科学研究的主要特点和必要基础,是科技创新和科学发现的重要途径。世界各国和知名科研机构在抢占数据资源的同时,也在积极探索和研发科学数据资源和信息挖掘技术和方法。建议加大对表层科学数据的分析挖掘技术方法研究,围绕国家重大需求,利用机器学习、人工智能、大数据分析等方法,促进多类型科学数据资源融合,揭示冗余数据背后的变化规律和模式,实现从信息——数据——知识——智慧的转变,为管理部门提供决策咨询。
(3)落实数据科学家计划
科学数据管理涉及数据收集、加工、整理、保存、共享服务和系统运行维护,是一项专业性强、技术性强的工作,需要专业化的人才来支撑。数据科学家是新生的数据分析专家,具备解决复杂问题的技术能力,拥有探索、发现问题的好奇心,擅长在数据中寻找知识,借助数据解决问题。建议从国家层面尽快落实数据科学家培育计划,加强科学数据人才建设,积极吸收信息技术、信息管理和各学科领域专业人才充实科学数据管理队伍,建立一支既懂科学数据技术又懂领域科学研究的多层次复合型人才队伍,助力我国科学数据管理事业发展。
党的十八大明确指出要重点建设生态文明,而绿色营销既是生态文明建设的内在体现,又是生态文明建设取得成果的市场检验。所以,生态文明建设必须依靠大力发展绿色营销,只有绿色营销落到实处,生态文明建设才会有成效。[1]砀山县1999年被批准为国家生态示范县,2002年底被认定为全国无公害农产品(水果)生产示范基地县达标单位,这为砀山酥梨绿色营销奠定了良好基础。
(4)加强国际合作,提升数据中心的国际影响力
全球经济一体化发展对我国国家实力提出了更高的要求。数据作为信息化时代最重要的战略资源,是支撑国家经济建设和科学研究的重要基础。国家科学数据中心是我国科技数据资源的集群,引领我国数据科学发展和数据人才培育。目前我国部分领域的科技发展已经国际领先,有能力也有责任把中国制造推向世界,把中国科学数据发展理念推向全球,建议国家科学数据中心充分利用国内外已有条件,加强与国际相关科研机构、重大科学数据组织的交流与合作,借鉴国外科学数据共享的成功经验,充分利用国际资源提升我国科学数据管理和共享利用水平。
参考文献
[1]国务院办公厅.科学数据管理办法[EB/OL].[2019-10-10],http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.General Office of the State Council.Measures for scientific data management [EB/OL].[2019-10-10],http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
[2]司莉,邢文明.国外科学数据管理与共享政策调查及对我国的启示[J].情报资料工作,2013,34(1):61-66.Si L,Xing W M.Scientific Data Management and Sharing Policies in Foreign Countries:Investigation and Inspiration to Us [J].Information and Documentation Services,2013,34(1):61-66.
[3]杨静,赵俊杰.国外科学数据管理情况研究[J].全球科技经济瞭望,2019,34(1):26-31.Yang J,Zhao J J.Research on Foreign Scientific Data Management [J].Global Science,Technology and Economy Outlook,2019,34(1):26-31.
[4]国家科技基础条件平台中心.国家科学数据资源发展报告[R].2015.National Science and Technology Infrastrusture.National Scientific Data Resource Development Report[R].2015.
[5]黄鼎成,郭增艳.科学数据共享管理研究[M].北京:中国科学技术出版社,2002.Huang D C,Guo Z Y.Research on Scientific Data Sharing Management [M].Beijing:China Science and Technology Press,2002.
[6]张迎,张志平,梁冰.科学数据管理应用模式的研究[J].情报工程,2017,3(4):71-77.Zhang Y,Zhang Z P,Liang B.Research on Scientific Data Management Application Model [J].Technology Intelligence Engineering,2017,3(4):71-77.
[7]王卷乐,王明明,石蕾,等.科学数据管理态势及其对我国地球科学领域的启示[J].地球科学进展,2019(3):86-95.Wang J L,Wang M M,Shi L,et al.The Situation of Scientific Data Management and Its Enlightenment to Earth Sciences of China [J].Advances in Earth Science,2019(3):86-95.
[8]NICOLET M.The International Geophysical Year(1957-1958):Great achievements and minor obstacles[J].Geojournal,1984,8(4):303-320.
[9]周小刚,罗云峰.美国国家大气研究中心优先研究领域新特点[J].地球科学进展,2006,21(7):751-756.Zhou X G,Luo Y F.The New Characteristics of Research Priorities of National Center for Atmospheric Research [J].Advances in Earth Sciences,2006,21(7):751-756.
[10]张丽丽,温亮明,石蕾,等.国内外科学数据管理与开放共享的最新进展[J].中国科学院院刊,2018,(8):774-782.Zhang L L,Wen L M,Shi L,et al.Progress in Scientific Data Management and Sharing [J].Bulletin of Chinese Academy of Sciences,2018,(8):774-782.
[11]崔宇红.E-Science环境中研究图书馆的新角色:科学数据管理[J].图书馆杂志,2012(10):20-23.Cui Y H.Emerging Role of Research Library in the Context of E-Science:Scientific Data Curation[J].Library Journal,2012(10):20-23.
[12]石林.国际科学联合会理事会(ICSU)简况[J].力学与实践,1983,5(2):62-63.Shi L.Brief introduction to the International Council of Scientific Unions (ICSU)[J].Mechanics and Engineering,1983,5(2):62-63.
[13]李慧佳,马建玲,王楠,等.国内外科学数据的组织与管理研究进展[J].图书情报工作,2013,57(23):130-136.Li H J,Ma J L,Wang N,et al.Research Review on Scientific Data Organization and Management at Home and Abroad [J].Library and Information Service,2013,57(23):130-136.
[14]冯桂安,林新华.国内外超算中心发展模式研究与建议[C].全国高性能计算学术年会,2014.Feng G A,Lin X H.Research and Suggestion on the Development Model of Super-computing Centers at Home and Abroad [C].2014 Annual Meeting of HPC China,2014.
[15]尚卫卫.气象数据分布共享管理的关键技术研究[D].国防科学技术大学,2010.Shang W W.Research on Key Technology for Sharing Distributed Data on Meteorology [D].National University of Defense Technology,2010.
[16]孙九林.加强信息资源开发利用与共享,提高信息化建设效率[C].国家信息化发展论坛,2007.Sun J L.Strengthen the Exploitation and Sharing of Information Resources and Improve the Efficiency of Information Construction [C].National Information Development Forum,2007.
[17]胡建伟,许岩岩.美国信息共享模式对我国地理信息共享机制的启示[J].地域研究与开发,2009,28(2):41-43.Hu J W,Xu Y Y.The Revelation of American Information Sharing Model to Chinese Geography Information Sharing System [J].Areal Research and Development,2009,28(2):41-43.
[18]司莉,庄晓喆,王思敏,等.2005 年以来国外科学数据管理与共享研究进展与启示[J].国家图书馆学刊,2013,22(3):40-49.Si Li,Zhuang X Z,Wang S M,et al.The Progress and Enlightenment of Scientific Data Management and Sharing Research in Abroad Since 2005[J].Journal of the National Library of China,2013,22(3):40-49.
[19]阎季惠,李景光.全球海洋观测系统及我们的对策初探[J].海洋技术学报,1999,(3):14-21.Yan J H,Li J G.Global Ocean Observing System and the Countermeasures of China [J].Journal of Ocean Technology,1999,(3):14-21.
[20]薛虹.数据库的法律保护与反垄断[J].知识产权,1998,(3):20-24.Xue H.Legal Protection and Antitrust of Databases[J].Intellectual Property,1998,(3):20-24.
[21]虞路清,肖云,黎建辉.科学数据库数据共享政策研究与实施[C].科学数据库与信息技术学术研讨会,2006.Yu L Q,Xiao Y,Li J H.Research and Implementation of Data Sharing Policy in Scientific Databases [C].8th Symposium on Scientific Database and Information Technology,2006.
[22]杨锦坤,杨扬,于婷.国际海洋资料管理现状与趋势[J].海洋开发与管理,2014,(4):1-3.Yang J K,Yang Y,Yu T.Current Situation and Trend of International Marine Data Management[J].Ocean Development and Management,2014,(4):1-3.
[23]Du Q,Lin S,Wang F.To estabish CMOC China as an important component of marine data and servise international cooperation in China[J].Marine Science Bulletin,2013,15(1):91-96.
[24]张玉娥,王永珍.欧盟科研数据管理与开放获取政策及其启示——以“欧盟地平线2020”计划为例[J].图书情报工作,2017,61(13):70-76.Zhang Y E,Wang Y Z.The Policy and Enlightenment of EU’s Scientific Data Management and Open Access:Taking the EU Horizon 2020 Program as an Example [J].Library and Information Service,2017,61(13):70-76.
[25]Premat C.Can the French Republic Be Digital?Lessons from the Last Participatory Experience on the Law-Making Process[J].2018.
[26]黄如花,邱春艳.国内外科学数据元数据研究进展[J].图书与情报,2014,(6):102-108.Huang R H,Qiu C Y.Research Progress of Scientific Metadata at Home and Abroad [J].Library&Information,2014,(6):102-108.
[27]郎杨琴,孔丽华.科学研究的第四范式吉姆·格雷的报告“e-Science:一种科研模式的变革”简介[J].科研信息化技术与应用,2010,1(2):92-94.Lang Y Q,Kong L H.Jim Gray’s Report of the Fourth Paradigm of Science Research:A Brief Introduction to on eScience:A Transformed Scientific Method [J].e-Science Technology &Application,2010,1(2):92-94.
[28]孔丽华.美国国家科学基金会的DataNet 计划[J].科研信息化技术与应用,2009,(1):73-74.Kong L H.The DataNet Program of the National Science Foundation [J].e-Science Technology &Application,2009,(1):73-74.
[29]欧阳峥峥,青秀玲,顾立平,等.国际数据期刊出版的案例分析及其特征[J].中国科技期刊研究,2015,26(5):437-444.Ouyang Z Z,Qing X L,Gu L P,et al.An study on the case analysis and characteristics of international data journal publishing [J].Chinese Journal of Scientific and Technical Periodicals,2015,26(5):437-444.
[30]马建玲,曹月珍,王思丽,等.学术论文与科学数据集成出版研究[J].情报资料工作,2014(2):82-86.Ma J L,Cao Y Z,Wnag S L,et al.Studies in the Integrated Publishing of Academic Papers and Scientific Data [J].Information and Documentation Services,2014(2):82-86.
[31]吴立宗,王亮绪,南卓铜,等.科学数据出版现状及其体系框架[J].遥感技术与应用,2013,28(3):383-390.Wu L Z,Wang L X,Nan Z T,et al.Scientific Data Publication:An Revierw and Framework[J].Remote Sensing Technology and Application,2013,28(3):383-390.
[32]郭明航,李军超,田均良.我国科学数据共享管理的发展与现状[J].西安建筑科技大学学报:社会科学版,2009,28(4):83-88.Guo M H,Li X C,Tian J L.The Management of Scientific Data Sharing in China [J].Journal of Xi'an University of Architecture &Technology(Social Science Edition),2009,28(4):83-88.
[33]MIAO R,ZHU Y,SONG J,et al.Services of Earth System Science Data Sharing Based on Cloud Computing [J].Journal of Geo-Information Science,2014,16(2):264-272.
[34]赵蕊菡.科学数据论文的重用现状研究——基于数据期刊“EarthSystemScienceData”的引文分析[J].情报理论与实践,2017,40(11):52-57.Zhao R H.Research on the Current Situation of Reuse of Scientific Data Papers:Citation Analysis Based on the Data Journal“Earth System Science Data”[J].Information Studies:Theory &Application,2017,40(11):52-57.
[35]赵萌.强制数据共享推进研究结果的可重复性:发表文章时你希望这样做吗?[J].中国组织工程研究,2016,20(36):5322-5322.Zhao M.Mandatory data sharing promotes the repeatability of research results:Do you want to do this when you publish an article?[J].Chinese Journal of Tissue Engineering Research,2016,20(36):5322-5322.
[36]黄如花,邱春艳.国外科学数据共享研究综述[J].情报资料工作,2013(4):25-31.Huang R H,Qiu C Y.Review of Research of the Scientific Data Sharing in Foreign Countries [J].Information and Documentation Services,2013(4):25-31.
[37]苏靖,石蕾,王正,等.推进科学数据与信息资源管理共享的思路与对策[J].中国科技资源导刊,2015,(5):45-49.Su J,Shi L,Wang Z,et al.Thoughts and Countermeasure to Promote Management and Sharing of Sci-entiifc Data and Information Resources [J].China Science &Technology Resources Review,2015,(5):45-49.
[38]柯新.科技部解读国家科技基础条件平台建设纲要[J].科技资讯,2004,(22):154-159.Ke X.Ministry of Science and Technology of the People´s Republic of China interprets the Outline of National Science &Technology Infrastructure Construction [J].Science &Technology Information,2004,(22):154-159.
[39]陈明奇,黎建辉,郑晓欢,等.科学大数据的发展态势及建议[J].中国教育信息化,2016,(21):5-9.Chen M Q,Li J H,Zheng X H,et al.Development Trend and Suggestion of Big Data in Science [J].The Chinese Journal of Ict in Education,2016,(21):5-9.
[40]郭华东.地球大数据科学工程[J].中国科学院院刊,2018,(8):818-824.Guo H D.A Project on Big Earth Data Science Engineering [J].Bulletin of Chinese Academy of Sciences,2018,(8):818-824.
[41]李云龙,齐禾,杨永峰.中国科学院战略性先导科技专项(A 类)地球大数据科学工程[J].中国科学院院刊,2018,31(8):13-16.Li Y L,Qi H,Yang Y F.Strategic Leading Science and Technology Project of Chinese Academy of Sciences (category A):A Project on Big Earth Data Science Engineering [J].Bulletin of Chinese Academy of Sciences,2018,31(8):13-16.
[42]刘润达,诸云强.科学数据共享关键问题探索——以地球系统科学数据共享网为例[J].地理科学进展,2007,26(5):118-126.Liu R D,Zhu Y Q.Explore Key Issues of Scientific Data Sharing——Data Sharing Network of Earth System Science as an Example [J].Progress in Geography,2007,26(5):118-126.
[43]许志宏,阎保平.国际科技数据委员会(CODATA)中国全国委员会的使命和发展[J].科学中国人,2004,(9):20-21.Xu Z H,Yan B P.Committee on Data for Science and Technology (CODATA)Mission and Development of the National Committee of China [J].Scientific Chinese,2004,(9):20-21.
[44]王卷乐,孙九林.世界数据中心(WDC)中国学科中心数据共享进展[J].中国基础科学,2007,9(2):38-42.Wang J L,Sun J L.Development of China WDC Systems for Data Sharing [J].China Basic Sci-ence,2007,9(2):38-42.
[45]林海,王卷乐.国家重点基础研究发展计划(973)资源环境领域项目数据汇交工作正式启动[J].地球科学进展,2008,23(8):895-896.Lin H,Wang J L.National Key Basic Research and Development Plan (973)Project Data Exchange in the Field of Resources and Environment officially launched [J].Advances in Earth Sciences,2008,23(8):895-896.
[46]吴国雄,林海,邹晓蕾,等.全球气候变化研究与科学数据[J].地球科学进展,2014,(1):15-22.Wu G X,Lin H,Zou X L,et al.Research on Global Climate Change and Scientific Data [J].Advances in Earth Science,2014,(1):15-22.
Advances in the Study of Domestic and Foreign Scientific Data Management Methods
Bai Yongqing1,2,3 Yang Yaping1,3* Sun Jiulin1,3
(1.State Key Laboratory of Resources and Environmental Information System,Institute of Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101;2.University of Chinese Academy of Sciences,Beijing 100049;3.National Earth System Science Data Center,Institute of Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101)
Abstract: Scientific data are important strategic resources in the information age.Efficient management and wide circulation can critically enhance the value of scientific data resources.Rapid information technology developments and large investments in science and technology projects have led to an explosion in the number of scientific data resources,which poses a greater challenge to scientific data management.The transformation from industrial society to information society increases the importance of scientific data management,domestically and internationally.Many data management institutions and government departments promote robust scientific data management and sharing through the construction of data clusters,improvement of security measures,optimization of development concepts,and increased funding.This paper analyzes and summarizes the advanced experience of international scientific data management,based on a comprehensive survey of the concepts,policies,practices and achievements of scientific data management at domestic and foreign institutions.It proposes future directions and suggestions for the development of scientific data management in China.Recommendations for the future include the following:(1)Continuously standardize and improve the management of various scientific data resources to ensure a mechanism to improve the standardization level.(2)Strengthen deep mining of data resources to realize the transformation from data to information,knowledge,wisdom and decision-making.(3)Strengthen data science and technology talents training,implement data scientist programs from the government level,and provide talent support for scientific data management.(4)Broaden international cooperation channels,strengthen cooperation,promote the international influence of existing national science data centers,provide strategic guidance for the development and construction of data science in China,and build core competitiveness to enhance the comprehensive national strength in the information age.
Keywords: scientific data;data management methods;data sharing;data infrastructure;data management;scientific data management;open access;data evaluation
中图分类号: G203
文献标识码: A
文章编号: 2096-6369(2019)03-0005-16
引用格式: 柏永青,杨雅萍,孙九林.国内外科学数据管理办法研究进展[J].农业大数据学报,2019,01(03):5-20.
Bai Y Q,Yang Y P,Sun J L.Advances in the Study of Domestic and Foreign Scientific Data Management Methods[J].Journal of Agricultural Big Data,2019,01(03):5-20.
DOI: 10.19788/j.issn.2096-6369.190301
收稿日期: 2019-07-15
基金项目: 中国科学院战略性先导科技专项(A 类)——地球大数据科学工程(XDA19020304),中国工程院战略咨询研究项目——智慧农业发展战略研究(2019-ZD-5),国家地球系统科学数据中心(www.geodata.cn)(2005DKA32300),中国工程科技知识中心——地理资源与生态知识服务系统(http://geo.ckcest.cn)(CKCEST-2019-1-4)
第一作者简介: 柏永青,男,博士,研究方向:地球系统科学数据共享;Email:baiyq@lreis.ac.cn
通讯作者: 杨雅萍,女,高级工程师,研究方向:地球系统科学数据共享;Email:yangyp@igsnrr.ac.cn
标签:科学数据论文; 数据管理办法论文; 数据共享论文; 数据平台论文; 数据管理论文; 科学数据管理论文; 开放获取论文; 数据评价论文; 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室论文; 中国科学院大学论文; 中国科学院地理科学与资源研究所国家地球系统科学数据中心论文;