基于数据服务视角的科学数据出版模式思考 *
宋立荣1 王 健2
(1.北京联合大学应用文理学院 北京 100191;2.中国农业科学院农业信息研究所 北京 100081)
摘 要 [目的/意义] 科学数据出版模式是推进科学数据共享的新的有效措施之一。由于科学数据的快速发展、技术应用的日渐普及,使得科学数据出版的方式、途径呈现多种多样,到目前仍尚未形成成熟的科学数据出版模式。而且,现有一些相关研究成果并没有过多关注科学数据出版的实施效果、出版服务、资源质量等关键问题。关注数据服务将是科学数据出版的最终目的。[方法/过程] 论文采取文献分析法首先归类分析了目前存在的几种科学数据出版模式的优缺点,注意到这些科学数据出版模式普遍缺少服务环节的重视。[结果/结论] 论文从科学数据服务视角总结和分析了科学数据出版的4种模式:产品传递模式、交流互动模式、问题解决模式和知识服务模式。期望能够引起对科学数据出版用户服务的重视,能对建立面向用户服务的科学数据出版体系起到参考作用。
关键词 科学数据 科学数据出版 出版模式 数据共享 科学数据服务
0引 言
最初的科学数据出版主要是出于学术诚信问题考虑,为了防止科研数据造假,保证学术论文结论与数据的可再现性以及数据被复用[1]。国内外一些有影响力的学术期刊出版机构都要求作者将与论文相关的原始科学数据进行提交和出版,或将数据存储到指定的专业或者公共数据中心,或要求将数据以附件形式提交,数据起到可证伪性作用[2]。但是近几年,随着科技的飞速发展,海量科学数据激增,科研活动呈现出明显的大科学、定量化研究特点,跨地域、跨学科、跨流程的科研协作方式逐渐成为主流。新范式(数据密集型)下的科学发现和知识创造越来越依赖于海量的、系统的、高可信度的科学数据,科学数据已不仅仅是被研究的对象,而逐渐成为科研活动的主要产品。在此情形下,科学数据出版日渐受到重视,并成为促进科学数据共享一种新的有效方式之一,得到科学数据共享领域和出版界的高度重视。
可以说,科学数据出版是沿着两条线路发展:一种是传统学术出版机构为主的科学数据出版的不断完善、更新,另一种是科学数据共享领域对科学数据出版的创新应用。从发展趋势看,科学数据出版正在从一个基于传统出版约束环境的以出版机构为核心的相对封闭的狭义科学数据出版扩展到科学领域多元主体的开放的科学数据出版方式。
但同时也注意到,由于科学数据的快速发展、技术应用的日渐普及,使得科学数据出版的方式、途径呈现多种多样,到目前仍未形成成熟的科学数据出版模式。在此方面,多数学者也主要是就科学数据出版的概念界定[1,3]、出版模式分类[4-5]、优缺点比较[6-7]、关键问题剖析[8]等进行研究,并没有过多关注科学数据出版的服务效果、出版服务方式、资源质量等关键问题。为此,本文将结合目前科学数据出版实践及相关研究成果就科学数据出版模式进行深入分析,以期为我国科学数据出版实施起到参考作用。
1现有科学数据出版模式研究现状
1.1现有科学数据出版模式文献研究综述 目前针对科学数据出版模式的研究并不多,相关研究多是从不同视角来对各种现存的科学数据出版模式进行归纳、比较分析。表1对众多相关文献进行了梳理。
从表1看到,多数文献主要是通过科学数据出版的主、客体方式来界定、分类科学数据出版模式,也多是进行简单划分。许多理论难点及实践中遇到的问题尚未解决,尤其就科学数据出版模式中元数据描述、服务途径、服务方式、质量控制等关键要素深入分析不够。较多的文献还主要从期刊学术出版领域分析科学数据出版模式较多,从科学数据共享视角考虑的不多。这也说明目前在科学数据共享领域采取科学数据出版仍处于探索阶段。
表 1现有科学数据出版模式文献研究整理
从众多文献研究看,目前无论学术出版领域还是科学数据共享领域都尚未形成成熟、稳定的科学数据出版模式。这除了科学数据出版系统本身的复杂性原因外,因信息技术和外部环境的快速变化,使得科学数据出版也在不断发生变化。不同的科研资助组织、期刊出版商、学术机构都在不断尝试采取新的、不同的科学数据出版方式。
1.2目前科学数据出版模式的归纳分析 从文献研究看,不同作者因其研究范围、分析视角和研究目的不同,对科学数据出版模式的划分差别很大,划分依据也不很明确。仅从数据出版主体或者仅看数据本身出版形态来划分并不能准确揭示科学数据出版方式的复杂性,还需要结合数据出版主客体关系进一步分析。
本文基于对目前众多科学数据出版中相关实践和文献研究的梳理,考虑科学数据出版发展趋势,归纳出两类九种科学数据出版模式。详见表2。
表 2各种科学数据出版模式分类
其中,“独立数据出版”主要指数据出版主体将科学数据独立于其他任何文件发布,即:将数据或描述数据的元数据信息独立出版,不再依附于原来学术论文[11]。这种出版模式类似过去的科学数据共享方式。但有明显的区别,就是科学数据出版过程包含着对数据及相关信息的把关、筛选过程[9]。
2.3 转染pSIREN-hTERT对A2780细胞增殖的影响 MTT比色法描绘细胞生长曲线提示,空白对照及转染pSIREN-Con对照质粒的A2780细胞生长速率相近,而pSIREN-hTERT转染的A2780细胞生长速率明显降低,后者分别与前两对照组比较差异有统计学意义(均P<0.05),表明靶向hTERT的shRNA导入抑制了A2780细胞的增殖能力。见表1。
根据科学数据出版流程,可将独立科学数据出版模式划分五种:A1数据仓储(数据中心)模式、A2数据知识库模式、A3数据期刊模式、A4纸质文献的数字化独立出版模式和A5个人独立出版模式。
而“关联(集成)数据出版”是指学术论文与科学数据关联(集成)出版的模式,这包括两方面,一种是传统期刊出版商推动的科学数据出版中学术论文和数据之间的关联关系;另一方面是指新的数据期刊与数据实体之间的集成关系,后者是随着信息网络的广泛应用和由数据驱动的第四范式科研环境的影响,逐渐受到重视[4]。
2.1科学数据出版的内涵分析 对“科学数据出版”概念目前尚没有一个普遍认可的解释。在众多定义中,引用较多的是吴立宗的定义,他从学术出版物出版角度认为科学数据出版是将“数据”形式上看成与学术论文相同的学术出版物(或学术成果),借助传统出版体系中学术出版物引用、评价体系实现对“数据”成果的认可、确定,以此鼓励科研人员参与科学数据出版[16]。
根据科学数据出版主体相互关系及数据存储形态的不同,可将关联(集成)出版模式分为:B1传统论文中的数据包含在传统的出版物、B2传统论文中的附件数据文件、B3传统论文与数据仓储中心联合出版、B4数据论文与数据仓储中心联合出版四种模式。
这位医生解释道,医生的水平有高有低,但都有共同的职业操守,绝不会刻意贻误病情,置病人安危于不顾,可能是因为每位医生的性格、用药习惯、诊断方式等差异,在病人眼中造成了“不说话不搭理我”、“开药和别的医生不同,恐怕是乱开”、“诊断过程很简单,看不出花了心思”等等误解。
本文在张静蓓等学者的分析比较基础上进行更详细的比较分析。表3中整理了各种科学数据出版模式的比较。
随着智能手机、智能腕表等可穿戴设备的快速发展,基于可穿戴传感器的跌倒检测系统吸引了越来越多的关注。与其他基于环境设备(如摄像头[4]、体感传感器[5]、WiFi[6]等)的跌倒检测系统相比,可穿戴传感器(如加速度计、陀螺仪、方向计等)可以被随身携带,实现全天候全方位的监测,因此在实际生活中具有更广泛的使用价值。另外,摄像头等设备设计用户隐私问题,部分老年人不希望受到摄像头的监视,而可穿戴传感器则较好的避免了这个问题。
1.3现有科学数据出版模式的总结 根据以上分类方式对现有一些科学数据出版模式进行归类分析,发现各个学者总结和提炼的科学数据出版模式和结论差别很大,但多停留在实践问题的汇总分析方面。在对科学数据出版的构成要素、形式特征、运行机制等方面尚需进一步系统、深入的剖析。比如,张静蓓等学者对多种科学数据出版模式分析比较细致[4],但也仅笼统地对各个出版模式的优缺点进行比较分析,尚未深入到各种出版模式下数据服务利用流程、数据集描述、质量保证等一些关键问题。
从表3中看到,尽管可以从各个数据出版模式的关键环节进行对比分析,但对于科学数据出版模式的具体运行过程及数据利用服务的研究和关注仍然较少。从科学数据利用视角看,目前几种科学数据出版模式的数据参与度和复用率双低的问题仍非常突出,并且随着数据规模的迅速扩大而愈加突出[11]。而且,科学数据出版实践中存在明显的“两头冷,中间热”的“橄榄型”现象,即:作者和使用者的反映并不积极,而期刊出版商和数据仓储中心则更热心,在努力积极推动着科学数据出版。可以说,目前科学数据出版模式尚未充分考虑科学数据出版服务对象诉求,这既包括科学数据使用者的数据需求和要求,也包括了对科学数据作者提供相关的投稿服务要求。因此,完整、有效的科学数据出版模式应充分考虑科学数据出版整个业务生命周期中各个主客体之间形成的对科学数据出版途径、形态、机制等。
上述问题在一定程度上主要是由于快速发展的科学数据共享环境使得科学数据出版的主客体要素不断加入,主客体关系也在不断调整,也使得科学数据出版服务路径并不明确,也影响科学数据出版模式的认识理解。
表 3几种科学数据出版模式的比较分析
2面向用户服务的科学数据出版模式思考
目前看,这种联合(集成)出版模式仍主要以期刊出版机构为核心来推动出版科学数据,作者根据期刊出版商的数据出版政策要求将论文相关数据提交到指定的(或推荐的)专业或公共数据仓储中心。
另外,也有从科学数据共享领域来认识,黎建辉等认为科学数据出版作为一种创新的科学共享数据方式,是指通过“数据提交、同行审议、数据发布和数据永久存储、数据引用和数据影响评价”等环节实现数据(或数据产品)及其描述信息的发表,以帮助用户便捷地发现、获取、理解和再分析利用数据[17]。
从这些定义看到,科学数据出版与传统学术出版明显不同的是:后者更多的是一种“可见即可得”的信息服务方式,而科学数据出版仅是通过描述数据集(数据实体)来描述信息的发布,数据集(数据实体)还存放指定的专业数据存储中心。其数据服务并不单单是数据实体信息的“可见可得”,而是建立关联,从其元数据相关信息链接获得数据实体。数据服务其实是封装了科学数据出版主体相关的关键数据实体的相关操作,包括:数据链接的有效性保证可以获得数据实体、数据质量的可靠性使得数据可以利用、数据解析的可读性方便用户理解使用数据、数据获得的有用性以满足用户的真实需求。这对科学数据出版机制、流程、质量控制、软件工具等都提出较高的要求。因此,科学数据出版的服务效果最终取决于数据论文的质量以及存放数据实体的数据中心的资源及服务质量两方面。
如果从数据服务视角看,科学数据出版是指使数据可以自由访问,在互联网上永久可用,且具有与数据相关的可靠性、格式和内容等相关信息,以便发现和重复使用[12]。从这个定义看,科学数据出版数据服务活动是以数据使用者有效利用为导向、以各类出版主体间协调合作为纽带、以数据及其描述信息内容为基础,以过程质量控制为保障的学术传播活动。据此对这些构成要素、形式特征、要素联系、运行机制等的描述,可以构成一种模式。它强调了科学数据出版主体之间、主体与客体之间,以及与外部环境要素之间必须相互协调、合作,积极应对科学数据用户的需求,提供能够与需求相匹配的数据资源,并完成筛选、匹配。同时,这种供需匹配关系在经历主客体之间长期磨合过程中才能达成一定的利益平衡,形成一种相对稳定、有序的科学数据出版模式结构。
11月26日下午至27日,浙江省自然资源厅执法监察局在杭州组织召开了2018年全省国土资源执法案卷质量评查工作会议。会议汇报交流了案卷质量评查工作开展情况和2018年工作思路,对全省各地上报的2018年度参评案卷质量集中评查。浙江省自然资源厅相关处室负责人,各设区市和有关县(市、区)执法监察系统负责人参加了会议。
而且,科学数据出版的数据资源只有被用户获得并利用,才能发挥科学数据的潜在价值。而科学数据的可获得性既取决于科学数据出版主体之间的信任、理解、成本收益、流程效率,还取决于科学数据资源客体的技术规范、标准、存储便利性等。
为此,需要清楚认识科学数据出版中的主客体关系,才能更好理解科学数据出版模型。
PaaS层则为应用支撑平台层,实现数据集中存储和控制,其中包括门户集成、数据集成、业务流程集成和应用集成等[3]。
2.2科学数据出版中用户服务方式分析 科学数据出版中主客体关系是影响科学数据出版用户服务方式的最重要的因素之一。根据不同类型的科学数据资源特征,不同利益主体在科学数据出版环节中的地位、作用、利益诉求、影响力等不同,使得科学数据出版主客体之间关系截然不同,对用户产生的科学数据服务效果差异很大。本文结合以上几种科学数据出版模式,总结科学数据出版主客体关系,整理如表4所示。
表 4用户服务视角下科学数据出版主客体关系
2.3数据服务视角下科学数据出版模式总结 基于以上主客体关系认识,本文结合实践调研分析,借鉴信息服务模式相关研究,从数据服务视角将现有科学数据出版模式总结为以下几种:
这种科学数据出版模式是随着网络技术的普及,已逐渐被各个出版机构所采用。但这种方式还是依托传统科学数据出版模式,仍是固化形成的基于一种统一规范化、标准的出版方式,只不过在具体服务内容、服务方式方面根据用户意见进行调整。而且这种科学数据出版模式多针对的是各个科研用户个体而言。
白花前胡为多年生草本植物,属于伞形科前胡属PeucedanumL.,为常用中药前胡的原植物,以根入药,具有散风清热、止咳化痰的功效。前胡属植物全世界约有130种,我国产30余种。由于应用领域广泛,对其进行广泛深入的研究,涉及种质资源、种植技术、生物性特性、化学成分和药理作用等多个领域,并报道了大量文献。为了解近十年间白花前胡的研究状况,本文对2008-2017年间白花前胡的研究文献进行计量学分析,从而为白花前胡的后期研究方向选择提供依据。
这种模式中期刊出版商或数据中心等起到了承上启下的核心作用,从数据资源筛选、组织编辑、质量评审、引用标识、评价反馈等发挥关键作用,保证了数据论文的质量。
创业板股价的波动风险可以运用VaR模型在一定置信水平上进行预测,从而提高利润回报。从投资者的角度来看,基于GARCH-VaR模型的风险控制方法能准确刻画资产收益的概率分布,以及真实反映证券市场资产波动的特征,为投资者提供重要的分析依据。 所以, 将GARCH-VaR模型应用于日常的风险管理,可以将市场风险和信用风险降到最低的程度,以期获取最大的利润回报。
产品传递模式强调科学数据出版产品的过程管理,但忽视了数据使用者的特定服务需求和用户的反馈等能动性及数据使用情况,无法体现出科学数据共享的最终目标。
2.3.2 交流互动模式 交流互动模式强调了对数据使用者需求的重视,并以此确定科学数据出版的方式和内容。这种模式仍然是以学术期刊出版商或数据中心等数据出版主体来驱动的,主要根据用户的数据资源需要,以某种服务策略(或出版形式)生产数据出版产品(不仅仅限于数据论文,还包括其它科研活动研究要素)并提供给用户,以此提高出版物的使用率。这种模式打破传统文献出版的单向“传播”模式,借助于互联网中一些互动性强的社交软件(如Facebook、微信等)的广泛应用,实现作者与用户之间、出版商与用户之间、作者和出版商之间的双向互动“交流”,使科学数据出版由“封闭”走向“开放”方式。
目前众多科技期刊出版商都已开通各种社交账号,借助博客/微信公众号、在线社区、问答服务空间等平台提供多种互动交流方式,除了起到更方便传播数据出版内容外,更主要是以此收集、交流关于科学数据出版的内容、服务策略、服务质量等反馈信息,有助于加强科学数据出版诸多主体(如用户、作者、编辑、出版商等)之间实时、互动交流、信息沟通、学术分享的渠道。同时,用户也可通过参与给数据论文、作者观点等添加“社会化标签”、保存及分类并与他人分享,有助于根据用户需求筛选、出版科学数据,提高数据论文的使用和引用率,并进一步扩展学术传播范围[20]。
为实现城市防洪排涝统一指挥调度,各地积极推进城市防洪信息化建设,整合相关部门现有资源,实现平台互通、信息共享,努力提高防洪排涝应急管理水平和公共服务质量。例如,天津市建成了天津水情分中心,实现了全市31个国家报汛站的水、雨情自动采集;建成了城市防洪信息系统,整合共享防汛信息资源。上海市实现了水务防汛信息平台与有关部门的气象信息、城市网格化管理信息、交警视频监控信息等连接,做到 “一个平台,多级应用”。济南市将城市防汛指挥系统与预备役应急分队指挥系统、交警指挥系统、气象会商系统互联互通,实现了全市城市防洪信息、通信等全覆盖。
伟翔很快就回来了,阴沉着脸,抱起糖果晃来晃去。我生气,索性也不做饭,打开很久没动的电脑,上线,正碰上吴梅,她说:“晓薇,你怎么看赵丽华的诗?”
另一种交流互动模式是借鉴了维基百科模式,应用于科学数据出版领域,如生命科学领域的Wikigenes网站允许用户对网站中文章进行修改,也可对其他相应学术贡献者进行评价。通过这种贡献评价机制,重视科学交流的开放性和互动性,提升了用户的参与积极性[21]。
2.3.1 产品传递模式 产品传递模式描述的是源于客体资源(数据实体及其元数据描述资源等)并以出版物产品为中心的科学数据出版服务过程,主要以数据出版主体(期刊出版商或数据中心)为核心中介,通过对数据资源进行加工或建立等,形成科学数据论文等数据出版物,并以某种出版策略提供给用户使用。这是一种传统的出版模式,延续了传统文献出版的流程。只不过完成了从印刷版到数字版或网络版的过渡。目前的在线模式只是在尝试复制离线模式而已,科学数据出版交流仍然遵循着同样的过程和工作流程,采用相同的模型和学术评价体系。像现在常见的几种出版模式基本上都是这一模式下的运行方式。
2.3.3 问题解决模式 问题解决模式是以用户问题解决为最终目的的科学数据出版模式,强调的是用户导向性,以问题为中心的服务过程[18]。主要针对一些科研学术机构、企业的科研项目、大型科研活动等科研数据需求提供的一种针对性的服务模式。其服务针对的是一些机构用户当前面临着有待解决的实际问题并要寻求合适的数据服务的帮助,以期望得到数据产品支撑所遇到问题的最终解决。
一些期刊出版商或数据中心通过采取长期的、连续的定向化、专题化数据出版方式,对数据资源和数据出版产品进行专题加工生产,形成有针对性的数据出版物服务产品,并采取适当的商业策略把数据产品提供给目标用户,帮助其解决实际问题。
这种模式与之前的“交流互动模式”不同,问题解决模式主要以用户有待解决的问题为依据。面对的是机构组织、项目组或大型科研组织层面展开服务。从目前科学数据出版实践看,已经有机构开始进行这方面的尝试,而且商业化服务策略比较成功,比如,汤姆森路透在医药研发、生物信息等领域加工、整理出来的数据资源满足了全世界众多医药研发企业、生物医学科研机构的专题化数据资源需求,取得可观的商业收益。
这种科学数据出版模式对我国众多科学数据共享中心进行科学数据出版具有很好的启示。在过去,国内一些科学数据共享中心侧重于科学数据的收集和存贮,过多强调了国家财政支持的科研项目产生的科学数据资源的强制提交,数据的开放共享也没有一个有效的数据版权确认机制,使收缴上来的科学数据资源质量参差不齐,进一步影响数据服务和使用,这成为制约科学数据共享的瓶颈问题。而采取科学数据出版模式将为科学数据服务共享提供新的机制、新的途径,有助于深入推进、解决目前科学数据共享中一些关键性的瓶颈问题,如数据共享与激励之间、数据开放与数据安全之间、数据利用与数据产权保护之间等瓶颈问题。为此,各个数据共享中心应积极落实2018年国家新颁布的《科学数据管理办法》中推进科学数据出版的要求。一方面,从数据出版的角度,调整和完善科学数据管理机制,面向各个学科领域的世界级公共数据仓储中心和高水平的期刊出版商加强合作和联合,加速科学数据出版发展,使成为具有领域、行业中有学术影响力的科学数据中心。另一方面,紧密围绕国家科技创新战略规划,针对国家重大科研项目或工程中的科研问题和需求导向,定期开展专题、专项的科学数据出版服务工作。
2.3.4 知识服务模式 随着信息技术和大数据的广泛应用,数据挖掘、知识关联等软件工具已实现大量文献与数据之间、科学数据与其他数据之间的资源融合和知识点关联,从而能为用户提供更有数据价值的知识发现或者数据挖掘结论。科学数据出版的这种知识服务模式一方面使得通过计算机算法等进一步改进传统科学数据出版的成果发布形式,为用户提供更加高效、方便的知识发现(而不是数据提供),另一方面也使得科学数据出版服务方式发生巨大的改变。
所谓知识服务模式是指借助于元数据、语义出版、富媒体出版技术等对文献、科学数据资源进行元数据加工、语义标注、知识关联等旨在增强数据资源的语义,使其能借助于计算机来识别、获取、相互关联而获取有用的数据知识的科学数据出版模式。或者称之为不同数据之间根据关键知识点相互融合、相互集成的全新出版形式。其价值在于提升对海量科学数据的识别、利用的效率,减轻用户对超载数据消化吸收的压力,而且借助于计算机可视化等方式将数据结果更好展示出来。
在这方面,国外知名期刊出版机构积极探索各种知识服务方式,比如汤姆森路透和爱思唯尔等积极探索新的知识信息服务体系,将过去一些固化在纸质文献中的有研究价值的研究方法、材料、实验数据等诸多研究要素借助于信息技术(如汤森路透的自动语义标引软件Open Calais)通过数字化加工,拆解、整合,成为一项重要的科学研究的数据资源[22]。通过知识挖掘、知识链接方式来对某一主题、项目提供智能化的研究要素的服务。
1982年,云南省非公有制工业产值仅占1%,1987年占比业不到5%,且基本上局限于以有色金属为主的原材料工业、磷化为主的化工业领域的采选、初加工。
文氏桥振荡器,它是由同相放大器和RC串并联反馈网路组成。具有振荡较为稳定、波形良好、振荡频率在较宽的范围能方便地连续调节等优点[6]。在文氏桥振荡器拓扑中增加动态元件、非线性元件或者两个文氏桥电路通过非线性耦合可构成各类文氏桥混沌或超混沌振荡电路[10-14]。
这是因为科学数据出版其实是一种对数据描述信息(即元数据)的出版。当海量科学数据出版后将形成巨大的元数据资源,这为实现不同数据资源之间的结构化描述、元数据互操作、语义出版等提供基础,实现这些资源之间丰富的、多层次的、自适应的相互关联。这种关联包括了文献与数据资源之间、期刊与期刊、知识单元之间、科学数据与外源数据之间的关联,从而使科学数据出版呈现一个开放、关联的学术传播生态系统,为用户检索和利用提供很大的便利。
总之,从科学数据出版发展趋势看,本文认为问题解决模式有利于目前我国科学数据共享中心进行科学数据出版服务活动的开展和积极的数据利用成效的取得。知识服务模式将是未来科学数据出版发展方向。当然, 产品传递模式和交流互动模式不会消失,符合目前我国科学数据出版发展现阶段的实际情况,但其范围内的许多服务项目应逐步转入问题解决模式。尤其在大数据环境下,基于知识服务模式的科技文献与科学数据资源融合、科学数据与其它大数据资源之间数据互通会越来越频繁,数量也会越来越多,需要高度关注。这将是未来科学数据出版发展的最重要数据出版模式。
3结束语
科学数据出版,作为一种新的科学数据共享举措,已从期刊出版商驱动的传统科学数据出版拓展到科研领域众多主体协同合作共同推动科学数据出版方式,将进一步促进科学数据的开放共享与再利用、增加科学数据的复用价值。在这一过程中,由于科学数据共享的复杂性,科学数据出版必将在快速发展中面临一些新的问题和挑战,也将出现新的数据出版生态体系。本文仅从数据服务视角关注科学数据出版主客体之间相互关联总结出四种新的服务模式。相信在今后不断发展环境下,新要素不断加入,在不同视角下也将产生新的科学数据出版模式。
参考文献
[1] 伏安娜,张计龙,殷沈琴.数据论文国内外发展研究综述[J].图书情报工作,2015,59(24):131-138.
[2] 袁曦临.E-science环境下学术规范的新领域:科学数据[J].甘肃社会科学,2014(3):85-88
[3] 屈宝强,王 凯.数据论文的出现与发展[J].图书与情报,2015(5):1-8.
[4] 黄国彬,王 舒,屈亚杰.科学数据出版模式比较研究[J].大学图书馆学报,2018,36(1):34-40,33.
[5] 张 恬,刘凤红.数据出版新进展[J].中国科技期刊研究,2018,29(5):453-459.
[6] 陈全平.学术期刊数据政策及相关研究[J].图书与情报,2015(5):9-15.
[7] 雷秋雨,马建玲.学术期刊数据出版政策研究综述——以JCR中进化生物学领域期刊为例[J].图书馆理论与实践,2016(1):30-34.
[8] 涂志芳.科学数据出版的基础问题综述与关键问题识别[J].图书馆,2018(6):86-92,100.
[9] 张小强,李 欣.数据出版理论与实践关键问题[J].中国科技期刊研究,2015,26(8):813-821
[10] 李红星,吴立宗,南卓铜,等.科学数据联合出版模式与内容研究[J].遥感技术与应用,2016,31(4):801-808.
[11] 张静蓓,任树怀.科研数据出版模式、流程及引用策略研究[J].图书情报工作,2015,59(9):21-27.
[12] Lawrence B,Jones C,Matthews B,et al.Citation and peer review of data:Moving towards formal data publication[J].The International Journal of Digitalcuration,2011,2(6):4-37.
[13] 王丹丹.科学数据出版过程中的数据质量控制[J].图书情报工作,2015,59(23):124-129.
[14] 何 琳,常颖聪.国内外科学数据出版研究进展[J].图书情报工作,2014,58(5):104-110.
[15] 马建玲,曹月珍,王思丽,等.学术论文与科学数据集成出版研究[J].情报资料工作,2014(2):82-86
[16] 吴立宗,王亮绪,南卓铜,等.科学数据出版现状及其体系框架[J].遥感技术与应用,2013,28(3):383-390.
[17] 黎建辉,吴 超, 张丽丽, 等.科学数据出版调查与分析[J/OL]. 中国科学数据, 2016, 1(1). http://www.csdata.org/paperView?id=9. DOI: 10.11922/csdata.120.2015.0009.
[18] 陈建龙.信息服务模式研究[J].北京大学学报(哲学社会科学版),2003(3):124-132
[19] PLoS Hub for Clinical Trials[EB/OL].(2011-02-10).http://clinicaltrials.ploshubs.org/home.action
[20] ACS Network[EB/OL].(2011-02-10).https://communities.acs.org/welcome
[21] Robert Hoffmann (2008). A wiki for the life sciences where authorship matters[J]. Nature Genetics 40, 1047 -1051.doi:10.1038/ng.f.217
[22] 徐丽芳,丛 挺.数据密集、语义、可视化与互动出版:全球科技出版发展趋势研究[J].出版科学,2012,20(4):73-80
Scientific Data Publishing Model :A Data Service Perspective
Song Lirong1 Wang Jian2
(1.College of Applied Arts and Science of Beijing Union University, Beijing 100191;2.Agricultural Information Institute, Chinese Academy of Agricultural Sciences, Beijing 100081)
Abstract [Purpose /Significance ]Scientific data publishing is a new and effective way to promote data sharing. The rapid development of scientific data and the increasing popularity of its technology application promote various scientific data publishing models. However, scientific data publishing mode is still not mature. In some existing research results, the attention paid to the critical problems of the scientific data publishing, such as application effect, services and resource quality, is still very limited. Focusing on data services will be the ultimate goal of scientific data publishing.[Method /Process ]This paper briefly summarizes the advantages and disadvantages of several existing scientific data publishing models by means of literature analysis and finds that there lacks an awareness of the importance of service links.[Result /Conclusion ]This paper summarizes four modes of scientific data publishing from the perspective of scientific data services: product delivery mode, interactive communication mode, problem-solving mode and knowledge service mode. It is hoped that this paper can arouse the attention to users services of scientific data publishing, and it will play a reference role in establishing a user-oriented scientific data publishing system.
Key words scientific data scientific data publishing publication model data sharing scientific data services
收稿日期: 2018-11-18 修回日期:2018-12-20
基金项目: 国家社会科学基金项目“科学数据引用的实现机制研究”(编号: 15BTQ053);国家科技基础条件平台专项课题 “科学数据出版关键问题研究”研究成果之一。
作者简介: 宋立荣 (ORCID:0000 -0001-7948-1545),男,1971年生,博士,教授,研究方向:科技信息共享、信息质量;王 健 (ORCID:0000 -0003 -4958 -7669),男,1971年生,博士,研究员,研究方向:信息处理。
通信作者: 王 健
中图分类号 G237.9
文献标识码 A
文章编号 1002-1965( 2019) 05-0154-07
引用格式 宋立荣,王 健.基于数据服务视角的科学数据出版模式思考[J].情报杂志,2019,38(5):154-160.
DOI 10.3969/j.issn.1002-1965.2019.05.023
(责编/校对:王平军)
标签:科学数据论文; 科学数据出版论文; 出版模式论文; 数据共享论文; 科学数据服务论文; 北京联合大学应用文理学院论文; 中国农业科学院农业信息研究所论文;