论学科信息学的兴起与发展_大数据论文

论学科信息学的兴起与发展,本文主要内容关键词为:信息学论文,学科论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       1 引言

       自2008年《大数据时代》[1]一书出版以来,“大数据”的概念快速席卷全球。如今,全球数据呈现出前所未有的爆发式增长态势,大数据时代已经全面来临。加速器、望远镜、卫星、传感器网络、医疗成像设备、DNA测序仪、智能移动终端、互联网应用等一系列设施和活动每时每刻都在快速产生着海量、异源、异构数据,几乎每个领域都在经历着数据爆炸,都被推进了一个前所未有的大数据时代[2,3]。根据EMC的报告,从2013~2020年,“数据宇宙”的数据量将增长10倍——从44ZB(trillion gigabytes)到44ZB。2020年,将有超过5200GB的数据来自于个人[4]。Gartner研究发现,到2015年,全球将需要440万人员进行数据需求与资源分析[5]。大数据时代的到来及其影响迅速引起了科学研究领域的重视,如2008年Nature的“大数据专刊”与2011年Science的“数据处理专刊”,都对大数据进行了分析报道。大数据时代的来临,全面催生科学研究领域科研模式的重大变革。继实验科学、理论科学、计算科学之后,出现了以数据为中心思考、设计和实施科研活动,通过对海量数据的处理和分析来获得科学发现的第四范式——“数据密集型科学发现”[2]。

       事实上,自20世纪90年代以来,以数据分析为主的专门学科的“信息学”就开始蓬勃发展。各个学科领域数据的大量、快速增长,使得每个学科都出现了二元发展的态势——“计算X学”(Computational-X)与“X信息学”(X-Informatics)。以生态学为例,出现了用于模拟生态系统的计算生态学(computational ecology)以及用于收集和分析生态学信息的生态信息学(eco-informatics)[2]。与Computational-X相比,X-Informatics更侧重于对数据生命周期的管理与应用,侧重于对计算方法的发展与应用,从而发现并创造新的科学知识。因此,作为一种研究方法论,“X-Informatics”(X信息学)需要建立其科学的实验方法、理论和仿真模型。在这里,“X”代表某一具体学科,如生物学、地理学等;“Informatics”代表组织、描述、存取、整合、挖掘和分析数据资源以帮助科学发现的学科[6]。到目前为止,还没有发现哪一个传统学科是信息概念、信息科学的一般性观点、理论和方法不可涉入的[7]。科学界已经明确提出了生物信息学、生态信息学、生物多样性信息学、材料信息学、化学信息学、经济信息学、社会信息学、中医药信息学、水信息学、神经信息学、资源信息学、农业信息学、地理信息学等一系列专门学科信息学的概念,而且新的专门学科信息学还在不断被提出。

       专门的学科信息学除具有信息科学的特点外,无一例外地继承了其所涉及学科的主要特点。既具有明显的学科依赖性,又具有一般信息科学的特征。因此,本文尝试提出一个全新的概念“学科信息学”(Subject Informatics),用以概述现有的“X-Informatics”。本文旨在分析学科信息学的缘起、内涵、研究内容、学科体系和发展及应用方向。首先,在综述专门的学科信息学研究内容的基础上,介绍学科信息学的内涵;其次,阐述学科信息学的学科体系,明确其研究内容与思路、关键技术与方法;最后,对学科信息学的发展和应用前景进行展望。以期为学科信息学研究的发展与完善提供参考。

       2 学科信息学发展概述

       2.1 学科信息学的缘起

       1999年John Taylor就已经认识到信息技术必须在21世纪的合作和跨学科研究中扮演更为重要的角色,并提出了e-Science这一概念。可以说,e-Science的产生与发展为数据密集型科学研究的兴起提供了支撑环境[8]。此后,大型强子对撞机(LHC)、望远镜、探测器、基因工程、临床医学信息、社交网络信息等各个领域和各种渠道产生并累积的大量数据和信息影响着科学研究领域对数据及其生命周期的认识与处理。各种研究对象不再是一个简单的孤立系统,而是涵盖更大范围、涉及多个分支学科。由此导致其研究环境和手段也发生了深刻的变化。

       现代科学研究已离不开“数据、传感器、计算、模型”这4个主要方面[9]。随着大数据时代的到来,图1中4个关键节点的关系由“数据—传感器—计算—模型”转变为“传感器—数据—计算—模型”。这是因为,在数据密集型科学大背景下,传感器实现了对数据的收集与传输,先于数据而出现。数据是各个学科的生命力和基础,处于核心支配位置。同时,利用高性能计算方法与技术,深入挖掘通过传感器收集来的大量原始数据,对其进行仿真模拟,构建合理有效的数据模型,继而发现新知识。因此,建立数据处理与分析软硬件基础环境成为各学科发展的重要工作,建立专门用于处理与分析数据的科学势在必行。

      

       图1 科学研究的四交叉方法

       (HPC代表High Performance Computing高性能计算)[9]

       各学科领域不得不采取行动应对本学科领域的大数据时代。例如,①在空间科学研究领域,由于各种探测手段的发展、大规模空间计划的推进,传统的观测实验、理论分析的科研手段在面对复杂科学问题时已经显得无能为力。为应对大规模数据处理分析的需求,科研模式逐渐从“猜测、计算、挖掘、分析、验证”的研究方式转变为数据驱动的“观测、计算、挖掘、分析、验证”的方式,并呈现出多学科交叉和广泛合作的局面[10]。②生物多样性领域,在全球范围内广泛开展了一些旨在促进必要技术与生物学进步的项目,如生命百科全书(Encyclopedia of Life,EOL[11]),生命条码(Barcode of Life,BOL[12])等项目。EOL和BOL项目的启动,需要大量的知识发现、集成和管理技术,而以上这些通称为“生物多样性信息学”(biodiversity informatics),这一新学科的方法和工具扩展了当代计算机科学和信息学原理在生物多样性领域的应用[13]。③在天文学领域,天文学家们需要更宽广的视野和长久的策略以全面应对海量科学数据时代研究的挑战。为了使现有和未来大型巡天项目、观测设施等数据生产项目的科学产出最大化,天文学需要一个新的交叉学科,即天文信息学(AstroInformatics)以保证其未来的发展。因此,将计算、分析和统计的科学工具应用到天文学的海量数据中以甄别出新的模式和新的发现[14]。④在医学领域,信息系统的发展支持了医学基础设施建设,医生及医院管理人员和专家意识到医学教育、决策、沟通和专业活动对医学学科及医院发展的重要作用。医学信息学是关注认知、信息处理、医疗实践与交流的一门集任务、教育和研究于一体的交叉学科。目前已经形成了一些专业学术组织,医学信息学教育也逐步开展[15]。

       以上实例说明了数据密集型研究的特点:海量数据的获取、存储、提取与分发、数值计算、数据挖掘和知识发现[16]。与此同时,信息技术、网络技术等相关技术在数据密集型科研环境下得到了迅速发展,相继催生了一批前沿交叉学科与科研岗位,如数据科学[17]、数据科学家[18]等。作为某一专门学科领域、信息科学和计算技术相互渗透产生的交叉学科,专门的学科信息学在相应学科的数据生命周期管理及知识发现等方面不断呈现出良好的实践应用,逐渐从母体学科中独立出来成为一门专门学科,现已成为各学科领域的一个重要分支学科。

       2.2 专门学科信息学的内涵

       早在20世纪60年代开始,一些专门的学科信息学的概念就被逐渐提出,学科信息学逐步引起各学科领域的关注。2000年前后,专门领域的学科信息学发展迅速并传播开来。表1介绍了主要的专门学科信息学产生背景与内涵。

       通过表1对上述专门学科信息学的定义与内涵的介绍,可以发现学科信息学的主要共性特征是:

       (1)产生背景:在科学研究进入“第四范式”的大背景下,“数据密集”已逐步成为各学科的显著特色,处理各种海量、异构、复杂数据的需求日益紧迫。加之计算技术、网络技术等的迅猛发展,为学科信息学的产生与发展创造了时代背景并提供了技术支持。

       (2)研究对象:学科信息学是以学科的数据信息为研究对象的,旨在挖掘并研究此类信息学中潜藏的、更有价值的信息与知识。例如,生物信息学的研究对象是分子生物学数据,生态信息学的研究对象是生物、环境和社会经济数据与信息等。

       (3)信息来源:一般来源于专门学科在发展过程中产生的各种大量科学数据信息。

       (4)研究技术与方法:通常包括计算技术、通信技术、数学理论与方法等,涉及数据的收集、存储、加工、检索、提取、交换、传输、分析等全过程。

       (5)研究目的:①揭示学科的内在实质与联系;②基于科学数据分析进行知识发现;③对学科发展进行合理规划与管理;④促进学科社会功能的实现。

      

       2.3 学科信息学的内涵

       本文提出“学科信息学”(Subject Informatics)的新概念,学科信息学是指学科领域在科研创新中应用信息科学与计算科学的技术、手段与方法,进行科学数据收集、存储、处理、再分析、可视化和知识发现,从而创造新知识、发现新方法、提供学科战略决策咨询的交叉性学科。“学科信息学”是对专门学科信息学的总结与概括,是专门学科信息学概念的一般泛化和普适应用,可用以归纳专门学科信息学的一般特征、理论思路、研究方法、应用实践规律等。可以说,学科信息学的本质是学科研究的全面信息化和数据化,是信息科学和数据科学在特定学科领域研究中的内生化应用。学科信息学是基于学科数据的、用于科学研究发现活动的一般性规律的科学,重点突出了对学科信息、数据的计量分析与挖掘分析。

       2.4 学科信息学与专门学科信息学及其他学科的关系

       学科信息学是在专门学科信息学发展与应用的基础上发展起来的,是专门学科信息学理论与实践的一般化发展。专门学科信息学为学科信息学的提出与发展奠定了坚实的理论、方法、实践和案例基础;学科信息学的提出为专门学科信息学的发展提供了有力保障与宏观的理论、方法、路径等的支持,特别是为那些还没有独立出专门学科信息学的学科。在学科数据激增的时代,必定有用于学科数据处理的一般的、通用的理论、方法和流程。学科信息学的提出,恰如其分地概述了学科数据处理方面的研究内容、处理流程、关键技术与工具等内容,提供了很好地数据信息处理和挖掘的理论与技术指导,是“计算型”学科情报研究工作的典型应用与发展。因此,一般学科信息学的理论、方法、研究流程等的完善与发展,将更好地服务于专门学科信息学的深入发展与应用。

       在学科信息学中,某一专门的学科是学科信息学的要点和基础,数学与计算机技术是基本工具,网络技术是学科信息学信息资源传播的主要途径。学科信息学本身就是一门交叉性很强的学科,它的出现与互联网和计算技术的发展息息相关[39]。因此,它的发展离不开数学和计算机科学的支持与发展,更离不开与其他学科的相互交叉与影响,需要更加重视与多学科的协调发展。可以说,学科信息学是特定学科领域知识创新发展的应用手段性学科,没有其在学科发展中的应用,就没有学科信息学。学科信息学在科学沃土上的生根、发芽与茁壮成长,与其他学科的承载与支持休戚相关。

       3 学科信息学的研究内容及学科体系

       3.1 学科信息学的研究内容

       学科信息学作为一门独立的学科,应有其自身的主要研究内容。然而,要得出科学有效的学科信息学研究内容与思路,还需借鉴已有专门学科信息学的研究内容,从而总结规律、概括要点、得出结论。表2对一些专门学科信息学的研究内容进行了简要介绍。

       针对学科信息学的研究对象以及表2对几种发展成熟的专门学科信息学研究内容的介绍,本文总结提出一般学科信息学的主要研究内容。一般学科信息学的研究内容分为理论与技术两条主线:

       (1)研究学科信息学的概念、内涵、学科属性、研究对象与内容、研究方法与工具等理论内容;

       (2)研究学科信息学的主要技术与标准。包括学科信息学研究方法及其改进、学科信息学的平台及系统建设、新技术或方法在学科信息学中的应用等。

       其中,理论研究是学科信息学的基本研究内容;技术研究是学科信息学在应用中解决问题所需的技术、方法与平台、工具等。这两个方面是对学科信息学主要研究内容的概述,在实际工作中,由于学科信息学交叉学科的特性,其研究内容非常丰富。例如,技术研究中的方法研究包括知识获取、知识发现、知识挖掘、知识组织、可视化等多种方法。

      

       3.2 学科信息学的学科体系

       根据学科信息学的主要研究内容,参照某一学科产生、发展与成熟的发展过程,建立一般学科信息学的学科体系,如图2所示,主要包括基础理论、方法技术、应用分析与教育管理4个方面。其中,基础理论是学科信息学产生及发展的基础,方法技术对学科的发展起到支撑作用,应用分析是学科发展的目的,教育管理是学科的延伸与提升,是促进学科纵深发展的有力途径。教育管理的结果又可以促进学科信息学基础理论、方法技术、应用分析等的发展,可以说是学科发展的最高目标。

       学科信息学的学科体系正是上述4个方面相互关联、有机搭配、合理组合而成的一个完整的整体。该学科体系图不仅展示了学科信息学的主要研究内容与发展思路,更揭示了4个研究方面之间的关系。这4个方面既独立发展又相互影响,它们之间不是简单的线性关系,而是形成了循环促进的有机链模式,充分体现了学科信息学发展的全面性、深层次性、广博性与连续性。

       学科信息学的学科体系是在数据密集型科研背景下,根据学科信息学的特点、发展现状及需求总结而来的,是学科信息学通用的、一般的研究思路。同时还要注意到不同学科间的差异性,在应用时应结合具体学科、具体应用环境等进行适当调整,从而实现学科信息学的研究目的。

      

       图2 学科信息学的学科体系图

       3.3 学科信息学的关键技术与方法

       3.3.1 数据生命周期管理与分析

       数据既是数据密集型科学研究的中心,又是学科信息学研究的核心内容。对数据生命周期的管理、分析与挖掘,是学科信息学的重要研究内容之一。图3展示了数据在其生命周期中的流动情况,说明了数据的管理流程及其转换成新知识所需经过的步骤。该数据生命周期主要包括两大阶段:一是步骤1~5的新数据的收集,然后直接到步骤8的数据分析;二是步骤6~8的数据合成或元分析。当然,以上两大阶段并不是相互排斥的,各步骤也并非连续执行的,但学科信息学的工具与技术贯穿整个数据生命周期[24]。

      

       图3 数据生命周期图[24]

       3.3.2 知识发现过程与技术

       发展新方法、创造新知识,是学科信息学的核心研究内容。因此,利用计算技术与方法对学科数据进行分析,从而实现知识发现是学科信息学研究的关键内容与过程之一。图4描绘了知识发现过程流。

       知识发现主要工作流程如下:①从分布式、异构数据源中提取不同类型的信息;②使用多种知识发现算法(如机器学习等)从获取的信息中挖掘新知识;③利用推理技术,将上述新知识应用到学科发展中。图4中最左边的是数据层,主要包括数据的标准化、保存、组织、索引、如何呈现给用户、如何解释等语义协议。第二层是信息层或元数据层,应用于知识发现层的信息抽取的标准化表示是该层所必需的,也是整个知识发现过程流中关键的一层。该层包括标准化科研元数据、分类法、本体、术语表、基于XML的信息表示等[6]。第三层是知识发现层。利用各种知识发现算法与工具,从标准化的信息中发现新知识。最后一层是知识推理应用层。学科专家利用自己原有知识结构与体系,将获取的新知识重新应用到学科发展过程中。在整个知识发现过程流中,数据标准化及知识发现方法是关键。

      

       图4 学科信息学用以支持科学知识发现的过程流[6]

       3.3.3 学科信息学科研网络及专业数据平台建设

       科研数据网络是科研信息化基础设施的必要组成,贯穿数据密集型科研活动中的科研数据的产生、传输、存储、处理和应用各个环节,跨越地域时空,连接科学家、科研装置、科学数据库、文献情报等各项要素[4]。如今,快速发展的元数据、关联数据、云计算、云技术等技术为分布式、异构化、大规模的科研数据网络平台的构建与实现提供了良好的技术支持。该数据平台中不仅包括用于分析的所有数据内容,还包括对数据的处理与管理,是数据密集型科研环境下科研网络的重要组成部分。对科研网络及数据平台进行建设,是保证学科信息学快速发展的前提,对于满足不同科研需求、提升科研服务、实现科技创新等具有重要的作用。

       随着数据密集科研范式的发展,世界各国的专业领域科研网络陆续建成,如北美的Internet2、ESnet(Energy Sciences Network)、NLR(National Lambda Rail),欧盟的GEANT,连接欧亚科研网络的TEIN(Trans-Eurasia Information Network)等[44]。一些专门学科领域的数据平台也在不断发展完善,如世界微生物数据中心(World Data Center for Microorganisms,WDCM)[45],澳大利亚生物多样性信息系统(Atlas of Living Australia,ALA)[46],欧洲空间局空间环境信息系统(The Space Environment Information System,SPENVIS)[47],Eco-Informatics Center[48],基因组数据库(Genome Database,GDB)[49],人类基因组计划(Human Genome Project,HGP)[50]等。以上这些科研网络及数据平台的建成,极大地方便了科研数据的获取、存储、分析与知识发现,实现了科研信息间的快速有效传播,加快了科研进程,保障了科学研究的时效性。

       3.3.4 典型方法与技术

       学科信息学的交叉学科特性为其快速发展奠定了良好的基础,同时也为其支撑科研、服务创新提供了有力的支持。因此,除专门学科知识外,在数据生命周期管理与分析、知识发现过程与技术以及专业数据平台建设中,信息科学与计算技术得到充分利用。目前,学科信息学研究中涉及主要的信息科学与计算技术如图5所示,该图比较具体的说明了学科信息学中所使用的相关技术与方法。

      

       图5 学科信息学中的主要方法与技术

       信息科学是学科信息学的研究对象——学科数据信息加工与处理的理论基础与方法保障。信息科学中的信息论、概率论、统计学等方法,实现了对原始学科信息的初步处理与计算。图论、群论、拓扑学、运筹学等方法,实现了对原始学科信息的可视化及深层次挖掘。计算技术中常用的机器学习、知识发现、人工智能等技术,实现了对原始学科信息或初加工后的学科信息的挖掘,并寻找信息间的关联关系。互联网技术、虚拟网络技术等为上述技术的平稳运行提供技术支持。随着学科交叉融合的发展,信息科学与计算技术之间不是相互独立的关系,而是你中有我,我中有你的嵌套关系。因此,图中在信息科学与计算技术之间添加了一条黑色实线,表明二者间联系紧密。

       4 学科信息学发展与展望

       4.1 学科信息学极大改变相应学科知识创新的方式方法

       在小数据时代,科学研究一般遵循“理论假设—数据收集与分析—验证理论假设”的研究过程,其中理论假设处于研究的支配地位,并指导开展科学研究。然而在大数据时代,数据的爆炸式增长正在改变科学研究的方法,利用数据的相关关系来分析、探索未知世界将成为人类认识世界的主流方式。大数据的核心是“预测”,即基于海量数据的数学运算来“预测”事物发生的可能性,从而成为新发现、新发明和新服务可能的源泉。在大数据时代,数据再利用、数据重组、数据扩展等“数据创新”将成为科学研究与发现的“新常态”。在大数据时代,科学创新的开放性、共享性、协同性、跨学科性等特征将更加明显。

       学科信息学作为学科二元发展的一个分支学科,将成为并且已经成为学科发展的重要且不可分割的分支组成部分。例如,生物信息学已成为当今生命科学领域的研究热点之一,生物信息学的研究成果不仅对相关基础科学起到巨大的推动作用,而且还将对医药、卫生、食品、农林牧等行业产生深远的影响,引发新的产业革命。此外,生物信息学对未来军事和国防的影响也不容忽视[51]。

       随着共享科研信息进程的加快,医学信息学势必会影响健康和卫生保健类产品和服务的发展,同时,医学信息学还将影响医疗卫生机构和卫生信息通信技术产业的发展[52]。

       目前,生态信息学的出现与发展,支撑了在生物多样性保护和可持续环境方面的决定,将有利于有关全球变化的讨论[53]。生态信息学技术与方法的应用,将大大增加其在生态学领域的影响力。在不久的将来,生态信息学将会发展成为一门核心的、具有影响力的、纯正的应用科学[54]。

       专门的学科信息学是专门学科领域的信息数据计量科学、信息数据分析科学以及知识发现科学。因此,关于数据采集、存储、处理、规范、分析、解释的学科信息学的发展,无疑将极大地促进特定学科领域的知识创新和知识发现。已成为领域知识发现的有力工具。学科信息学的产生与发展是科学研究新范式的产物,由此专门学科领域的学科信息学还将不断涌现和发展。可以说,专门学科信息学发展的目的,就是开展专门学科领域的知识发现研究。

       4.2 学科信息学与数据科学的兴起与应用相互促进

       随着大数据时代来临,科学研究进入数据驱动的“第四范式”时代,“数据”成为科学研究、科学发现的战略与战术资源。可以说,没有数据,就没有科学;不能对学科领域数据进行科学地采集、处理、标准化、计量、挖掘等分析工作,就不能实现学科领域的科学发现和科学创新的目的。因此,“第四范式”时代,更确切地说不是“e-Science”时代,而是“D-science”时代(“数据科研时代”);第四范式科研,就是“D-science”范式科研。

       “D-science”时代,无论何种学科领域和学科方向,数据是基础,数据是知识发现的源头,数据是学科发展的金矿。开展以数据管理为中心、以数据分析为本质的科研活动,将成为科研的一种“新常态”。而基于现代信息技术开展的有关数据的采集、描述、存储、管理、标准化、应用、挖掘、解释等一切“以数据为中心”的数据化、特色化分析研究活动,可以遵循一般化的流程和规则。这种一般化的流程和规则,就是数据科学的流程和规则。

       除此之外,数据科学的发展,还将催生相关数据职业、机构以及产业的发展。例如,2009年NatahnYau提出了“数据科学家”(Data Scientist)概念,该职业已被誉为是21世纪的第六大职业[55]。数据科学家需要精通计算机科学、数理统计学、图形设计学等多种学科,应该说是D-science时代的领军人才。首席数据官(Chief Data Officer,CDO)[56]是企业随着不断发展而诞生的一个新型的管理者,其主要职责是负责根据企业的业务需求、选择数据库以及数据抽取、转换和分析等工具,进行相关的数据挖掘、数据处理和分析,并且根据数据分析的结果战略性地对企业未来的业务发展和运营提供相应的建议和意见。花旗集团旗下的企业与投资银行公司(CIB)曾任命John Bottega为公司历史上第一位CDO。首席数据官是企业数据的管理者,是企业应对大数据时代的变革性管理战略。

       国内在专业学科数据中心等机构或平台的建设上已取得了一定进展。“中国西部环境与生态科学数据中心”目前已形成了一套科学的数据共享体系[57]。“国家农业科学数据共享中心”已经积累了相当数量的专业数据资源[58]、国家人口与健康科学数据共享平台[59]等都得到了较好地使用与推广。

       企业对数据科学的应用更是引领着数据科学的产业化方向。阿里巴巴已经不仅是一家电子商务公司,更是一家数据公司。依托其拥有的海量交易数据,利用信息技术方法,根据机器学习、人工智能算法,实现向购物者自动推送产品的目的。IBM也涉足数据行业,与国内医疗机构合作建设医疗卫生服务信息系统。如今的互联网金融[60]、智慧医疗[61]、数字城市、智慧城市[62]等新兴数据产业的发展,从实践与应用角度无不印证着“D-science”时代的到来。

       4.3 学科信息学推动科学数据管理与知识计算的理论、方法与应用的发展

       2000年英国提出e-Science的概念,目的就是应对信息化时代科学研究领域面临的复杂挑战,利用网络信息技术和高性能计算环境建立全新的科学研究模式。其核心是利用先进的信息技术,通过网络将科学数据的采集、传输、存储、处理等科研活动融为一体。说到底,e-Science科学模式的成败,关键决定于对海量科学数据的“科学管理”、“计算分析”。因此,科学数据管理与知识计算分析,成为e-Science科学模式发展的重中之重。

       回到文献学、计量学、情报学等文献与信息分析领域,其中涉及的有关知识计算的各种理论、方法和技术,必将随着知识计算、分析、管理的“对象”从文献(图书、论文、专利等)类的“粗颗粒”或“实体颗粒”的知识单元,迅速过渡到“细颗粒”、“微颗粒”、“虚拟颗粒”的“数据”类对象而不断更新并深入发展。因此,可以说,“D-science”时代的来临、学科信息学的蓬勃发展都预示着文献学、计量学、情报学数据时代的到来。从事文献学、计量学、情报学领域的专业信息分析的科研人员,必须迅速意识到这种变化,及时调整工作思路与方法,充分利用好数据时代所带来的机遇与挑战,为科学数据管理与知识计算学科的发展做出积极贡献。

       4.4 学科信息学是情报研究新范式的支撑学科

       学科信息学将成为学科情报分析研究、科技战略情报研究的重要支撑学科,成为计算型情报研究的重要方法和技术,成为情报学理论研究的重要内容和发展方向。

       科技战略情报研究主要包括科技基础数据监测分析、科技发展态势监测分析、学科领域研究动态分析预测、重大科技问题深度战略分析与咨询、科研机构竞争发展态势分析、科技体制机制政策分析等工作内容。以上基于科技内容的科技情报分析研究都必须基于专门学科领域,并利用信息及数据科学的计算方法与技术,实现计算化、定量化的数据内容挖掘和分析。在数据密集型科学研究新范式下,科技情报研究正处于从资料收集到知识挖掘、从资料翻译到知识计算、从传统经验分析到规范分析、从背景分析到提供解决方案的范式转型期,专业型、计算型、战略型、政策型、方法型“五型融合”的情报研究新范式已经形成[63]。学科信息学的发展将对专业型、计算型、方法型情报研究提供坚实的理论方法支撑,促进情报研究新范式的深入发展。

       4.5 学科信息学的展望

       专门领域的学科信息学的发展与应用已经取得了显著成效,对促进一般学科信息学的产生与发展起到了积极的推动作用。但一般学科信息学的概念才刚刚提出,还处于学科发展的萌芽阶段。学术界在其概念、研究内容、研究方法、学科体系等方面必然存在一定的分歧。可以说,学科信息学还处在前学科(其特点是科学工作者对于他们所从事的学科的基本原理,甚至有关观察现象,完全不一致,经常争论。对问题和现象有自己独特的看法,科学共同体成员缺乏一致的信念)与常规学科之间的发展阶段[64],还面临着许多问题。例如,学科信息学的理论基础问题。由于学科信息学的交叉学科地位,理论基础来源不够清晰,这有可能阻碍学科信息学的持续发展;数据资源的开放共享问题,如数据开放与共享的协议、标准、平台建设等。学科信息学的主要研究对象就是各学科的丰富的数据信息,各学科之间以及各国之间,应该在平等互惠的基础上,遵循一定的标准和规范,在公共平台上开放其科研数据,以促进一般学科信息学的发展,服务专门学科信息学的发展和应用,进而促进基于大数据的科学研究创新和知识发现。

标签:;  ;  ;  ;  ;  ;  

论学科信息学的兴起与发展_大数据论文
下载Doc文档

猜你喜欢