数据素养的建设与战略思考及其培养机制_大数据论文

数据素养及其培养机制的构建与策略思考,本文主要内容关键词为:素养论文,机制论文,策略论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       数据产生巨大价值,数据驱动创新的时代已经来临。在科学研究、生产制造、国防安全、社会管理等各个领域,数据正在爆发性增长,社会由此进入到了一个数据类型多样、来源丰富、数量庞大、价值巨大的全新时代,对数据的获取、管理和利用也成为大数据时代人们必备的技能素养之一。2012年初,美国总统奥巴马发起了“大数据研究与发展项目”(Big Data Research and Development Initiative)[1],该项目的目的在于发掘从大量数据中获取知识和观点的能力,以此来促进科学与工程发展,强化国家安全,达到教育与学习的革新。当今,数据密集型科研悄然兴起,研究者遇到越来越多的数据策管、出版、引用以及数据生命周期等方面的问题[2],科学数据素养在科学研究生命周期中的影响作用日益凸显,已经成为科研人员提升科研创新能力的必备因素和核心竞争力。

       国外十分重视研究者数据素养的培养和下一代数据人才的储备,部分高校已经开始开展数据素养教育活动。2012年,美国博物馆与图书馆服务研究所(Institute of Museum and Library Services,IMLS)资助了“数据信息素养”项目,目的在于培养将来的科研人员查找、组织、处理与共享数据的能力[3]。英国牛津大学图书馆在联合信息系统委员会(The Joint Information Systems Committee,JISC)的资助下开展了嵌入科研中的数据策管服务(Embedding Institutional Data Curation Services in Research,EIDCSR)项目研究。该项目为用户提供了数字存储平台,在该平台上实现数据管理、发布和保存的服务[4]。

       我国数据素养问题也开始引起社会各界,特别是图书馆界的关注。如何增强研究者的数据意识、数据查找与分析技能,推进数据管理与共享——一系列数据资源管理服务问题有待我们探讨研究。围绕数据素养和数据资源管理,图书馆的服务面临新的挑战和机遇,积极开展数据素养教育已经成为当前一项紧迫和重要的任务。鉴于此,本文在阐述数据素养概念及其包含的核心要素的基础上,结合国外高校图书馆数据素养教育的实践经验,对我国开展数据素养教育培养机制和路径选择进行了研究。

       1 数据素养的概念及其发展

       数据素养的概念最早起源于美国教育界。长期以来,美国的大学生对文科、商科感兴趣,但不注重科学、技术和医学(Science,Technology and Medicine,STM)。出于未来国家竞争力方面的考虑,美国政府希望扭转这种局面,于是2012年总统奥巴马推出了一系列的教育创新项目和计划,从学校教育着手,开设相关的数据知识和处理技能方面的培训,其核心内容就是科学数据素养[5]。数据素养概念虽然是近两年才提出的,但是追根溯源可以发现数据素养和早先学者提出的计量素养和统计素养有着密不可分的联系。

       1.1 计量素养与统计素养

       早在20世纪80年代末,计量素养就在西方的高等教育中崭露头角。当时,由英国经济和社会研究委员会起草的国家战略中就有将计量方法运用到社会科学中的培养计划[6]。2008年,Steele和Kilic-Bahi将计量素养理解为用简单的数学概念处理日常生活中的问题的能力[7]。Steele提出学生需要具备的不仅仅是数字处理能力,同时还需具备推理、论证和观察的素养和能力[8]。

       统计素养是计量素养的一个重要组成部分。Wallman认为统计素养是理解和批判性地评价渗入到日常生活中的统计结果的能力,以及能为个人决策、专业决策和公共决策提供统计学上的考量的能力[9]。Watson定义了统计素养应该具备的三个决定性能力:一是对概率和统计术语的基本认识,并能够进行分析和统计计算的能力;二是理解社会媒体环境中的概率和统计概念的能力;三是批判性的评价统计结果的能力,这些统计结果是关于采样、原始数据的分布、恰当地运用统计数据、图表以及概率表述等[10]。

       1.2 数据素养

       由于社会科学和开放数据社区的飞速发展,推动产生了和统计素养相关的一个新名词——数据素养。有些学者将它等同于统计素养(Stephenson和Caravello,2007)[10],而另一些学者,如Schield,发现了其差异化特性。这部分学者认为数据素养是统计素养的一部分,它包括培训个体具备获取、评价、处理、总结和展现数据的能力,而统计素养的目的是教会个体如何“批判性思考统计数据”。两个概念共有一个必不可少的组成部分——批判性思维,它是由数学和统计能力、常识以及个人的价值观所决定[11]。这两个概念和传统的信息素养的概念看似很相似,但数据素养更强调有效地获取、处理和使用数据。Hunt指出“在实际运用上,数据素养和传统的信息素养有很大不同”[6]。这个不同之处主要是由于和处理其他类型的信息相比,处理数据更为复杂。尽管如此,数据素养和信息素养有很多相似之处,正由于存在这些相似,部分学者将数据素养看做是信息素养的扩充或者是它的一种形态。基于这样的观点,则可以把数据素养定义为包含统计素养的更大范畴的概念。

       在当今信息和网络社会,信息素养的概念逐渐被人们熟知。为什么我们还要提出数据素养的概念?原因是,借助计算机和网络来处理信息的技能已被人们所掌握,平台和方法的约束已相对较不明显,数据作为信息资源的基本单元则显得愈发关键。数据素养是信息素养的重要方面,更是科学素养的重要组成部分。无论是数据科学家,还是传统行业或是新兴行业的从业人员,数据驱动创新的挑战都是所有人将面临的,个人生活和社会管理的方方面面都需要依赖数据作决策。认识数据的价值和负面影响、掌握数据并用好数据,在目前新的移动智能工具越来越被广泛应用的趋势下,将成为未来信息素养竞争的决定因素。

       综合国内外文献论述和研究发展,本文认为:数据素养是具备数据意识和数据敏感性,能够有效且恰当地获取、分析、处理、利用和展现数据,并对数据具有批判性思维的能力,它是对统计素养和信息素养的延伸和扩展。

       1.3 数据素养的研究现状

       近年来,国外对数据素养的重视程度和研究逐渐上升。2007年冈特(G.A.Gunter)就指出了数据素养的重要性,提出应培养学生的数据素养,并规划了数据素养的发展策略[12]。美国国家科学基金(National Science Foundation,NSF)2007年资助了雪城大学信息研究院的秦健教授设计的数据管理课程,该项目用于提升学生e-science环境下的数据素养[13]。美国很多研究型大学图书馆对于数据管理的技能培训和咨询服务方面非常重视,例如康奈尔大学图书馆开展了很多关于数据素养方面的讲座,并参加了高校科学数据管理项目,以此发挥图书馆员在数据素养教育和数据管理服务上的作用[14]。

       国内关于数据素养的研究近一两年才开始,如缪其浩定义了数据素养的概念,指出数据素养是这样一种能力:了解本专业的数据问题和含义,可以和数据专家直接交流,并能制造数据价值,帮助企业提高核心竞争力,以及增强管理决策的时效[5]。何涛阐述了数据素养的概念并揭示了它和信息素养的关系,认为数据素养是对科学数据有效地进行获取、分析和创新利用的能力。数据素养则可认为是信息素养的子集[15]。张静波从科研生命周期的角度阐述数据素养的概念,认为数据素养包括科研人员在对科学数据的采集、组织、处理、分析、共享过程中应具备的能力,以及在整个数据生命周期中遵守的道德与行为规范[12]。

       2 数据素养的基本要素

       从数据素养的概念可以看出,数据素养是对数据的理解、交流、获取、运用的能力,即可以看作是对数据的“听、说、读、写”的能力[16]。结合信息素养理论的研究,把数据素养归纳为数据态度、数据意识、数据知识、数据技能和数据伦理5个方面的基本要素。本文将从这5个方面对数据素养的核心内容进行阐述。数据素养的5个基本要素及其核心内容见图1。

      

       图1 数据素养的5个基本要素及其核心内容

       1)数据态度。数据态度是数据素养的前提。对待数据的态度是主观能动性方面的内容,它直接影响着数据的收集、分析、处理、分享和呈现的过程以及最终结果。数据态度还包括对待数据价值和数据伦理问题方面的内容。如果说数据知识和数据技能可以通过活动来训练,那么对数据的态度则是道德观和价值观的表现,它对在整个数据生命周期中研究者的反应、倾向和行为起决定性作用。再多再有价值的数据如果没有用到实处,那么只能沦为摆设。同样,在数据展示上,越来越多的人尝试运用数据可视化,但是很多情况是数据关没把好,绚丽的信息图只是流于形式而内容空洞甚至数据相悖,这种对数据本身不够重视而花大部分时间在展示效果上的行为是舍本逐末。大数据环境下,对数据和数据问题积极、正确和严谨的态度,是进行研究工作所必需的,它可以促进海量数据有效地转化成高价值的可见结果。

       2)数据意识。数据意识是数据素养的先决条件。包含了对数据的敏感程度,是对数据和数据问题敏锐的感受力、持久的注意力和对数据价值的洞察力、判断力等。它决定了捕捉、判断和利用数据的自觉程度。数据意识包括数据主体意识、数据获取意识、数据共享意识、数据更新意识、数据安全意识以及数据人才意识等。同时,数据意识是衡量数据素养的一个重要方面,数据意识的强弱决定了研究者是否能有效地处理和利用数据,是否能在第一时间挖掘有用的数据信息,以及高效地传播和分享数据成果,直接影响科学数据管理的过程和效果。数据态度和数据意识是数据素养的两个不同方面内容,数据意识决定了数据态度,同时,数据态度影响了数据意识。

       3)数据知识。数据知识是数据素养的基础。具体包括以下几个方面的内容:数据的特征和类型、数据的效用、数据的传播规范和展示规律、数据格式的转换方式、数据搜索方法等。对于科研人员,数据知识不但可以改变原有的知识构成,还能够激发原有的专业知识,推动文化内涵和专业知识发挥出更大的效用。同时,扎实的数据知识可以帮助科研人员更好地挖掘数据价值。

       4)数据技能。数据技能是数据素养的保证,它是数据素养最重要的一个方面。包括获取、处理、利用、展示、评价以及再创造数据的能力等。有些数据技能可以通过技术培训来获得,如数据获取能力、处理能力和展示能力;而有些技能则需要长期的实践积累来获得,如数据的运用能力、评价能力。善于运用数据挖掘、分析、可视化工具来展现大数据中的价值,可以为人类和社会创造巨大的财富。在当前的科学研究领域,传统的数据保存机制和数据管理模式逐渐淘汰,算法开始失效,缺乏对数据进行科学地分类、管理、分析、挖掘的技能和工具,这将极大地阻碍创造和获取更大的数据价值和科学财富[17]。在大数据环境下,数据技能教育日益重要和紧迫,其目的就是训练研究者在大量无规律的数据中辨别出自己所需的数据,并能根据所掌握的知识、技能和工具,迅速有效地获取、利用数据,并创造出新数据。

       5)数据伦理。数据伦理是数据素养的准则,它是数据素养中不可缺少的一部分。数据伦理,是指在获取和利用数据时,要树立正确的法制观念,增强数据安全意识,提高对数据的判断和评价能力,准确合理地使用数据资源。在实际研究中,数据的来源渠道通常多种多样,数据类型不尽相同,数据质量也参差不齐,其中很大一部分是关于个人的或者私有的,如果忽视个人隐私和数据安全的问题,那么这些数据会被某些个人、数据采集公司甚至一些国家滥用,人们肯定就不再相信大数据,这对挖掘更大的数据价值是百害而无一利的。因此,数据伦理影响和制约着数据素养中的每一个要素,不容忽视。

       3 数据素养培养机制的构建路径

       大数据环境下,数据素养已经成为提升科研创新能力的必备因素和核心竞争力,是信息社会对人的发展的核心问题。据不完全统计,全世界范围内开设了大数据相关专业的学校有近170所,其中开设了硕士以上学位课程的大学约150所[18]。美国国家科学基金会为了应对将来大数据人才的缺乏,开始实施一项完整的长期战略,内容涵盖了从数据中获取知识的新途径、数据管理的基础设施、教育和团队建设的新方法[19]。近年来,英美高校图书馆已在数据素养培养和科学数据管理服务的各个方面进行了大量的实践。例如牛津大学图书馆研究数据管理部门为用户提供了丰富的培训资源,包含IT学习计划、数据管理培训课程、为研究生设计的研究技能工具包网站、牛津高级计算中心培训项目及英国数据监管中心(Digital Curation Center,DCC)等馆外机构培训服务[20]。由联合信息系统委员会(Joint Information Systems Committee,JISC)资助,英国爱丁堡大学数据图书馆开发的MANTRA数据管理在线培训课程帮助科研人员提供学习指南。该课程具体内容包含:科研数据概念的介绍,数据格式与转换,数据保存、版权与获取,数据管理计划,数据文件与元数据,数据授权和共享等模块,另外还包括对R、SPSS、NVivo和空间数据处理软件ARCGIS的实践练习[21],涉及数据管理的各个方面。近年来,我国一些高校图书馆在“大数据”相关的专业教育方面进行了一些探索和尝试,但是相比国外图书馆,我们起步较晚,存在较明显的差距,在科学数据素养的概念上缺乏深入的研究,并没有足够地重视对数据素养的教育,相关政策、标准的支撑也较薄弱,且尚未形成完备的教育体系和模式。因此,在当前大数据趋势下,积极开展数据素养教育已经成为我国当前的一项紧迫和重要的任务。笔者认为,数据素养的培养机制要从国家、社会和学校3个层面上建立相应的机制,才能有效地推进数据素养的培养进程。

       3.1 国家层面

       从国家层面上,制定数据素养的国家标准。数据素养教育的方向需要科学、完善的数据素养教育评价标准体系的指引,同时它也是进行数据素养评价的依据。我国目前还没有一所大学制定了自己的数据素养培养标准,各个高校的数据素养教育处于一种无序的状态。虽然国外很多高校都很重视数据素养方面的建设,但目前也尚未形成具体和完整的评价体系。相比之下,信息素养教育标准则具有参照和借鉴价值。2000年初,美国大学与研究图书馆协会(ACRL)在美国图书馆协会(ALA)冬季会议上通过了《高等教育信息素养能力标准》(Information Literacy Competency Standards for Higher Education)。它具体包括5项标准和22项执行指标,分成标准、执行指标和效果三个模块[22],将信息素养的内涵和要求较为全面地进行了揭示。同样的,建立一套符合高校自身特点的数据素养教育评价标准非常有必要。这需要加强高校和社会各界的合作,以及国家政策的支持和干预,充分发挥各部门的作用,建立全国性的权威数据素养培养机构。参照美国信息素养标准的执行指标,我们可以对其5项标准的核心内容和尺度作分析,在这个基础上结合数据素养自身的特点,展开对普通社会公民、科研人员、学生这三类不同需求人群的数据素养能力培育的思考,再根据我国国情和高等教育特色,制定出我国的数据素养标准体系。

       3.2 社会层面

       从社会层面上,坚持积极正确的舆论导向,营造良好的数据文化氛围。社会环境对公民的数据素养形成有着至关重要的作用。面对数据密集型的知识环境,统计和数据分析能力相信在不久后将成为与今日计算机和英语一样的大学生必备的基础知识框架中的重要组成部分[23]。不久的将来,大数据时代全面到来,由数据素养层次的不同所形成的差异将是巨大的。因此当前就应开始考虑将科研数据管理和数据素养纳入到全民的信息素养教育中去,在基础教育、高等教育和社会教育中规划并推进数据素养教育,全面提高公民的数据意识,营造良好的数据文化,这无疑有利于社会的公平稳定和国家综合实力的提高。

       3.3 高校层面

       从高校层面上,学校教育是数据素养培养的主要力量,建立意识引导、教育实践和环境创造“三位一体”的培养引导机制是关键。

       1)以数据意识培养为核心。数据意识是数据素养最深层次的问题,高校可以结合教学与科研实际,加大对正确的数据态度、处理方法和数据价值方面的引导和宣传,营造良好的数据文化环境,让正确的数据理念渗透到科学研究中去。

       2)构建数据素养的课程体系。国外很多高校面向研究生和某一学科的研究人员开展了数据素养课程。例如,美国的明尼苏达大学为新入学的研究生开设了数据管理的在线培训[24];加州大学伯克利分校为信息管理与系统专业的硕士开设了研究数据管理方面的课程和实践练习,围绕科学研究生命周期提供数据管理指导,该课程已被英国科学数据管理中心(Digital Curation Centre,DCC)所认证[25]。结合我国高等教育的实际情况,数据素养教育课程的设置要从不同人员的数据素养的培养目标入手,形成以教授数据基本知识为基础,培养数据意识为先导,数据伦理道德为总则的动态的、开放的课程结构体系。

       3)创造数据素养教育的良好环境。数据素养教育是一个系统工程,涉及的部门繁多,需要统一的规划设计和长期建设。除了各个学院系所、图书馆、各专业教学机构外,还涉及教务处、信息中心、科研管理处等部门,应加强各部门的协调,通过统一的规划和合作,建立一个良好的培养环境[26]。同时,要加强校园数据素养文化建设,搭建流畅的数据素养交流平台,针对科研人员和学生面临的问题和感兴趣的话题,利用现在主流的网络沟通工具,如微信、微博、博客、论坛、QQ等进行在线交流想法、讨论问题;在线下,深入渗透到科研团队、兴趣小组、学生社团、学术圈子中,了解他们在科学数据管理和数据素养上的真实想法和紧迫需求,有针对性地开展数据素养教育,帮助学生和科研人员管理他们自己的数据,消除他们的困惑,培养良好的数据素养能力。

       4 我国开展数据素养教育的策略思考

       目前我国在数据素养方面的研究还在起步阶段,尝试开设数据素养教育课程的高校或者图书馆较少。而在国外,早在几年前高等学校就对科研人员和数据服务人员的数据素养培养非常重视,具备高水平数据素养的专业人才也很受欢迎。国内虽然部分图书馆偶有开展数据资源获取、科研管理软件或者数据分析软件的讲座培训,但仅是涉及数据素养的一个小方面的内容,并未有系统性的培养模式。针对我国高校目前数据素养研究和教育实践匮乏的情况,本文提出了如下的几点策略。

       4.1 分不同学科领域开展与其专业背景相关的数据素养教育

       不同的学科领域,知识结构、科研环境、研究倾向都不相同,对于数据知识与服务有着不同的需求。如文科和理工科这两类研究者,在研究活动中他们的数据需求不同,所表现出来的数据态度和数据意识截然不同。文科研究者善于数据的收集和积累,但对数据的处理、利用和保存上欠缺科学的方法和技能;理工科的科研人员更善于挖掘事实数据,更注重数据分析工具的使用和客观数据的分析利用。这些关于数据的行为习惯的不同表现是和他们从事的专业领域分不开的,所以在开展数据素养教育前应对不同专业背景的人员进行针对性地调查,深入了解每个专业领域的数据类型、数据和元数据格式与内容、数据获取方式、数据处理和利用手段等,了解不同背景科研人员的数据管理需求,以及他们在科研生命周期中管理自己的数据时遇到的问题。这些调查不仅为接下来开展针对性的数据素养教育打下了坚实基础,并且对数据素养的概念和理念也是很好的宣传。

       4.2 针对不同培养对象,按其需求侧重不同的培养方面

       不同层次对象的数据素养教育需求是有差异的,基本可以分为三大类培养对象:科研人员、学生和普通社会公民。科研人员关注的是数据生命周期如何很好地融入整个科研生命周期中,如何撰写符合数据管理与共享要求的科研数据管理计划。学生主要是参与完成项目研究的数据利用与管理,可能更为关注数据收集、分析与处理过程。对于普通社会公民,面对当今大数据趋势,数据意识和数据基本能力将成为重要的基本素养,应该考虑开展符合全数字化时代特征的通识教育,提高社会公民的数据意识、数据知识和技能,将数据素养教育纳入到全民信息素养教育中。

       4.3 建立数据资源管理的“云”平台推进数据素养教育

       目前,国外高校多渠道、分等级、分专业、实践教育的数据素养教育模式非常值得国内高校借鉴。少数国外高校建立了数据保存、管理和共享的数据资源系统,结合图书馆的数据服务项目开展数据素养教育。针对学生和科研人员在大数据时代的新需求:更加智能和直观地检索数据、更方便地获取数据、个性化的数据服务以及互动性的数据服务活动等,我国高校要充分利用自身在资源收集、组织和服务方面的优势和条件,建立数据资源管理的“云”平台来开展全面细致的数据素养教育。在这个“云”平台中,数据资源管理体系完善有效、数字资源保障体系丰富全面、数据存取体系高速高效、数据资源利用体系方便合理、数据传送共享体系广泛快捷,本校或者区域范围内高校的数字资源服务“云”最大程度上得以实现[27]。同时,在“云”平台上可以搭建学科的特色数据库、数据知识聚合社区、数据素养精品课程、数据分析处理工具等内容,构建一个以云存储为依托的数据资源存储系统。另外,基于这种新的服务模式,可以建立一个有序的、能统一检索的数据资源集成体系,在这个体系中整合更多的数据资源。特有的数据资源定制、数据推送等个性化服务功能、互动功能能够开展。同时,借助云计算的海量数据挖掘功能进一步开发数据资源,最终达到数据服务的高性能,全面推进数据素养教育。

       4.4 着力培养具备科学数据管理服务能力的人才是当务之急

       图书馆过去一直承担数据资源服务和信息素养教育的工作,但这并不是真正意义上的数据素养教育,馆员自身的科学数据素养也不够。一些国外高校图书馆为了推进数据管理与服务工作专门设置了数据馆员的岗位[28]。目前国内数据素养教育进展非常缓慢,其中一个重要的原因是缺乏具备科学数据管理服务能力的人才。数据人才储备的不足直接影响和制约了科研人员和学生的数据素养水平的发展。随着数据密集型环境的到来,对具备数据素养教育服务能力的人才或者拥有科学数据管理和培训技能的馆员日益缺乏,要求也越来越高。如前所述,数据素养教育的开展不能单靠图书馆一己之力,需要各部门的协作,设立专门组织,重视数据人才和馆员的继续教育,推进数据管理服务的开展,为数据素养教育和科学数据管理服务的开展做好人才储备。

       5 结束语

       科学数据素养在研究者的科研活动中的作用越来越重要,逐渐受到科研管理机构、数据服务机构、图书馆界等的重视。目前,对数据素养概念尚未有统一的界定,大数据环境下数据素养教育的内容和特征也有待深入探讨,如何制定数据素养能力的标准和评价体系还需要进一步研究。数据态度、数据意识、数据知识、数据技能、数据伦理这5个方面的要素直接渗透到科学研究生命周期中,影响项目研究的各个阶段。高校要积极探索数据素养教育的路径和模式,营造良好的数据文化氛围,构建数据资源管理的“云”平台,有针对性和系统性地提高科研人员和学生的数据素养。同时,图书馆要充分利用现有优势,认识到其数据素养的教育职能,重视数据管理服务及数据馆员的培养和发展,为数据素养培育和科学数据管理服务工作的新方向新挑战做好人才储备。

标签:;  ;  ;  ;  ;  ;  ;  

数据素养的建设与战略思考及其培养机制_大数据论文
下载Doc文档

猜你喜欢