数据素养教育:大数据时代信息素养教育的拓展,本文主要内容关键词为:素养论文,数据论文,时代论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G250 [文献标识码]A [文章编号]1003~2797(2016)01~0021~09 DOI:10.13366/j.dik.2016.01.021 数据素养已成为大数据领域研究的热点问题之一,用于表述数据素养的术语很多,常用的有“数据素养”(data literacy)、“数据信息素养”(data information literacy)[1]、“数据与信息素养”(data and information literacy)[2]、“数据管理素养”(data management literacy)[3]、“信息和数据管理素养”(information and data management literacy)[4]、“科学数据素养”(science data literacy)[5]、“研究数据素养”(research data literacy)[6]等。笔者倾向于用“数据素养”,因为它表述简洁、从字面上易于与信息素养区分开来;数据比信息的外延大,“数据素养”与“信息素养”并列不太合适;而科学数据素养、研究数据素养的面较窄,难以涵盖其他类型的数据。联合国2014年12月发布的文件中使用“数据素养”[7];在信息素养教育领域最具影响的机构——美国大学与研究图书馆协会(Association of College & Research Libraries,ACRL)[8]也多次用该称谓。 国外关于数据素养的国家级项目、课程日益增多,国内学者关于该主题的成果也不断出现,但尚未发现就数据素养教育与信息素养教育关系进行讨论的专文,本文拟作尝试,以期为国内即将开展的数据素养教育提供些许参考。 1 数据素养与信息素养的关系 1.1 信息素养与数据素养的侧重点不同 一个广为接受的观点是信息素养侧重于信息的可找到与可利用,而数据素养则侧重于数据的生产、保存与管理等技术性更强的方面[9]。其次,信息素养的测度体系一般以度量用户搜寻信息的过程和用户反馈为主,数据素养的测度则更关注对结果的评价,即数据的准确性、数据是否得以妥善的处理、数据能否得以长期保存等。 1.2 数据素养比信息素养的外延更广 关于信息素养的定义,目前最新、最权威的是ACRL于2015年1月6日通过的《美国大学与研究图书馆协会高等教育信息素养框架》(ACRL Information Literacy Framework for Higher Education)中的定义:“信息素养是包含反映发现信息、理解信息生产和价值、使用信息创造新知识和参与社群学习的综合能力的集合。”[10]由于信息素养不能涵盖一些新的素养,如媒体素养、视觉素养等,所以有学者提出了“元素养”的概念[11]。 关于数据素养的定义,目前尚无统一的界定,被引用较多的是以下2个[9]:2007年,Stevenson和Caravello[12]定义为:找到、评价和有效合理使用信息(包含数据资源)的能力;2011年,Hogenboom等[13]界定为:阅读、解释、分析、批判性思考统计数据以及将统计数据作为证据的能力。上述2个定义均与图书情报学的理解有出入,在图书情报界,数据素养是目前流行的术语,由信息素养和数据管理两个部分组成。 笔者认为,数据素养包括3个方面:①数据意识;②数据能力:即贯穿于数据生命全周期的数据采集、表示、描述、发现与检索、选择与评价、分析、利用、引用、整合、复用、保存、管理等一系列活动所需的技能;③数据伦理。 2 数据素养教育的内容更加宽泛 2.1 数据素养教育内容的3个模块 与前文数据素养定义相对应,数据素养教育包含3个模块的内容:培养数据意识、培育数据能力、树立数据伦理。 其中,数据意识包含数据价值意识与数据安全意识;数据能力涉及数据管理的生命全周期所需要的能力,有别于信息能力主要侧重信息的获取与利用、极少涉及信息的保存、信息管理规划;数据伦理包括数据隐私、数据的合理与合法利用、数据交流的规则等。 数据素养教育内容非常多,笔者另有专文讨论,限于篇幅,本文在此不予详述。 2.2 数据素养教育涉及的学科更多 笔者对国内外数据素养教育类课程开设情况的调研表明,数据素养教育除了图书情报学外,还涉及统计学、生物信息学、信息科学、商学、教育学等。表1是全球最大的MOOC平台Coursera中具有代表性的数据素养类课程,不难看出下列课程分别来自不同的学科。 由于意识到数据素养课程涉及的学科面广,英国工程和自然科学研究委员会(The Engineering and Physical Sciences Research Council,EPSRC)建立了一些跨学科的博士中心(doctoral centres)以联合计算机科学、数学等学科的师资来培养硕士后人才,计算机科学、数学和物理学的硕士研究生可申请进入该中心。英国的一些机构已开设或拟开设由计算机科学与数学系联合讲授的跨学科的本科生项目。如2014年,诺丁汉大学等8所大学宣布开设数据科学的学位项目(data science degree programmes),拟于2015~2016年或2016~2017年启动,这些学位的课程强调培养具有数据素养要求的一系列技能。 2.3 美国多个知名机构明确提出将数据素养增加到信息素养中 2.3.1 IMLS 美国博物馆和图书馆服务署(Institute of Museum and Library Services,IMLS)资助了调研数据信息素养的研究项目,并且建立了专门的网站[14],该项目将数据与信息并列,说明其意识到信息素养不能涵盖数据素养。2015年,IMLS资助了密歇根大学信息学院(University of Michigan,School of Information)24万美元支持为期2年的项目“支持图书馆员将数据素养技巧增加到信息素养教育”(Supporting Librarians in Adding Data Literacy Skills to Information Literacy Instruction)[15],这个项目对数据素养和信息素养之间关系的解释再次表明了该观点。 2.3.2 ACRL 美国大学与研究图书馆协会(ACRL)发布的《面向高等教育的信息素质框架》新增了data literacy的相关内容[10]。在ACRL 2015年年会上,Adam Beauchamp做了题为“在基层推广数据素养”(Promoting Data Literacy at the Grassroots)的主题发言。持类似观点的还有Calzada Prado等[16]。 2.3.3 ALA 美国图书馆协会(American Library Association,ALA)于2015年1月5日起开设了名为“向高校学生教授信息素养”(Teaching Information Literacy to College Students)的在线课程(eCourse),旨在推动上述ACRL《面向高等教育的信息素质框架》的实践,将数据素养放入信息素养的概念中进行教学。上文提到的MOOC“元素养”也是ALA推荐学习的课程,中间同样提到了互联网数据管理的内容。 2.3.4 ASIS&T 美国信息科学和技术协会(American Society for Information Science and Technology,ASIS&T)的“数据存取和保存研究”(Research Data Access and Preservation,RDAP)峰会研究了数据管理过程中的具体行为,包括数据引证、数据验证等,认为这是数据素养的重要组成部分[17]。对于这个观点,加州大学伯克利分校的信息素养专家Amanda Wanner认为“数据素养对于图书馆学是一个较新的概念,虽然数据素养包括评价、保存、分析以及管理数据,但这些技能要求相对于图书馆学专业并不是较新的内容。数据素养的核心能力是在工作中理解数据、理解数据表达什么,包括对图表和统计资料的理解、能够正确从其中得出结论。还有人认为数据素养有不同层次的能力要求,包括正确分析数据、评价数据和使用适当的工具管理数据。”[1,18] 3 数据素养教育的主体更加多元化 如前所述,从实践上看,已开设的数据素养课程很多,开设的主体各不相同。 3.1 图书馆 信息素养教育领域最具影响的机构ACRL认为,最好是由图书馆员讲授数据素养类课程。研究者和学生作为数据使用者和未来数据创造者,应该受到训练以便理解他们的选择如何影响数据的存取、重用与保存。图书馆比任何一个学术机构都适于实施这种训练[8]。 3.1.1 具备扎实的基础 图书馆(尤其是高校图书馆)是信息素养教育的主要实施者。自教育部1984年2月发出《印发关于在高等学校开设“文献检索与利用”课的意见的通知》以来,我国高等学校图书馆在信息素养教育中发挥了重要作用,积累了丰富的经验。各高校图书馆面向所在学校开设覆盖全校的文献检索与利用课程,既有综合性的信息素养教育内容,也有面向不同学科或专业的信息素养教育课程。 信息来源于数据,学术出版物中蕴含的文本信息是一种数据,学术出版物与数据可通过链接建立联系。从信息素养教育发展到数据素养教育是一个很自然的过程,图书馆员具备终身学习的理念,掌握信息组织、检索、分析与利用的技术与方法,因而拥有能够将信息素养教育转换成数据素养教育的技能与知识。 3.1.2 图书馆发展与创新的需要 随着搜索引擎的普及与功能优化,很多用户获取信息的首选已经不是图书馆,而是利用搜索引擎自助,图书馆需要通过新的服务将这些用户争取回来。随着大数据时代的到来,海量数据的价值只有经过具备良好数据素养者的利用才能得以体现与挖掘,尤其是在高校图书馆,随着数据驱动科学(data-driven science)的发展,图书馆需重新界定自己的服务,数据管理成为很多图书馆的新业务,可对师生产生重要影响;图书馆的教育职能要求其尽力塑造出色的学者,增强其发现、保存与传播知识的能力,在校大学生与研究生作为未来研究人员来源,是大学图书馆用户教育的主要接受者。 3.2 图书情报学院(系) 图书情报学(Library and Information Sciences,LIS)是与数据、信息有着密切联系的学科,必须适应大数据时代的需要,参与数据素养教育。 数据素养课程开设早、影响大者当推美国雪城大学(Syracuse University)的秦建面向研究生开设的“科学数据管理”(The Scientific Data Management)。该课程2007年获得美国国家自科基金委资助,其教学内容分为3个模块:科学数据的基础、数据管理及案例研究、科学数据利用及其相关问题,如管理工具、可视化、质量控制等。课程结束后,学生需在老师的指导下完成一个综合性的数据管理项目,作为课程考核的一部分。 美国23所开设数据科学硕士学位项目的学院中有2个来自LIS领域[19],即印第安纳大学伯明顿分校信息与图书馆学院(Indiana University,Bloomington,School of Information & Library Science)全日制的“数据科学硕士”(Master’s in Data Science,M.S.)和加州大学伯克利分校信息学院(University of California,Berkeley,School of Information)的“在线信息与数据科学专业硕士”(Online Master of Information and Data Science,MIDS) 但是,LIS学院的师资及其精力有限,不可能面向全校的学生开设相关课程,面向LIS学生的侧重点是数据的组织、检索、分析、管理与保存。 图书馆与图书情报学院(系)的数据素养教育各有千秋,二者合作可实现双赢。如密西根大学信息学院(University of Michigan,School of Information,UMSI)与该校图书馆联合申报,获得了IMLS 24万美元的资助项目“支持图书馆员将数据素养技巧增加到数据素养教育中”(Supporting Librarians in Adding Data Literacy Skills to Information Literacy Instruction),计划从2015年10月1日到2017年9月30日,开发适合于图书馆数据素养的在线专题研讨会(webinar)。 3.3 商学院 这类学院课程的重点是与商务智能、商务分析、市场营销、利用数据促进管理等,注重与企业的合作,上文提及的23所学院中有8所来自商学院[20]。例如亚利桑那州立大学凯瑞商学院(Arizona State University,W.P.Carey School of Business)的“商业分析科学硕士”(Master of Science in Business Analytics),与通用电气、IBM等合作;康涅狄格大学商学院操作与信息管理系(University of Connecticut,UCONN,School of Business,Department of Operations and Information Management)的“商业分析和项目管理科学硕士”(Master of Science in Business Analytics and Project Management);路易斯安那州立大学E.J.巴吞鲁日商学院(Louisiana State University,LSU,E.J.Ourso College of Business)的“分析科学硕士”(Master of Science in Analytics);马里兰大学罗伯特H.史密斯商学院(University of Maryland,UMD,Robert H.Smith School of Business)的“商业和市场分析科学硕士”(Master of Science in Business for Marketing Analytics);本特利大学商学院研究生院(Bentley University,BU,Graduate School of Business)的“市场分析科学硕士”(Master of Science in Marketing Analytics)等。 3.4 统计学院、数学学院、计算机学院等 这些学院开设的数据素养课程技术性强,有的由统计系单独开设,如得克萨斯奥斯汀分校统计系(University of Texas at Austin,UT-Austin,Department of Statistics)的“数据分析科学硕士”(Master of Science in Analytics)侧重于统计模型、预测分析;有的由统计系与其他机构合办,如斯坦福大学(Stanford University)的“数据科学硕士”(Master of Science in Statistics:Data Science)由该校的统计系(Department of Statistics)与计算与数学工程研究所(Institute for Computational and Mathematical Engineering)合办。 上述不同的学院各有侧重与优势,已出现多学院联合培养的模式。最为成功的是佐治亚理工大学(Georgia Institute of Technology,Gatech)的全日制一年期的“数据分析科学硕士”(Master of Science in Analytics),它定位于为学生提供世界级的数据分析教育,培养毕业生成为该职业领域的领导者,由该校3个在美国排名靠前的学院联合开设课程:计算机学院(College of Computing)、工程学院(College of Engineering)和舍勒商学院(Scheller College of Business)。课程包括核心课程与选修课程,其中选修课程的备选有:分析工具(Analytical Tools)、商务分析(Business Analytics)与计算数据分析(Computational Data Analytics),旨在方便学生选择有助于实现其个人职业目标的课程。学生还参加重要的数据分析会议与职业指导,其2015年毕业生的就业率为100%。 3.5 数据管理领域的研究机构及其他非营利性机构 上文提及的23所学院中,这类机构有3所[21],如哥伦比亚大学数据科学研究所(Columbia University,Data Science Institute),其全日制项目“数据科学硕士”(Master of Science in Data Science)就是与该校的工程学院、新闻学院等9个学院合作;纽约大学数据科学中心(New York University,NYU,Center for Data Science)开设的“数据科学硕士”(M.S.in Data Science)由该中心与该校相关的学院及2个研究中心合作开设。 英国数据保存中心(Digital Curation Centre,DCC)为数据保存(Data Curation)提供代号为DC101的专业课程,以培养从业人员的数据素养。英国开放知识基金会(Open Knowledge Foundation)组织开设了数据学院(School of Data)网站,提供免费的在线课程或现场研讨会(in-person workshops),旨在提高私人机构和非营利性部门的数据素养。其他机构例如TuvaLabs、可汗学院也提供了一系列的数据素养在线课程以供更多的人学习。 3.6 政府机关 美国国家统计局(National Statistical Offices,NSOs)为促进大众数据素养,与教育部门进行合作,提供了围绕数据素养构建的一些教育项目,面向的对象从7岁直到研究生。NSOs将教育资源放在网上供公民学习,内容从基本的数据统计到专业训练,未来将提供更多的技术指导和数据统计工具。 3.7 IT机构 在大数据时代,IT机构同样迫切地想通过提升大众的数据素养以便更好地进行业务拓展。IT机构依托于强大的技术力量,其所提供的数据素养课程是专业教育之外的有益补充。 例如微软研究院和IBM都提供了一系列数据管理课程,许多MOOC平台都有大量的数据素养类课程,其中以Coursera和爱课程网的数据素养课程较为著名。 “微软亚洲研究院大数据系列讲座”(Big Data Lecture Series)于2015年10月24日在中国大学MOOC开课,该平台的“信息检索”、“网络素养”等课程也都有数据素养教学的模块。 苹果公司的iTunes平台也上线了名为“数据素养与数据可视化”(Data Literacy and Data Visualization)的课程。成立于2014年12月的御数坊(北京)科技咨询有限公司专注于数据管理领域的出版、培训、认证、咨询和软件开发,开展企业数据管理的理论与实践培训,其开设的课程有数据管理概述及职业发展、数据架构管理、数据治理、元数据管理、数据质量管理等。 4 数据素养教育的对象更为广泛 大数据时代,数据素养是各学科各层次的人群所迫切需要的,因此其教学对象非常广泛。 4.1 本科生、硕士生与博士生 信息素养教育的主体是大学生、研究生与科研人员,数据素养教育的主要教学对象是学生与未来的学者。大学各个层次的在校学生(含本科生、硕士研究生与博士研究生)是数据的使用者,他们中的一部分是未来的研究人员,是科学数据的潜在使用者;而且,在他们以后的职业生涯中也需要使用大量的数据,如新闻数据素养、统计数据素养等。 ACRL的学术交流和信息素养交叉工作组(Intersections of Scholarly Communication and Information Literacy Task Force)认为[8],数据素养是学术交流与信息素养交叉的关键区域,对数据认识的扩大使得数据素养是面向所有学生和未来的学者教育的重要组成部分。 4.2 教师与科研人员 在数据驱动科研的时代,教师与科研人员必须不断提升自身的数据素养才能适应更加复杂的网络环境。Carlson等[1]通过研究提出,虽然主流的数据素养教育是面向学生的,但开放教育为教师和科研人员提供了平等的学习机会,他们通过快速的学习掌握数据素养,能够更好地开展教学和研究工作。 例如加州大学伯克利分校的研究数据港(Research Hub)为研究人员提供了基于web的管理研究数据、共享文件、获取信息的服务社区,配合eScholarship数字化科研服务,帮助科研人员掌握并能熟练使用科研过程中数字信息的创建、引用、保存、共享等的能力。 4.3 各种职业的从业者 英国大学数据技能指导小组(Universities UK Data Skills Steering Group)认为,数据素养是每类工作者都必备的能力。越来越多的组织和机构开始转型为“数据驱动型”,因此其员工需要具备读取数据、分析数据的能力。事实上,医疗、卫生保健、金融、新闻、IT等领域的从业者都离不开数据素养的支撑,其工作一旦出现数据错误就可能造成难以估量的损失。 4.4 中小学生 如前所述,美国国家统计局与教育部门合作的项目教育对象包括从7岁以上的孩子到研究生。中小学生是培养数据素养的基础时期,能够指导其学习和未来生活。2014年,麻省理工学院(Massachusetts Institute of Technology,MIT)和纽约城市公立学校系统联合开展了针对中学生的数据素养教育项目,旨在帮助中学生从小就培养良好的数据素养[22]。可以预见的是,越来越多的中小学会重视对中小学生的数据素养教育,开设相关课程和进行配套的实践。 4.5 社会大众 2014年底联合国通过的《迈向2030,通往尊严之路:消除贫困,改善所有人的生活,保护地球》(The road to dignity by 2030:ending poverty,transforming all lives and protecting the planet)指出,世界需要新的能力——数据素养。这里所指的数据素养就是面向大众的。 时代的发展使得人们利用文献信息资源的方式在不断变革。从最早利用书目资源到文献检索,再到媒介与信息资源的利用,人们在不断地学习和掌握各种素养和能力。如今,数据素养成为人们所要掌握的一种新的能力,可能会用在我们每天的生活中[23]。首先,数据素养的培养贯穿于各个教育层次乃至终身[16];其次,大数据环境使数据资源呈指数级增长,数据素养是社会大众适应现代社会发展的必备素养;再次,社会大众通过掌握数据素养能够进行数据生产活动,促进社会知识共享与发展。最后,具备良好的数据素养有助于每个人保护自己的数据隐私、合理与合法地利用数据。社会大众数据素养的提升有助于减少或消除发达国家与发展中国家的数据鸿沟。 5 数据素养教育的开展形式更加多样化 数据素养的重要性已逐渐得到认同,上述不同主体为提高数据素养而开展各种形式的教育活动。 5.1 学位项目或证书课程 如上文所述,国外不同的学科开设了数据管理或数据科学方面的硕士学位项目。加州大学伯克利分校信息学院的“信息与数据科学在线硕士”(Web-Based Master of Information and Data Science,MIDS)是唯一一个全网络授课的专业硕士学位,主要面向在职人员的继续教育。德国新勃兰登堡应用科学大学(University of Applied Sciences Brandenburg)的“数据科学证书课程”(Certificate Course in Data Science)是一门针对数据管理从业人员的证书课程,是校园外职业应用培训的一种必要补充。学位课程是高校及院系学科规划的重要导向,为社会培养高、精、尖的专业人才。 5.2 学分课程 如前文提及的雪城大学的“科学数据管理”就是2个学分的课程。目前开设的学分课程不多,部分是由大学图书馆承担的,称为“Library-based courses”。例如俄勒冈州立大学(Oregon State University,OSU)的图书馆和出版社共同开设了数据管理教学学分课程,旨在培养面向应用的数据保存、数据获取、数据分析的专业人才[24]。学分课程为高校学生提供了更多学习数据素养的机会和场所,是学位课程的重要补充。 5.3 短期培训 短期培训是面向数据管理从业人员的一种快速有效的教学方法,对于各行业从业人员提升数据素养具有重要作用。根据开展教学的机构不同,可分为高校相关院系的培训、图书馆的培训、数据库厂商的培训等;根据接受培训人员的不同,可分为面向科研人员的培训、面向图书馆员的培训、面向图书情报领域教学人员的培训、面向普通学生的培训等。例如英国联合信息系统委员会(Joint Information Systems Committee,JISC)开设了面向高校图书馆学科馆员的RDMRose项目“研究数据管理:提升图书情报专业人员的技能”(Research Data Management:Raising LIS Staff Expertise)[25];中国图书馆学会专业图书馆分会和中科院文献情报中心开设了一系列与科研数据管理项目相关的培训班,内容包括科研项目管理、数据仓储系统管理、数据政策分析等。 5.4 专题研讨会 这种教学方式的时间短、主题集中、参与学习免费、课件可供免费访问与下载。 在IMLS资助下,普渡大学(Purdue University)于2013年9月22~24日开设了“数据信息素养研讨会”(The Data Information Literacy Symposium)[26],包括专家报告、海报、讨论和现场实习(hands-on exercises)等环节。 2015年6月18日,哈佛大学与普渡大学共同开设“数据管理研讨会”(Harvard Purdue Data Management Workshop)[27],哈佛大学副校长兼图书馆馆长在致欢迎辞时说研究数据管理是该校图书馆的目标之一,研讨会的内容包括数据管理的外部要求、用机构知识库保存数据、数据管理规划(Data Management Plans,DMPs)和数据管理规划、图书馆员与档案馆员开展的数据管理活动。 麻省理工学院图书馆为提高科研人员的研究数据管理技能,开设了各种形式的研讨会(workshop)[28],讲授的内容涉及数据类型、长期保存的数据格式、数据安全、备份方案、元数据、文件组织等,辅之以小组讨论、相关的练习,并将其课件上传至网络共享。 美国俄勒冈州立大学图书馆每季度为研究生提供2次60分钟的研究数据管理研讨会。 5.5 免费的在线课程 著名的研究数据管理培训(Research Data Management Training,MANTRA)[29]是免费的在线课程,由英国爱丁堡大学(University of Edinburgh)开发,面向将数字化数据管理作为项目研究一部分的人员。 此外,还有数据素养维基[30]夏令营如硅谷数据科学夏令营[31]由计算机学会(Association for Computing Machinery,ACM)提供支持,有互动游戏、APP竞赛等多种形式。 5.6 多种形式并举 有的数据素养教育同时采用多种形式。如俄勒冈州立大学(OSU)图书馆既有Workshop,又有学分课程。该馆为研究生开设研究数据管理的学分课程,初步设计为2个跨学科的学分课程,以后拟增设与此学分课程平行的、针对某一学科的讨论板块,以及复合的、拓展的校园版。OSU图书馆还联合OSU教育与学习中心开设了详细的数据管理课程[32],包括学习产出、组织活动、实践环节等。同时,OSU图书馆与OSU研究生院合作开设了数据保存学习的学分课程。 综上所述,正因为数据素养教育比信息素养教育的内容宽泛、主体多元、对象广泛、形式多样,故用于表述数据素养教育的术语也更为多样,如“数据素养教育”(data literacy instruction)、“数据素养教育”(data literacy education)、“数据管理教育”(data management instruction)、“数据管理课程”(data management curriculum)、“数据素养培训”(training in data literacy)、“数据管理教育”(data management education)、“研究数据管理培训”(research data management training)、“数据技巧培训”(data skills training)等;而表述信息素养教育的术语主要有:“信息素养教育”(information literacy instruction)和“信息素养教育”(information literacy education)。鉴于此,大数据时代信息素养教育有待拓展,使其能够延伸到数据素养的教育。数据素养教育:大数据时代信息素质教育的发展_大数据论文
数据素养教育:大数据时代信息素质教育的发展_大数据论文
下载Doc文档