数据监控的知识、技能与教育研究_科学论文

数据监护的知识技能与教育研究,本文主要内容关键词为:技能论文,知识论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      现代社会,数据已成为经济、政府、医疗保健和文化等领域的重要资产[1]。科学数据更成为国际性话题,而数据监护是保障科学数据的重要手段,美国、加拿大、澳大利亚、英国和欧洲已展开数据监护工作。数据监护的需求不仅仅适用于图书馆、档案馆、博物馆和其他文化事业单位,政府机构、大学、科研单位和数据密集型私营企业也需增强能力以提高数据质量、保护数据和充分利用数据资产[2][3]。

      为充分利用巨人肩膀上的科学数据,iSchools 一直在稳步推进数据监护教育和实践的发展,以应对劳动力市场的人才需求,高校逐渐意识到需要培养具有知识、技能和才能的专业人才来管理数据,以提高数据作为资产的价值[4]。美国政府、科学界和行业的领导呼吁重视数据监护的关键技能和职业选择,数据监护的知识与技能是数据管理的基本技能、数据监护技术、系统操作等方面高度专业化的知识[5]。数据监护人员的有效与高效教育和培训将需要一个灵活方案,其核心包括数据监护的知识与技能、数据的知识和技能以及特定领域的需求和要求等[6]。但目前数据监护技能、才能和知识的概念有待进一步研究。

      本文首先提出了从数据监护中心到学科或特定领域需求的技能和知识,划分了数据监护的服务角色与职责,介绍了高校与研究中心的联合培养方案以及其对北美学校数据监护教育所发挥的作用,最后提出了数据监护教育的发展建议。

      2 数据监护的知识技能与职责

      2.1 数据监护的知识与技能

      目前大部分数据监护工作是围绕数据监护的生命周期模型展开的,包括数据收集、积极使用和归档或存储等[7]。在科学和商业环境中,数据监护工作是信息专业人员的一个有发展前途的职业选择,数据监护人员的知识范围要求从有效开展工作的数据管理的基本技能到数据监护技术、系统和操作的高度专门知识。知识与技能依赖于环境,因部门和组织设置而有所不同,对数据监护人员的高效教育和培训需要识别监护中心和学科或特定领域的技能和知识要求来满足职责要求[8][9]。监护中心组织承担管理、保存和传播数据的使命,而特定领域数据监护的知识和技能的特点是利用技术与数据创造价值,特定环境监护是达到目的的手段,而不是目的本身[10][11]。

      2.1.1 监护中心的知识与技能要求

      数据监护中心的规模从小型机构库到大数据中心,服务范围是从一个特定群体到普通公众,部署是独立组织或嵌入组织内的单元[12]。不管规模、范围和组织部署,数据监护中心的使命或重点业务范围是数据管理、保存和访问等,因此,数据监护中心的知识和技能就涵盖数据管理、保存、传输和访问的基本知识与技能。具体包括三部分:首先,数据类型、分析法与工具、标准、本体、表示方案和数据处理等方面的专业知识;其次,数据管理、表示、存储、安全和长期归档等方面的最佳实践和标准知识;第三,利用基础设施与信息技术进行数据生产、维护和访问的技能[13]。

      数据监护中心需要具有知识和技能的专业人才,才能满足生产者和用户群的需求。数据监护中心职员需体验、参与和创造最终工作的技术环境,数据监护职业的要求是分享一组知识和技能,最根本要求是深刻认识服务用户的数据需求。如果数据监护教育不能满足实践工作的技能需求,一个行之有效的方法就是要重点解决监护问题而不是执行监护流程。

      2.1.2 特定领域的知识与技能要求

      特定领域数据监护的知识和技能是充分利用数据、履行数据管理义务和满足特定领域要求。所需知识是高度依赖环境的多要素组成的相关知识库和技能集,通常特定领域的知识和技能由一系列要素的深层知识构成[14]。例如,在科学中,每个学科和子学科具有独有的数据类型、本体、分析方法和工具、标准和接受不确定性与变异参数。在某些领域,常见工具或研究协议为判断数据质量、相关性和实用提供了参考标准;一些领域是围绕一个共同分类法或命名法被组织;一些领域高度依赖于真实现象或事件的观察,而其他则依赖于实验、模型和模拟。例如,文化遗产组织利用数字资产创造、寻找和发现潜在收集新途径,提供在线查阅资料,创建虚拟浏览或整合分散的收藏品,服务于用户的团队需深入理解新类型文化遗产的产品与服务的技术知识以及对数字内容重复使用的道德和法律知识[15]。

      特定领域数据监护的知识和技能的特点是创造价值,而监护中心组织承担管理、保存和传播数据的使命,特定环境监护是达到目的的手段,而不是目的本身。因此,无论是科学、政府或商业,一个领域开发数据监护的价值主张是数据监护有助于组织核心任务。对于科学家而言,数据监护的投资需通过价值示范或效率收益来激励,价值示范表现为结果有效性与准确性、新发现和洞察科学问题等;效率收益表现为降低时间和成本搜索数据、清洗噪声数据或处理数据以适应科学需要。在企业中,数据监护促使企业保持竞争力,产生新产品线或新服务,从而有助于企业目标的实现。

      2.2 数据监护的服务角色职责

      由于数据监护中心与特定领域要求的知识与技能较抽象,未能识别具体角色的职责。2008年,A.Swan和S.Brown提出了科学数据服务的4种角色[16];数据创造者或数据作者(Data Creators or Data Authors)、数据科学家(Data Scientist)、数据经理(Data Manager)、数据馆员(Data Librarian)。在科学数据服务角色划分的基础上,笔者界定了各角色的职责与技能,角色之间需共同承担部分技能,详见图1。数据创造者或数据作者的主要职责是创造数据,数据科学家的主要职责是管理人财物,数据经理的主要职责是构建技术环境,数据馆员的主要职责是满足用户个性化需求。在实践中,数据服务群体没有准确使用这些术语,通常数据科学家的工作被称为数据经理或数据专家。规范术语需要一段时间,如直至普遍使用“数据科学家”术语未来将被普遍使用[17]。

      (1)数据创造者或数据作者:是具有专业领域知识的研究人员,主要职责是生产数据。研究人员创造或生产数据,数据作者可能具有处理、操作和使用数据的熟练技能,这些专业技能是通过经验积累、个人兴趣爱好或现实需求学习获得。

      (2)数据科学家:是确保科研得以顺利开展的人,或是数据中心的职员,承担管理职责。数据科学家与数据创造者密切合作,工作职责涉及创造性查询与分析、促使他人从事数字数据工作和开发数据库技术等。在许多情况下,数据科学家可能是数据创造者本人,数据科学家本身可能是某领域专家、计算机科学家或信息技术专家,职业发展要求他们具有跨学科的知识与技能。例如,系统生物学的数据科学家是一个需要计算能力的生物学家,具有软件工程背景的数据科学家需获得生物学相关专业学位。有的人把数据科学家比喻为“翻译”,将数据创作者的需求传达给数据管理者,并与数据管理者共事以确保数据有效地存取。因此,数据科学家们具有通用性技能:专业知识、计算机技能、人际交往能力等。

      (3)数据经理:是计算机科学家、信息技术专家或情报学家,承担计算设施保障、数据存储、持续访问和保存的工作。他们与数据科学家联系紧密,确保恰当的技术与设施服务于研究团队并保障工作的顺利开展。有些数据经理把自己的角色比喻为数据“水管工”,确保数据从一个地方安全传输到另一个地方,数据流正确运转,有价值数据不被丢失。

      (4)数据馆员:来源于图书馆界,接受过正规培训,专门从事数据监护、保存和归档的人,承担服务、协调、咨询、培训和宣传等工作。最初,数据馆员术语仅限于处理社会科学数据的图书馆员,现在称谓包括所有学科具有数据技能的人。“大科学”利用数据中心来监护数据,“小科学”由机构提供机构库来监护数据,高等院校开发机构库来收集和监护研究成果,机构库通常是由图书馆监管。

      3 数据监护教育的调查方案与联合培养模式

      3.1 数据监护教育的调查方案

      识别数据监护中心或特定领域的知识与技能要求和界定数据服务角色的职责的目的是构建最佳数据监护教育的培养方案。以下两项调查方案将说明目前数据监护教育是否满足专业人才需求。北美数据监护课程的调查结果反映了数据监护课程应根据劳动力市场需求来规划与设计;伊利诺伊大学的数据监护专业毕业生的就业调查结果反映了数据监护专业的培养方案应根据数据监护职责和教育缺口为指导来规划、设计和改进。两项调查同时反映了数据监护专业培养方案应以培养高技能数据人才为导向来规划与设计。

      3.1.1 北美学校数据监护课程的调查方案

      (1)调查方法

      2012年,R.L Harris-Pierce和刘燕权[18]调查了北美52个图书情报学(LIS)院校的数据监护课程,这项调查涵盖三大基本问题:①哪些院校提供数据监护课程?②数据监护的重点课程有哪些?数据监护课程涵盖的问题和主题有哪些?③不同LIS学校数据监护课程的异同?该项调查的目的在于识别和评估数据监护的教育现状,剖析LIS学校数据监护教育是否与劳动力市场需求的数据监护人才的知识与技能相匹配。

      (2)调查结果

      第一,从学校网站数据监护课程信息来看,提供数据监护课程的16个学校只占北美LIS学校的31%。为应对数据监护专业人才需求,越来越多的LIS学校开始增设数据监护课程,部分学校已将数据监护作为专题研讨升级为正规课程,网站目录中已列出定期提供的部分课程,未来将课程体系纳入到院校的专业培养大纲。

      

      图1 数据监护角色的职责与技能

      第二,LIS学校现有数据监护教学大纲的主题涵盖问题范围广,所有学校提供的数据监护课程是不同的,所有数据监护专业的学生不会选修相同主题的课程,也就是说,数据监护培养方案未形成完善的课程体系。

      (3)结论

      ①北美52个LIS学校中16个机构提供了数据监护课程,提供数据监护课程的学校数量增加表明LIS学校积极应对数据监护专业人才的发展需要;②数据人才需求缺口需要更多的LIS学校开设数据监护课程来满足劳动力市场的人才需求;③LIS学校数据监护的培养方案应朝着最佳课程目标和学习效果的方向来规划与设计。

      3.1.2 伊利诺伊大学毕业生就业的调查方案

      (1)调查方法

      2013年4月,C.L.Palmer、C.A.Thompson、K.S.Baker等人[19]调查了伊利诺伊大学图书情报学研究生院(GSLIS)数据监护专业从2008年12月至2012年12月毕业的63名学生。这项调查围绕三大问题展开:①毕业生如何看待当前劳动力市场数据监护人才的需求现状及未来发展趋势?②数据监护专业毕业生应具备哪些技能?③毕业生岗前准备工作有哪些?涵盖的主题包括:方案评估、就业状况、工作特征、职业倾向、继续教育需求以及数据监护未来趋势。

      根据调查结果评价了伊利诺伊大学数据监护专业的培养方案,旨在识别劳动力市场数据监护人员的职责和感知教育缺口来指导数据监护培养方案的规划、设计和改进。

      (2)调查结果

      第一,从就业方向来看,90%的毕业生申请了数据技能岗位,学术机构雇用数据监护专业毕业生最多,其次是企业,数据技能和知识适用于广泛范围的职业需求;略多于一半的毕业生不在数据监护岗位,数据监护专业毕业生职业满意度高。

      第二,从岗前准备工作来看,74%的数据监护专业毕业生能胜任工作岗位,受访者认为岗前准备工作需高度重视元数据、保存规划以及建模等方面,图书情报学专业教育远远不能满足当前数据监护的技能需求;实习经历、实习课和实地考察是就业能力的关键因素;培养模式应采用课堂上经验学习与数据中心的体验式学习相结合。

      第三,从协作与沟通方面来看,有一半受访者认为跨领域协作和沟通对数据监护这一新兴领域非常重要,数据监护的专业人员需在用户指南、培训、数据管理、元数据和文档以及政策制定等方面进行沟通,比如,生产数据的研究者与从事数据管理的规划、实施、工具开发和增值业务的数据专业人才需紧密合作,因此,受访者强烈建议数据监护专业学生、教师和校友之间建立联系网络。

      第四,从继续教育方面来看,大多毕业生利用网络研讨会进行交流与学习,网络研讨会的自由形式和承受能力是吸引专业人才积极参加的理由;近一半受访者表示倾向于选择1~2天或3~5天的现场研讨会,市场研讨会和研究机构研讨会可以与网络研讨会共同存在,服务于数据监护群体。伴随着数据监护不断发展,iSchools需为校友提供继续教育和职业发展机会。

      根据数据监护职责和教育差距的分析,为长期专业评估和市场跟踪提供了一个基线,为其他iSchools计划、发展或推进数据监护教育方案提供了重要参考。

      (3)结论

      调查就业形势分析表明:①就业水平和工作类别多样化,数据监护教育的培养方案应与工作职责的要求相匹配;②实习、见习课和工作经历被认为是就业技能的关键因素,职责强调交流与合作、咨询、用户指令、数据管理、元数据和政策等;③约一半毕业生供职于高校图书馆,其次是企业,且毕业生的职业满意度较高;④需改进的地方:提供更多经验学习和实践应用的机会,建立基于工作职责的数据监护课程体系,并为学生规划长期职业发展方案。

      北美学校数据监护课程及伊利诺伊大学毕业生的就业调查结果同时表明,数据监护教育的培养方案应与职责要求相匹配,以满足劳动力市场的数据监护人才需求。当前数据监护教育缺少实习、见习、体验学习、经验学习等实践应用机会,为应对这一挑战,伊利诺伊大学采用了学校与研究中心合作的联合培养方案。

      3.2 数据监护教育的联合培养方案

      伊利诺伊大学数据监护专业毕业生就业形势的调查结果指出了教育需改进的方向,这也是高校数据监护教育未来努力的方向。研究中心数据监护教育项目(the Data Curation Education in Research Centers,DCERC,以下简称DCERC)正是在数据监护教育的培养方案与劳动力市场人才的需求相匹配的背景下提出来的。DCERC由伊利诺伊大学图书情报学研究生院、田纳西大学信息学院和美国国家大气研究中心(NCAR)联合提供数据监护教育,合作培养模式为学生提供了数据密集型科学环境的经验学习和更多的职业发展机会[20]。

      DCERC旨在提高学生的实践能力与专业技能,加强新兴领域理论知识与实践技能的结合。DCERC的目标是为图书情报学的数据监护专业开发一个可持续和转移的模型,该模型使硕士和博士生进入科学数据研究中心学习领域知识,在科学数据和数据科学领域的导师指导下,学生从事现场数据采集、研究中心各种观察、模型和仿真数据的发现、数据管理和数据保存等工作[21]。LIS学校与研究中心合作模型DCERC包括4个部分:课程、研讨会、暑期实习经历和评估,见图2。

      

      图2 DCERC模型的组成

      3.2.1 课程

      核心课程是数据监护的基础,包括技术、理论与求职等相关课程,如:数据评估与选择、长期数据收集、数据生命周期、工作流程、表征等级、元数据以及知识产权问题等。两个学校对课程进行了修订和更新,研究生需在暑期实习前完成数据监护的基础课程学习,并将参加国家大气研究中心的两个暑期实习。LIS学校和研究中心的联合培养模式有利于学生理论联系实际,更好地吸收与体验课堂上所学的知识与技能。

      3.2.2 研讨会

      暑期实习前期有一个为期三天的数据监护研讨会,其目的是帮助学生叙述和吸收课程中已学会的知识和技能以及介绍数据中心对数据监护的作用,该研讨会旨在建立学生、科学家和数据导师之间的联络网络。首先,学习重点为数据管理工具和科学家与数据经理之间的协调能力,还包括数据库和数据收集、数据仓库、数据定性分析等。其后,讨论数据监护相关问题:数据使用度量标准、元数据,评价数据服务和标准。其后,学生通过导师制小组会议展示特定研究兴趣,讨论实习项目的主题、范围和预期结果以及识别资源和工艺要求。最后,学生和教师实地考察了NCAR的航空设施,科学家展示了实时数据采集和分析工具,如其中一架飞机在飞行中实时收集数据现况。

      3.2.3 暑期实习经历

      DCERC实习指导模式采用正规导师制结构,学生和导师的配对是基于学生的教育背景、项目兴趣、数据监护和数据管理经验水平与跨学科导师的专业领域知识技能相匹配。正规导师制确保学生获得平等指导,导师指导学业,帮助进行职业选择。好导师会传授专业知识,转移所需技能,提供相关资源,告知有关的职业选择,介绍学生从业,协助就业和提供个人支持。

      4种类型的导师包括科学导师、数据导师、一个年轻研究员作为同行导师和团队导师。科学导师指导学生的科研实践;数据导师指导学生的数据监护技能和知识发展;同行导师,是具有博士学位的信息科学家,为学生提供一般支持,如项目进展情况;团队导师与同行导师共同指导学生了解机构政策;解决其他工作问题;提供NCAR、其他数据中心和大学的就业信息。在这样的学术环境和指导结构中,学生在世界著名的数据中心体验与学习,并接受正规的数据密集型实践训练,有利于学生的未来职业发展。

      3.2.4 评估

      为了评估实习的有效性,该方案多方位评价暑期实习,包括评估数据监护课程对实习的影响,评估资金利用率,评估学生的学习成果与导师的收获,评估教育与人才需求差距等。从学生经历了第一个夏天的实习后的独立面谈可以看出,导师和实习积极影响了职业生涯规划,明晰了数据监护的实际设置,体现了领域的变化情况,使学生专注于职业生涯所需的知识。如:一个实习生认为实习提供了额外驱动力去追求数据中心的工作并保持未来职业选择,相反,一个学生认为实习经验增强了投身于高校图书馆而不是科学数据中心的信心。

      为扩展和丰富DCERC的评估指标,DCERC已经考虑制定一个可行性和可持续发展模型以供其他学科使用,并促进数据监护教育和实践研究。具体来说,未来DCERC将提供:①实践经验丰富的数据专业人才指导学生以提高从业能力;②促使学生重视学科的数据监护知识技能;③LIS学校需要与数据监护服务的用户之间建立桥梁。

      DCERC的价值是提供平等的科研实习、发展队伍和指导培养方案改进。对学生和导师来说,DCERC被证明是一个“双赢”模式。学生在合作培养的科研环境中获得导师现场强有力的指导,亲身体验科学数据监护问题、方法和挑战的解决方案;导师与学生的协作关系有利于组建数据监护知识与实践经验的体系结构,未来可能与学生建立伙伴关系,有利于工作的顺利开展与职业的发展。

      4 结语

      本文围绕一条路线(识别知识与技能——划分角色职责——针对教育问题——剖析联合培养方案的优点)来展开研究内容,首先识别了监护中心或特定领域的知识技能要求,划分了具体角色的职责;根据数据监护教育与职业调查方案的结果,指出了目前数据监护教育存在的共同问题,最后,针对存在的问题,详细地分析了联合培养模式的优点。根据以上的分析与总结,得出了数据监护教育与职业的发展建议:

      (1)鼓励更多LIS学校开设基于工作职责的数据监护课程,培养数据监护专业人才以满足劳动力市场对数据监护人才的需求;

      (2)LIS学校数据监护课程的培养方案应朝着最佳课程目标和学习效果方向来规划与设计以应对教育与职责之间的差距,并为学生规划长期的职业发展方案;

      (3)实习、见习课和工作经历是就业能力的关键因素,工作职责强调交流与合作、咨询、用户指令、数据管理、元数据和政策等;

      (4)通过多途径建立数据监护交流社区,便于学生、老师、专业人才等之间进行交流与协作,有利于知识技能的学习与职业发展。

标签:;  ;  ;  

数据监控的知识、技能与教育研究_科学论文
下载Doc文档

猜你喜欢