大数据面面观,本文主要内容关键词为:数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G434 [文献标志码]A 目前国内外学术界普遍认为,“大数据”是继云计算、物联网之后IT产业的又一次重大技术变革,甚至有学者把挖掘、应用大数据的意义提到与20世纪90年代初倡导“信息高速公路”相并列的高度——认为美国政府2012年3月发布的《大数据研究与发展倡议》是继1993年宣布“信息高速公路”以来的又一次重大科技部署,[1]甚至会像一场飓风那样,“摧枯拉朽地给教育、乃至整个社会带来一场变革”,从而使人类探索和认识世界的思维方式发生改变。 可见,人们对大数据寄予多么高的期望。下面,我们就对近年来国内外学术界对于大数据最为关注的若干问题进行比较系统的梳理与分析,看看大数据正在哪些方面改变着人类社会,从而形成关于“大数据”的面面观。 一、“大数据”一词的起源与大数据的生成 通过文献研究,我们了解到“大数据”一词最早是由美国NASA的研究人员Michael Cox和David Ellsworth于1997年提出,是他俩第一次用该词描述20个世纪90年代出现的数据方面的挑战——即超级计算机所生成的巨大数据量。在实验过程中,Cox和Ellsworth对产生于飞机周围的大量模拟气流数据觉得无法处理,也难以可视化,他们对自己当时的感受是这样描述的:“数据集相当大,对主机内存、本地磁盘甚至远程磁盘都造成挑战,我们称此问题为大数据。”[2]这就是“大数据”一词的由来(或起源)。 一般认为,大数据的产生与以互联网为标志的信息技术密切相关。例如著名的Facebook拥有超过9亿的用户,并且用户量仍在不断增长;Google每天都有不少于30亿条的搜索查询;而Twitter则每天要处理4亿次以上的短信(相当于12TB的数据量)。[3] 而大数据的具体生成过程,涉及大量数据的挖掘、存储、计算与分析,其前提是人手一机;[4]这个“机”通常不是PC机,而是简单的移动终端(也称云终端)——每个学习者从“云终端”输入自己的学习行为数据,并存储到“云”里。这些记录每一个个体行为的数据,表面上看好像是杂乱无章,但当数据累积到一定程度时,群体的某种行为规律和某个时间段内的个体行为规律就一定会在这些数据上呈现出来。 二、关于大数据的描述及类型 到底什么是大数据?目前,众说纷纭。有的学者认为,大数据是指太大或种类太多,以至于传统工具无法有效管理的数据。[5]也有人认为,大数据即一般软件工具难以捕捉、管理和分析的海量数据;通过对这些海量数据的交换、整合、分析,可以发现新知识、创造新价值,从而带来大知识、大科技、大利润和大发展。[6] 此外,大数据与传统数据相比,还有非结构化、分布式、数据量巨大、数据分析由专家层变化为用户层、大量采用可视化展现方法等特点,而这些特点正好适应了当前学习方式逐渐向个性化和人性化转变的需求,也使大数据时代的教育学,变成一门实实在在的实证科学。[7] 迄今为止,学术界对于“大数据”还没有规范、统一的定义。学者们只是用这一术语描述难以用传统软件技术和方法分析的超大型复杂数据。 关于对大数据的定量描述,最早由Laney提出的方法是通过三个维度描述——也称3V(Volume,Velocity,Variety)。[8]在此基础上,IBM的研究人员作了补充,认为应当用4V——即容量(Volume)、速度(Velocity)、多样性(Variety)和真实性(Veracity)等四个维度来描述大数据。[9]其中,容量在大数据情况下应是大容量,是指增长到百万兆字节甚至千兆兆字节的信息;速度在大数据情况下要求高速度,因为及时、快速处理大数据往往起着关键性的作用(例如分析大量当日呼叫的详细记录,可实时预测客户流失程度);多样性是指数据形式多种多样(包括文本、图像、音频、视频);真实性则是指大数据提供信息的可信度,以及据此作出决策的可靠程度。 关于大数据的类型,目前学术界认为大致有三种:[10]即非结构化数据、半结构化数据和结构化数据。[11][12][13]非结构化数据是指没有固定格式的数据,如PDF、E-mail和一般文档。半结构化数据是指类似XML和HTML的、有一定加工处理的数据。结构化数据则是指具备一定格式,便于存储、使用,并可从中提取信息的数据,例如传统的各种事务型数据库中的数据。 三、大数据如何改变人类的教育方式 大数据对人类教育方式的改变,结合目前国内外大数据的应用状况,可以从以下五个方面去考察。 (一)美国教育部关于“大数据教育应用”的报告 2012年10月,美国教育部发布了题为《通过教育数据挖掘和学习分析技术来提高教与学:问题简述》(Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics:An Issue Brief)的报告(以下简称为:美国教育部关于“大数据教育应用”报告),[14]为教育中如何利用大数据指明了方向。该报告认为,大数据无处不在,教育中也是如此。主张通过教育数据挖掘、学习分析和可视化数据分析来改进自适应学习系统,实现个性化学习。并指出,大数据在教育中的应用主要有两大领域:教育数据挖掘(Educational Data Mining,简称EDM)和学习分析技术(Learning Analytics,简称LA)。[15] 教育数据挖掘(EDM)的内涵是要对学习行为和学习过程进行量化、分析和建模;[16]EDM的目的是利用统计学、机器学习和数据挖掘等方法来分析教与学过程中所产生的数据。[17] 美国教育部关于“大数据教育应用”的报告还指出,EDM关注和要回答的问题有五个方面:(1)什么样的教学顺序(即学习主题顺序)对不同特点的学生最有效?(2)什么样的行为与更好的学习成绩相关?(3)什么样的学生行为指标预示了学生的满意程度、参与度和学习进步?(4)什么特点的在线学习环境能导致更好的学习成绩?(5)什么因素能够预测学生取得成功?[18] 而学习分析技术(LA)的内涵是要利用已有的模型来认识、理解新的学习行为和过程。[19]Siemens则把LA定义为:关于学习者以及他们的学习环境的数据测量、收集、分析和汇总呈现。并认为,LA的目的是理解和优化学习以及学习情境。[20]按照Siemens的观点,LA的主要应用是监测和预测学生的学习成绩,及时发现潜在问题,并据此作出干预,以防止学生在某一科目的学习中产生风险。 对LA应当关注和回答的问题,按照美国教育部关于“大数据教育应用”报告的描述,则应涉及以下五个方面:(1)什么时候学生可以进行下一个学习主题?(2)什么时候学生可能在某一门课程中落后?(3)什么时候某个学生可能存在完成不了一门课程的风险?(4)如果没有干预补救措施,学生可能得到什么样的成绩?(5)对特定学生来说,下一个最好的课程是什么?是否需要特殊的帮助?[21] 正如有些学者所指出的,在大数据背景下,通过EDM和LA等技术,可以帮助教师有效地改进教学。[22]例如,教师可以查看学生在一张图片上停留的时间,判别他们在答错一道题之后有没有回头复习,统计他们在网上提问的次数、参与讨论的多少,然后在此基础上对他们的学习行为进行引导;学生学习过程所记录的鼠标点击量,也可以用来研究学生活动的轨迹、发现不同学生对不同知识点有何不同的反应?用了多少时间?哪些知识点需要重复或强调,以及哪种陈述方式或学习工具最有效。 大数据还可以帮助教师对学生作出全面、正确的评价,[23]而过去对学生的评价,往往依靠感觉、直觉和考试。但人的感觉中存在盲点,直觉并不完全可靠,考试也有局限。大数据凭借日常点点滴滴的信息采集,运用严密细致的逻辑推理,能客观地展现一个学生的完整形象;云端分立的数据库彼此相联,可用来进行多维度的联机分析。这样,将呈现给我们一个宏大的教育场景。可以把每个学生置于该教育场景中来进行审视与评估。 可见,应用EDM和LA的数据分析结果,教师可以更好地了解学生,理解和观测学生的学习过程,找到最合适的教学方法和教学顺序;还可以针对不同特点的学生采用不同的教学方法与教学策略,并能及时发现问题。进行有效干预和作出全面正确的评价,从而显著提高教学的质量与效率。 (二)大数据背景下的全新教育愿景及未来教室 2012年9月美国布鲁金斯学会(Brookings Institution)技术创新中心主任Darrell M.West在《教育大数据:数据挖掘、数据分析和网络仪表板》(Big Data for Education:Data Mining,Data Analytics,and Web Dashboards)一文中,对大数据背景下的全新教育愿景作出了这样的描绘:[24] 12岁的苏珊正在上一门旨在提高她阅读技能的课程。她一直在阅读一些短篇小说。每隔一周教师都会对她和她的同学进行纸笔测试,以测量他们对词汇和阅读的理解能力。测验表明,苏珊对词汇掌握得不错,但在关键概念的理解上还需加强。 而在未来,苏珊的弟弟理查德则是通过电脑软件程序来学习阅读。他每阅读一个故事,计算机都会自动收集他学习过程的相关数据。每个内容学完后,在他的屏幕上都会弹出一个小测验(用来测试有关词汇和阅读理解方面的问题)。理查德每回答一个问题,都会得到即时反馈,以表明其答案是否正确。对于较困难的题目,电脑会推送给他更详细的解析和相关概念的网站链接。他的综合表现则被可视化地显示在一个仪表盘上,综合表现包括:作业和测试的正确率、已经掌握的概念列表、学习表现、与班内同学(乃至全国学生)的比较情况等。 当一个学习环节结束时,理查德的老师会收到一封自动邮件,其内容是关于理查德和班上其他学生的个人表现以及全班情况的汇总(包括阅读时间、词汇知识、阅读理解、补充资料的使用情况等)。教师根据这些汇总信息,可以及时发现需要特别帮助的学生、学习时间不够的学生,以及全班大部分学生都感到困难的内容。接下来,教师就可以通过集中讲授、人为干预学习系统等方式来适应学生的学习需求,也可以为没有达到教学目标要求的学生进行个别辅导,或补充额外的学习资料。 对于学校的管理者来说,通过上述可视化仪表盘可以查看某年级、全校、乃至整个学区学生的学习情况。如果发现低效课堂或学习表现不佳的学生群体(根据性别、家庭背景等情况划分的群体),管理者还可根据可视化仪表盘的数据分析结果决定是否要给予特定的干预。对于更大范围的异常表现,管理者则可依据数据分析结果调整原来的管理策略,以适应教师更好地教和学生更好地学的实际状况与客观需求。 至于大数据背景下的未来教室,从2011年就开始关注如何运用先进技术手段来为大规模在线教育服务的知金教育咨询有限公司,不仅为“未来教室”界定了颇有创意的新内涵,还为此开发出相关的创新产品:为每个教室配备一个称作“云端”的小盒子,利用该小盒子,教师可实现智能终端授课和师生互动,还可实现学生与教学内容的互动以及生生互动。每节课结束以后,有关这节课的教学活动都会自动形成一个课件,并存储在“云端”里;没有完全听懂的学生可以把该课件下载到自己的iPad里,像电子书包一样,可用于课后复习和回看;而“云端”对课堂教学活动的持续录制和积累,将形成丰富而宝贵的教学资源,以支持与更多的学生分享,甚至可用于校外学习中心的远程教学。[25] (三)大数据支持下的三种有效教学模式 学术界普遍认为,大数据对于数字化教学形态能提供强大的支撑,因而对某些数字化教学模式的实施具有先天的便利条件。例如学者管雪沨就认为,大数据对以下三种教学模式的实施特别有效。[26] 1.大数据支持下、基于资源的数字化教学模式 大数据可以提供极为丰富的教学资源,这些教学资源包括两类:一是教学内容资料,如当前流行的“微视频”和“慕课”(MOOCs——大规模数字化在线开放课程);二是丰富的可支持学生自主学习、自主探究、自主发现的认知工具(数字化学习工具)。有了这两种资源,就为广大教师实施基于资源的数字化教学模式创造了非常方便而有利的条件。 2.大数据支持下、基于交流的数字化教学模式 大数据支持突破时空限制的交流、互动与反馈,因而也可以为广大教师实施基于交流的数字化教学模式创造方便而有利的条件。实施基于交流的数字化教学模式需要做一些必要的教学准备,包括:①建立QQ群;②为每位学生配备一部平板电脑;③让每位学生对既定学习主题事先进行自主探究。 这种模式在教学实施过程中应有相关的软件工具对每位学生的自主探究结果进行自动跟踪和统计(从而形成大数据)。然后,教师再依据统计结果进行点评与相关的教学指导。 3.大数据支持下、基于评价的数字化教学模式 由于大数据提供的多维丰富信息能实现科学而精确的教学评价,所以大数据对于广大教师实施基于评价的数字化教学模式也是极为方便而有利的。 基于评价的数字化教学模式中的评价,通常包括学习方式评价、学习过程评价和学业水平评价等多个方面。传统教学中主要基于提问、测验、考试的评价方式往往难以支持这种多维度的评价要求。而在大数据环境下,由于能够及时、有效地收集和获取有关每个学生的学习进度、学习过程、学习兴趣与知识能力水平等多种数据和信息,因此可以适应上述多维度评价的要求,从而实现较为精确的科学评价。 (四)大数据使“智慧教育”逐渐成为现实 学术界普遍认为,“智慧教育”是受“智慧地球”(Smart Planet)概念的启发而延伸出来的。[27]“智慧地球”最早由IBM公司倡导,其原意是希望通过采用物联网、移动通信、智能分析等新一代信息技术,来促进人们之间更全面、更深入的互联互通,改变企业、社会和政府的生产、协作与管理方式,让各个领域的工作流程、运行模式更加智能化。而“智慧教育”的本意也是应用新一代信息技术,来变革今天依然停留在工业时代“教学工厂”式的学校教育,提升教育系统的效率和智能化水平,从而为信息时代培养出能适应社会发展的创新型人才。 也有学者认为,智慧教育就是借助新一代信息技术的力量,来创建具有感知、推理、辅助决策等智慧特征的学习环境,从而促使学习者的智慧得到全面、协调和可持续的发展。[28] 从国际上看,也是IBM公司在倡导“智慧地球”概念的基础上,率先将其应用于教育领域,从而首次提出“智慧教育”概念,并认为未来的智慧教育应当具有下列五个方面的内涵:(1)教学活动要以学生为中心设计:关注学生的个性化学习与发展;(2)对教学资源要进行实时统计与分析:对教育教学资源要进行集中管理、实时监测、科学分配,并针对不同角色进行实时统计与分析——这里的不同角色包括管理方(教育局)、服务方(学校)以及公众(教师、学生、家长)等;(3)要对教学过程和管理过程实现智能化的决策与管理:这包括对教学过程和学校管理过程的集成化操作与处理、对教育辅助设施的智能化管理、对优秀教育教学管理体制流程和规范的快速复制与推广以及对个人和群体教育信息的完整记录与管理;(4)要实现没有时空限制的在线互动教学:利用多样化的教学工具和教学方式,实现没有地域和时间限制的公众在线学习以及互动式和体验式教学;(5)要让优质资源触手可及:实现高度集成化的资源共享,并且随时随地均可方便地获得优质资源。[29] 从智慧教育的上述五个方面的内涵,可以清楚地看到,智慧教育的愿景就是要在新一代信息技术支持下,尊重每一位学习者的个性化与多元化发展需要,创造智能化的教育环境,推动信息时代教与学的变革,以最有效的方式促进学习者的知识建构与智慧发展。 至于应当如何具体实施与发展智慧教育,目前国内外学者普遍认为,这里最为关键的是要运用云计算等新一代信息技术,来实现整个教育信息系统的重构:“基于云计算、传感技术、物联网和海量信息处理等新技术的教育系统,使教育信息化进入了全新的发展阶段。利用云计算对传统教育信息系统、校园网络系统进行整合与优化,可以建构教育云服务平台,形成新一代的智慧校园系统;在此基础上,还可以解决信息孤岛问题,也就是把教育领域的各种信息系统有机连接起来,实现彼此之间信息与数据的互通信和互操作,从而在更大范围内聚合教育资源,建成可流动、可获取、可应用的大规模非结构化教育数据(也就是真正意义上的“教育大数据”),最终实现整个教育信息系统的重构,以便支持教与学全部过程的智能决策、智能实施与智能评价。”[30] 这就表明,随着云计算等新一代信息技术的迅猛发展和整个教育信息系统重构的完成(即教育大数据的真正形成),以“支持教与学全部过程的智能决策、智能实施与智能评价”为标志的“智慧教育”,将有可能成为现实。 (五)大数据在教育中应用的展望 目前国内外学术界对大数据在教育领域的应用前景普遍看好,对运用大数据技术促进教育的深化改革寄予很高的期望。例如,学者李艳就明确指出,大数据在教育中的应用将会在以下三个方面有较突出的体现。[31] 1.促进教师的专业发展 李艳认为,过去只能通过教师的成果(如发表的论文、课件竞赛、教学观摩)来评价其专业发展水平,而在大数据时代,每一位教师备课、上课、团队研讨、网络研修、教学反思以及各种教研活动都会在各类终端上留下数据碎片,当大量的数据碎片被采集、汇总(即形成大数据)以后,就可以对教师专业发展的轨迹作出过程性评估。与此同时,发展中存在的问题与改进的方向,也可以在大数据整合、分析基础上,为每一位教师提出有针对性的建议与支持。[32] 2.有效促进教与学,显著提升学科教学质量 如上所述,应用EDM和LA的数据分析结果,教师可以更好地了解学生,理解和观测学生的学习过程,找到最合适的教学方法和教学顺序。还可以针对不同特点的学生采用不同的教学方法与教学策略,并能及时发现问题、进行有效干预和作出全面正确的评价,从而显著提高教学的质量与效率。 3.实现真正意义上的个性化教育 李艳强调:大数据对于个性化教育之所以具有特殊意义,是因为除了利用电子书包可以采集学生有关学习行为的各种数据以外,还可利用“智慧—卡通”采集每位学生在校园内其他行为模式的有关数据。例如,通过“一卡通”可方便地采集到学生进出各实验室、图书馆、体育馆以及进出校园门禁系统的信息。而一旦这些有关每位学生的学习行为和其他行为的各种数据信息得到充分的挖掘、整合和分析,那么,每一位学生的行为模式也就被呈现出来。总而言之,大数据时代将使我们跟踪每一位学生的数据信息不再困难,从而能实现真正意义上的个性化教育。[33] 四、大数据如何改变人类的学习方式 大数据对人类学习方式的改变,从目前的应用状况看,主要体现在以下四个方面。 (一)大数据能对“自适应学习环境”提供强大支持 2012年10月美国教育部发布的关于“大数据教育应用”的报告中明确指出,应用大数据技术可以预测和干预学生的学习过程,并对学生的自适应学习环境提供强大支持。自适应学习环境通常由六个部分组成。[34](1)丰富的学习内容。有了丰富的学习内容,通过与学生的交互活动,可以了解学生的学习基础与能力,再利用下述自适应引擎,就有可能对学习内容实现能适应每位学生需求的呈现、维护与管理。(2)学生学习数据库。用来获取并存储在学习过程中的学生与学习内容的交互情况(交互的时间及交互行为)。(3)对未来学习情况作出预测。基于大数据,也就是利用学习数据库中的各种数据以及其他相关数据(如年龄、性别、种族等)去跟踪学生的学习过程,并对未来的学习情况(包括学业成绩以及是否有可能辍学等)作出预测。(4)可视化报告。将上述基于大数据而获得的、对未来学习情况的预测结果,用仪表盘形式呈现出来(成为可视化报告)。(5)自适应引擎。用来自动操控丰富的学习内容,以确保学习内容适合每位学生的能力与需求。(6)干预引擎。利用这一引擎,教师、管理人员、系统开发人员等可以否决系统作出的决策或建议,从而实现人工干预。 除了上述六个组成部分以外,一般自适应学习系统还应配置一个学生信息系统。该信息系统实际上是由学校或地区教育部门维护的学生背景资料数据库(包含学生年龄、性别、种族、学过的课程、学业成绩以及学习特点等数据信息)。上面提到的“对未来学习情况作出预测”所需的其他相关数据,正是由这一信息系统提供的。 从上述自适应学习环境六个组成部分的具体内容,以及学生信息系统(即学生背景资料数据库)中所包含的各种数据信息不难看出:哪一个环节的数据挖掘、信息整合与分析都离不开大数据技术的支持。可见,大数据确实能为自适应学习环境提供较强大的技术支撑。 (二)大数据能更有效地实现个性化的自适应学习 利用大数据技术能更有效地分析学生的需求和特点,从而使学习更倾向于个性化。正是基于这种分析与认识,祝智庭教授等人认为,教育技术学的下一个研究范式应是大数据技术支持的“个性化自适应学习”(Personalized Adaptive Learning,简称PAL)。[35] 关于个性化自适应学习(PAL)的内涵,简单地说,就是在自适应学习的基础之上,让学习内容更多、更好地体现不同学生的特点与需求。根据学生的个人特点(已有知识基础、认知特点、学习风格等)以及学生的其他数据信息(年龄、性别、种族、兴趣等),自适应学习系统将自动对学生进行分组;对不同组别的学生,学习系统将根据学生的不同需求,向其推荐不同的学习内容;学生则可以自己选择最符合自身特点的学习资料、学习方式与评价方式。 个性化自适应学习(PAL)与以往的个性化学习和自适应学习有所不同的是,PAL要以大数据为背景,要纳入大数据的分析过程及结果,因而能够提供更适合每个学生需求的个性化学习内容。与此同时,还可以因为获取了更多、更精确的学习过程与学习活动信息,而能更好地分析学习过程模式和学习活动的有效性,从而更准确地进行学习评估。这表明,大数据确实能更有效地实现个性化的自适应学习。 (三)大数据可以使企业的人才培养模式由平移式学习转向智慧化学习 众所周知,国家的经济转型或企业转型,最大的驱动力是要对劳动力进行培训,只有通过培训,才能把低端的人力资源提升为从事创造性活动的高端劳动力资源。 柯清超教授认为,现有的企业人才培养是属于一种平移式学习,只是把传统学校的学习内容、学习方式直接照搬过来用于企业的人才培养,按传统学校的内容、方式学习完之后是考试,然后就是拿证、上岗。[36] 而在大数据时代,由于拥有大量的开放性资源、宽带移动网络和学习分析技术,就可以为企业提供能汇聚教育大数据的智慧学习系统,以促进整个企业的知识共享。在此基础上,完全有可能重构企业的人才培养模式,使之由平移式学习转向智慧化学习。 所谓“智慧化学习”通常是指借助基于大数据的学习分析技术(LA),更好地监测和预测学习者的学习成绩,及时发现潜在问题,并据此进行干预,从而对学生的知识建构与复杂能力评估提供更加个性化的有效支持。 柯清超强调,现代企业学习系统应自觉回归到“网络、开放、共享、协作”的本质上来,而不应满足于孤立的、自成体系的自给自足系统。为此,必须树立上述“智慧化学习”的理念,并利用大数据和大平台来重构现代企业的人才培养模式,这样才能适应大数据时代社会发展的需求。 (四)大数据背景下可以建立起前所未有的学习预警系统 最早进行这方面探索的是美国佐治亚州亚特兰大地区的格威内特学区(GCPS)。[37]该学区下辖133所学校,有162000多名学生。为及时了解各个学校的办学水平,提高学生学习成绩,该学区与IBM公司合作,采用包含预测建模和分析软件的集成解决方案——eCLASS,来收集、整合、分析学生的数据,从而能快速识别需要帮助的学生,并可以为有较大困难的学生建立预警系统,从而对困难学生给予及时的帮助和必要的干预。 该系统还可持续跟踪学生今后的进步与发展。过去只能利用最终测试成绩来评价学生的表现,现在则可以在学习过程中了解学生的状况,因而能尽快发现有问题和有困难的学生,并及时给予帮助,从而大大减少辍学率。 五、大数据如何改变教育技术的研究范式 由于大数据的出现极其广泛的影响,西方学者Jim Gray在2007年提出了数据密集型科学(Data-Intensive Science)的概念。Gray认为,从科学研究方法的角度看,自古至今的科学研究范式有四种。[38][39] (1)实证范式(实验科学,Empirical/Emperimentation),开始于1000年前。其主要研究方法是对自然现象的描述论证,对自然现象进行系统归类(如化学元素的分类)。 (2)理论范式(理论推演,Theoretical),出现于数百年前。当科学假设和预期结果一致时,理论框架就开始占有一席之地。它主要采用建模方式——由特殊到一般进行推演。 (3)计算范式(计算机仿真,Computational),开始于几十年前。主要是利用计算方式模拟复杂现象:科学数据可通过模拟方法获得,而不再依赖单一的实验。 (4)数据密集型科学范式(Data-Intensive Science),是在前三种方法的基础上,采用信息技术来获取、处理、存储、统计、分析大量数据,以便从中获取知识。 如前所述,在大数据背景下的自适应学习系统,通过学习分析技术(LA)和教育数据挖掘(EDM)引导学生逐步了解自己的学习状况,并为教师的教学内容、教学方法与策略的选择以及教学干预提供依据,也使学校管理层能更好地进行决策。与此同时,以数据密集型科学为基础,通过LA和EDM等技术将能更有效地分析学生的需求和特点,从而使学习更个性化。正是基于这种分析与认识,以祝智庭教授为首的一批学者认为,下一个教育技术研究范式应当是个性化的自适应学习(PAL)。[40]祝智庭教授还特别强调:他们之所以要把PAL归类到基于大数据的新型科学研究范式中,是因为PAL确实利用了多方面的数据。一方面利用已有的各种数据,提供适合每个学生需求的个性化学习内容;另一方面则通过对已有数据和学习过程中产生的新数据进行分析比较,以便从中发现问题,并据此形成个性化的干预措施。[41] 前文已经提到,按照Gray的观点,从科学研究方法发展历史的角度看,数据密集型科学范式应是迄今为止的第四种科学研究范式,而个性化的自适应学习(PAL)则是完全依靠以数据密集型科学为基础的LA和EDM技术来实现的,所以我们认为,祝智庭教授等人把个性化的自适应学习看作是“教育技术的下一个研究范式”,确实具有某种客观依据与科学基础,不啻是一种颇有远见的创新之举。 六、大数据能否改变人类的思维方式 如前文所述,有些学者认为,大数据将刮起一场飓风,摧枯拉朽地给教育乃至整个社会带来一场变革,从而使人类探索和认识世界的思维方式也终将发生改变。大数据目前正在改变,甚至颠覆人类未来的工作、学习和生活。那么,大数据是否也正在改变着人类的思维方式呢?我们将从思维本质所涉及的几个方面来深入探讨这个问题。 (一)大数据正在改变人类的思维方式吗 著名的英国学者维克多·迈尔—舍恩伯格教授认为:大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜能让我们观察微生物一样,大数据正在改变我们的生活以及理解世界的方式。[42] 对于迈尔—舍恩伯格教授借用望远镜和显微镜来隐喻大数据的这段话,我国学者张杰夫借用“核磁共振成像”技术作了进一步的阐述:“教育有了大数据,就像医学有了‘核磁共振成像技术’,学生的思维在一定程度上成为可测的。核磁共振成像技术是通过连续的切片动画,再合成物体内部的结构图像。大数据则是通过记录每位学生的‘行为轨迹’(相当于切片),再聚合、分析全体学生的行为数据,描绘出学生思维状况图。单个学生的学习行为数据看似杂乱无章,毫无规律可循,但当学生数据累积到一定程度时,学生的群体行为就会呈现出规律。这意味着学生的思维运行方式是可计算的,思维的本质可以还原为机械性的操作步骤,并由此可以让学生的思维‘透明’”。[43] 迈尔—舍恩伯格教授指出,大数据将使人类思维方式发生大的转变,这种转变有三个特点:不是随机样本,而是全体数据;“不是精确性,而是混杂性”;“不是因果关系,而是相关关系”。[44] 有些学者在迈尔—舍恩伯格上述说法的基础上,还进一步加以强化与扩展,并宣称迈尔—舍恩伯格提出了全数据优于随机样本,混杂性替代精确性,相关性重于因果关系等三方面内容的“三大思维变革”理论。[45]这些学者还指出以下两个事实,作为大数据正在改变人类社会思维方式和生活方式的例证。[46] 例证1:(这是在BBC纪录片《地平线——大数据时代》中呈现的一个真实案例):在美国洛杉矶,一项非凡的实验正在进行:警方想在犯罪发生前就做出预测。人类学家杰夫·布兰丁汉姆在洛杉矶80多年来的1300万宗犯罪记录中发现了重发犯罪的行为模式,并以此建立计算机算法模型预测犯罪高发生的时间和地点。洛杉矶警察依据这项预测模型在可能发生案件的地区巡逻,实验一段时间后,使得财产犯罪率下降12%,入室盗窃犯罪率下降26%。该模型还在持续更新,通过加入新的犯罪数据以求达到更加精确的预测效果。这项预测系统将会在整个洛杉矶市启用,并在美国超过150个城市试用。 例证2:全球最大的在线影院Netflix在美国有2700万订阅用户,在全世界则有3300万订阅用户。现在它比谁都清楚大家喜欢看什么样的电影和电视,这得益于Netflix对其用户在线活动的跟踪和记录。通过对这些庞大跟踪数据的挖掘和分析,Netflix能掌握用户观看电影的特点,并能预测其喜欢的影片,从而有针对性地向用户进行推介。此外,对大数据的挖掘与利用,不仅让Netflix能为用户提供更贴心的个性化服务,还能指导其今后的编剧与拍摄工作,从而在此基础上制作出更受观众喜爱的影视作品。 仔细分析上述例证,我们不难发现:例证1只是说明大数据正在改变人类社会的工作方式,而例证2则说明大数据正在改变人类社会的工作方式和生活方式。两个例证都没有真正涉及大数据如何改变人类思维方式的问题。还有很多事实可以证明大数据正在改变人类未来的工作、学习与生活,比如:亚马逊公司现在正通过大数据运算来替代专业书评人员推荐书籍;金融行业正通过大数据来鉴别个人的信用风险;快递领域正通过大数据来确定行驶路线以减少等候的时间;商场则通过大数据来发现商品之间的关联;等等。[47]这一切改变,我们都正在体验之中。 联系到大数据在教育领域的应用,我们看到上海高校的教改近期也开始“让数据说话”:有一段时间若不刷“一卡通”,学院会接到某位学生可能不在校内的预警报告;学生的饭卡消费低于一定数额,该生可能进入学校贫困生预警系统,从而会收到是否需要援助的信息提示;通过图书馆的借阅、门禁等信息可以分析学校师生进入图书馆的高峰时间、阅读偏好,进而为师生提供更有针对性的服务。[48] 上述种种例证或事实确实表明,大数据正在改变,甚至颠覆人类未来的工作、学习与生活,但人类的思维方式也被改变了吗?这只有在对思维的本质特征、组成要素(即思维的内在结构)具有科学认识的基础上,进一步了解思维加工方式的具体内涵,才有可能正确回答这个问题。由于目前国内外学术界对于这个问题的看法过于偏激(包括一些著名学术权威的观点也是如此),所以下面我想比较深入地阐述这个问题,以正视听。 (二)对人类思维本质特征和组成要素的客观分析 关于思维,心理学家与哲学家都认为这是人类大脑经过长期进化而形成的一种特有机能,并把它定义为人脑对客观事物的本质属性和事物之间内在联系的规律性所作出的概括与间接的反映。[49]之所以说是“间接”的反映,是因为这种反映是通过符号表征系统(如概念、表象、手势等)间接地完成,而不是像照相机那样直接对事物作出反应;之所以说是“概括”的反映,是因为这种反映不是对客观事物的全部属性及其外部现象原封不动的复制,而是对事物的本质属性及事物之间内在联系规律进行抽象(舍弃其非本质属性及外部现象)的基础上所作出的概括性反映。 按照系统论的观点,客观世界的任何事物皆以系统的形式存在与变化,而系统总是由若干要素组成。思维也不例外,研究表明,作为系统而存在的思维,其组成要素有四个,即思维加工材料、思维加工方式、思维加工缓存区、思维加工机制。[50] 为什么思维的内在结构包含这四个组成要素,而且只有这四个组成要素呢?这就要从思维的上述定义及内涵来分析。 如上所述,思维对客观事物的反映是通过符号表征系统间接地完成的。人类在思维过程中使用的符号表征系统有以下几种:基于语言的概念、属性表象、关系表象以及手势语、旗语等。思维过程中使用的符号表征系统是思维心理加工的具体对象或材料,这就是思维的第一个要素——思维加工材料。 思维过程中运用符号表征系统对客观事物所作出的反映是通过分析、综合、抽象、概括、判断、推理,以及联想、想象等不同的心理加工方式而实现的。这些不同的心理加工方式,就是思维的第二个要素——思维加工方式。 要想通过各种心理加工方式来完成对客观事物的概括与间接的反映,显然还应当有工作记忆区,以便用于暂存思维加工的初始材料、中间结果和最终结果,这就是思维的第三个要素——思维加工缓存区。 思维是一种人类大脑经过长期进化而形成的特有机能,这种机能当然有它的物质基础,即在大脑皮层中必然要有相应的神经生理机制,以便支持思维过程中各种心理加工方式与加工缓存的功能要求,这就是思维的第四个要素——思维加工机制。 (三)对人类思维基本类型和思维加工方式的科学认识 目前人类普遍使用的最基本的思维加工材料共有三种:基于语言的概念、属性表象和关系表象。 至于“手势语、体态语、旗语、电报码”等,虽然也可作为反映客观事物的符号表征系统,但对人类来说,它们都不是基本的、普遍使用的表征系统,只能算是辅助性的思维加工材料。 与概念、属性表象、关系表象这三种基本思维加工材料相对应,人类思维存在三种基本类型(或基本形式):逻辑思维、形象思维与直觉思维(逻辑思维以言语概念作为思维加工材料、形象思维以属性表象作为思维加工材料、直觉思维以关系表象作为思维加工材料,是这三种思维的基本特征之一)。20世纪90年代以来,脑科学与脑神经解剖学的成就已经证明:逻辑思维、形象思维与直觉思维不仅拥有各自不同的思维加工材料和思维加工方式,而且在人类大脑皮层上还拥有各自不同的思维加工缓存区和特定的思维加工机制(彼此完全不重叠)。[51]这就有力地证明了人类思维只有这三种基本类型(或基本形式),不会多一种,也不会少一种。 至于思维加工方式,人类通常使用的有分析、综合、抽象、概括、判断、推理、联想、想象等多种。但是若对思维加工方式按所属思维类型作进一步的划分,那就会有以下几种方式: 属于逻辑思维的有:运用言语概念进行分析、综合、抽象、概括、判断、推理等心理加工方式。 属于形象思维的有:运用属性表象进行分解、组合、抽象、概括、联想、想象(包括再造想象和创造想象)等心理加工方式。 属于直觉思维的有:运用关系表象进行直观透视、空间整合、模式匹配、瞬间作出判断等心理加工方式。 (四)关于大数据能否改变人类思维方式的正确结论 在对思维的本质特征、组成要素(即思维的内在结构)进行客观、深入分析,并对人类思维的基本类型和思维加工方式具有科学认识的基础上,对于大数据能否改变人类思维方式这一热门话题,将不难得出正确的结论。 如上所述,大数据确实正在改变人类未来的工作、学习和生活,这是因为在大数据的背景下和基于大数据的技术,正实实在在地而且大幅度地提高了人们的工作和学习的质量与效率(甚至将要颠覆人类未来的工作、学习和生活),但是,工作和学习的质量与效率的提高(包括思维品质与思维效率的提高)并不等同于思维加工方式(通常简称之为“思维方式”)的改变,更谈不上思维方式的“大变革”或“根本性变革”。这是因为,不管是大数据背景还是基于大数据的学习分析技术与数据挖掘技术,尽管对改善思维品质(思维品质涉及思维的敏捷性、灵活性、批判性、发散性、独创性等多个方面)和提高思维效率都很有好处,从而使人们的工作、学习、生活的质量与效率得到很大提升(甚至正在颠覆人类未来的工作、学习和生活)。但是,请问:这种大数据的背景和基于大数据的学习分析技术与数据挖掘技术,能够对上述的逻辑思维、形象思维、直觉思维等三种思维加工方式(或简称之为“三种思维方式”)产生任何影响吗?例如: 对于逻辑思维方式来说,也就是对于运用“言语概念”进行分析、综合、抽象、概括、判断、推理的心理加工方式来说,大数据的背景和基于大数据的技术能对其产生任何影响、任何改变吗?显然不可能!大数据的背景和基于大数据的技术所能改变的,只是由于大数据提供了丰富的实证材料使逻辑思维的加工过程可能被缩短了,或者使逻辑思维的有效性进一步提升了(得出的结论更让人信服了),也就是能使逻辑思维的效率和逻辑思维的质量都得到比较显著的提高或改进。 对于形象思维方式来说,也就是对于运用“属性表象”进行分解、组合、抽象、概括、联想、想象(包括再造想象和创造想象)的心理加工方式来说,大数据的背景和基于大数据的技术能对其产生任何影响、任何改变吗?也没有这种可能!大数据的背景和基于大数据的技术所能改变的,只是使联想或想象的过程更丰富、更有现实依据,甚至使设计人员能想象出可通过更小的投入来获得更大产出的设计或创意,从而使形象思维的效果——不仅思维质量得以提高(得出的结论更让人信服),而且其效益(即“投入产出比”)也将有较大的提升。 对于直觉思维方式来说,也就是对于运用“关系表象”进行直观透视、空间整合、模式匹配、瞬间作出判断的心理加工方式来说,大数据的背景和基于大数据的技术能对其产生任何影响、任何改变吗?同样没有这种可能!在此情况下,能够改变的只是因为有了大数据丰富实证材料的有力支持,使每个人在做出直觉判断时将有可能摆脱个人的主观性与局限性(在缺乏大数据的背景下,这种直觉判断的主观性与局限性通常是难以避免的),从而使最终作出直觉判断的针对性和准确性(即直觉思维的质量)得到切实可靠的保证。 这就清楚地表明,关于大数据能否改变人类思维方式的正确观点应当是:在大数据背景下,基于大数据的学习分析技术与数据挖掘技术,确实正在改变人类当前的工作、学习和生活(甚至将要颠覆人类未来的工作、学习和生活),特别是使思维品质与思维效率(包括逻辑思维、形象思维和直觉思维这三种思维在内的品质与效率)都得到了较大幅度的提升,但是,迄今为止,我们还没有看到任何大数据能够真正改变人类三种基本思维类型(即逻辑思维、形象思维、直觉思维这三种类型)的加工方式,或是能够改变其中某一种思维加工方式的案例或证据。事实上,也永远找不到这样的案例或证据。换句话说,大数据背景和基于大数据的任何技术,都不可能使人类的基本思维加工方式(即通常简称的“思维方式”)发生改变。这就是结论,是国内外的任何学术权威都无法改变的结论。 七、结束语 文章从大数据一词的起源与大数据的生成、关于大数据的描述及类型、大数据如何改变人类的教育方式、大数据如何改变人类的学习方式、大数据如何改变教育技术的研究范式,以及大数据能否改变人类的思维方式等多个方面,对当前国内外学术界关于大数据给人类社会的工作、学习和生活的方方面面造成何种影响的各种不同观点,进行了比较系统、深入的梳理与分析,看看大数据在哪些方面正在改变着人类社会生活的发展变化规律;而在另外一些方面,大数据尽管并未使事物的本质发生改变,但已对事物发展的过程及结果(例如效率、质量及效益)产生了重大影响。写作本文的目的,就是要对当前国内外学术界关于大数据的正确论述给予充分的肯定,而对于一些过激的片面观点(哪怕是著名国际学术权威的观点)则在科学论证、充分说理的基础上予以辩驳,以正视听,从而形成关于大数据的面面观。 国际上一些著名学术权威的思想、观点,往往与众不同,通常也很有创意,确实值得我们虚心学习、深入思考和认真借鉴,但决不应当盲从。学术权威也是人,也会犯错误,尤其是当学术权威跨入并非其本人所从事的专业领域时,更容易犯这种错误(甚至是常识性的错误)。这正是我想要提醒的。标签:大数据论文; 智慧教育论文; 自适应学习论文; 数据与信息论文; 教育信息化论文; 系统评价论文; 系统学习论文; 信息发展论文; 教学评价论文; 数字化时代论文;