大数据时代应用统计学的发展模式探究
——基于湖北大学的个案分析
王晓娟,甘澜珊,胡泽华
(湖北大学数学与统计学学院,湖北武汉,430062)
[摘 要] 近年来,数据分析专业人才需求高涨,各大高校纷纷开设大数据研究等相关专业,大数据时代对应用统计学的发展提出了更高的要求。学校可以通过对统计数据认识、搜集和分析的变化分析,结合统计学教育内容、教学模式和考核方式的变化应对统计学教育面临的挑战。
[关键词] 应用统计学;大数据时代;发展模式改革
一、大数据的定义及特征
随着信息化时代的发展,“大数据”已成为当下人们使用频率最高的词语。无论新兴行业还是传统行业,都想从大数据中获得新的能量,以创造更好的行业发展契机。大数据专业人才供不应求,各大高校纷纷开设“大数据研究”等相关专业,国家也越来越重视大数据方面的人才培养。
螨虫喜欢潮湿的环境,常寄生于动物皮肤较柔软嫩薄之处。仔狐窝箱内没有足够的阳光照射,小环境较为潮湿,加之仔狐耳道内皮肤较为嫩薄,所以该时期的蓝狐仔兽极易发生耳螨病。耳螨病严重者耳道内会化脓,进而引发脑炎,动物表现为间歇性抽搐。
大数据的概念可以追溯到2001年,世界知名咨询公司Gartner发布的一份咨询报告里首次提出“Big Data”并提出了“3V模型”。意思是大数据在数量(volume)、速度(velocity)和种类(variety)三个维度上都很“大”。经过数年的积淀,伴随着计算机和数据分析技术的兴起,大数据终于迎来了它的黄金时代。2012年,畅销书《大数据时代》更是令“大数据”一词迅速走红,各行各业都对大数据技术跃跃欲试,大数据在互联网等行业的应用日新月异。
目前,比较权威的大数据的定义是Cartner给出的,大数据是一种信息资源,其特点是具备对海量数据的决策力、洞察力及流程优化的能力,除此之外它的数据同样具有高增长性、高储存性和多样性。这个定义包含了大数据的三个典型特征:新形态——大数据具有高增长性、高储存性和多样性;新模式——大数据需要新处理模式的支持;新能力——大数据具备对海量数据的决策力、洞察力及流程优化的能力。这也为我国专业人才的培养提供了思考方向。数据处理和数据分析的重要性在各行各业得以体现,大数据分析已经成为当今社会热门的技术岗位,也是各大企业争相获取的数据资源优势。
由于河道多为通衢要道,沿河聚落内人员流动频繁,经济、文化活动丰富。功能上的需求使得聚落内产生众多建筑类型,包括住宅、庙宇、商铺及水利建筑等。其中庙宇种类众多,有祈雨祭天的龙王庙、求子祈福的观音庙、求取功名的文昌阁,也有家庙祠堂。庙宇一般位于村子的中心或入口,限定了村子的边界,增加了生活在聚落内人们的归属感,为其构筑了一道心理防线。村中的街道密度高,高差小,呈网状分布,地面多铺石材。聚落内的民居多为合院,分布集中,主要用木、土、石等三种材料修建,其中墙体多用石头和土坯,内包木柱,少量经济条件宽裕的人家民居会全部或部分使用青砖;屋顶则多用青瓦;院墙多用石头和土坯。
二、大数据与统计学的发展
大数据的本质是大量的数据资料,而应用统计学则是一门将数据分析方法应用于各个领域,以推断目标研究对象的性质,甚至是对研究对象的未来进行预测和决策的综合性学科。了解大数据和应用统计学各自的定义和特点,明白它们之间存在的联系和差异,有助于大数据与应用统计学之间的研究体系的建立,也有助于对应用统计学的未来发展模式的更深入的研究。
大数据与应用统计学之间有着紧密的联系,具体表现为以下几点。首先,构成大数据的巨型数据集虽然与通常的结构化数据不一样,但它的本质仍然属于数据,统计处理也同样将大数据作为对目标进行研究分析的起点。其次,大数据对数据的一般处理流程为:数据采集→数据分析→数据挖掘→筛选有用信息,而统计应用的大致步骤则是:统计设计→数据采集→数据整理→统计分析→挖掘数据关系。虽然这两者处理的各个环节不尽相同,可许多步骤的原理和方法非常类似,很明显它们内部保持着某种紧密的关系。最后,大数据和应用统计的研究方法可以相互借鉴,大数据的新兴性要求专业人员在对对象的研究和处理模式上与时俱进,这为应用统计学的研究指引了不同的新方向。与此同时,大数据的研究不可能脱离对数据分析的基本方法,这些重要的基本理论也正是来自应用统计学科知识。
传统分析思维一般是对样本进行“定性—定量—再定性”的分析,这种思维的分析方法在数据不足或有缺失值的情况下是依照统计研究人员的经验进行判断的。大数据时代,数据信息高度丰富,如果人们延用这种分析方式就很难保证分析结果的准确性与科学性。目前,统计分析更需要人们对大量真实数据进行科学分析与信息方向的整体把握,同时能够对所分析数据进行假设和推断,最大限度地保障分析数据信息的完整性。
三、大数据时代应用统计人才的需求与挑战
(一)市场对统计人才的需求
1.教育内容的变化
从大数据人才的需求来看,当前高层次复合型人才是市场竞相追逐的对象:他们熟悉数学、统计学、机器学习等专业领域,并能把各种语言处理与统计应用融合起来。各行各业都在与大数据时代接轨,其发展也自然离不开大数据人才的参与。因此,培养适应时代潮流和社会需求的大数据人才,是我国当前高校教育工作的重中之重。
(二)近年来我国高校在大数据领域的发展
表 1 2013— 2018年成立的大数据研究院 或开设大数据相关专业的高校数
表1显示,我国开设应用统计学专业的高校,近年来成立大数据研究院或者开设大数据相关专业的数量不断攀升。各大高校都想抓住大数据发展的时代潮流,纷纷投入到统计学与大数据的发展融合中,为满足市场需求输出更多优质的大数据人才。大数据时代推动着应用统计学专业的发展,也对应用统计学的发展提出了新的挑战。
本次研究的90例患者均经过手术病理进行确诊,其中C组诊断准确率高于A组,但是和B组对比不存在统计学意义(P>0.05),详情见表2。
传统的考核方式大多采用试卷考试的形式。随着教学内容和教学模式的革新,传统的考核方式已不能满足发展需求。从数据处理方面看,大数据的统计计算与数据分析,往往需要借助计算机操作;从实际应用上看,要解决实际问题需要进行分组讨论等其他写作。因此,在大数据相关科目中,上机考试和分析报告将替代传统的试卷考核。
(三)应用统计学教育面临的挑战
数据科学的发展,冲击了传统统计学的发展,也使高等教育事业担负起新的责任和挑战,应用统计学专业的发展模式和课程改革显得尤为必要。目前,很多高校的应用统计学专业建设时间比较短,其人才培养经验不足,不切合实际,脱离了经济发展的实际需求,这带来的后果可能就是限制了学生的发展空间,或者导致培养的学生不具有统计学专业人才应有的专业素养。在全球大数据化的冲击下,应用统计学教育必然会面临以下挑战。
近年来,我国大数据产业从无到有,全国各地发展大数据积极性较高,行业应用得到快速推广,市场规模增速明显。2017年我国包括大数据核心软硬件产品和大数据服务在内的市场规模超过2600亿元,与2016年相比,增长了49%。2017年1月,工信部发布了《大数据产业发展规划2016~2020年》,进一步明确了促进我国大数据产业发展的主要任务、重大工程和保障措施。国家政策的接连出台为推动大数据产业快速成长提供了良好的发展环境,未来2~3年市场规模的增长率将保持在50%左右。预计2020年,我国大数据市场规模将超过8000亿元,预计未来中国将成为全球数据中心。
现阶段应用统计学专业的主要课程设置有数理统计、抽样技术、回归分析、统计预测与分析、计量经济学、时间序列、多元统计、非参数统计等,这些经典课程仍然是应用统计学的专业必修课。除此之外,面对大数据时代海量数据处理的需求,学校也要开设一些顺应大数据时代潮流的新课,比如数据挖掘、探索性数据分析、统计计算等。
岗位巡检,他给自己加码,不仅增加频次而且扩大检查范围,甚至连每个设备附件都不放过,即使是令人畏惧的超高压反应釜前、高压管道架上也绝不马虎。一次,上夜班,董松江查到反应坝前。突然,他发现仪表指针急剧摆动,压力上升到1560公斤!他当机立断,采取了紧急停车措施,从而避免了放炮。
当前,应用统计学的授课模式大多是理论讲解为主,辅以统计计量软件的操作。而随着互联网教育业的发展,当前国内外高校纷纷推出在线视频教学。这些视频教学资源从各种不同的角度剖析某一方面的专业知识,比起传统的教育方式,更加生动活泼,又因互动方便而受众面广。应用统计学的教学模式也渐渐向在线授课倾斜。
3.考核方式的变化
本篇文章对肺癌肿瘤实性区的CT强化程度的影响因素分析,相关研究数据使用统计学软件SPSS18.0进行处理,计量资料采用t检验;计数资料采用X2检验。P<0.05是有显著差异,P<0.05是有显著差异,具有统计学意义。
四、大数据时代应用统计学专业的发展模式探索
(一)大数据时代的统计思维新变化
1.培养目标的转变
1.统计数据认识思维的变化
大数据时代,大部分数据信息源于网络,人们很难追溯其根源,从信息来源方向上看,数据信息的目的性很模糊。大数据时代的数据类型不同于传统统计学中样本的完全结构类型,其多半属于半结构、异结构、非结构类型,其数据类型更加复杂。在统计研究中要想根据这些数据形成样本,还要在量化方式上依靠大量的相关理论基础。因此,相关研究人员应该对数据信息进行详细的汇总和分类整理,简化统计过程,充分发挥大数据的实际优势,建立能为自己所用的立体的数据信息模型,促进统计工作的实施。
2.统计数据搜集思维的变化
2.教学模式的变化
搜集统计数据的基本方法主要有观察法、报告法、访问法等。不同的搜集方法有不同的特点和其适合的条件,人们应该根据调查对象的特点、研究目的和任务及统计调查的条件灵活选择搜集方法。统计数据的搜集工作一定要严格按照调查方案进行。数据搜集思维的变化,很大程度上影响着数据的选取和对数据的具体应用,良好的搜集思维能够高效完善统计工作,推进统计工作的实施进程。
3.统计数据分析思维的变化
大数据分析与应用统计学的区别则主要体现在研究目的、数据处理对象和数据分析技术上。首先,大数据的目标在于发现和获取数据价值,追求数字回报,而应用统计学则以发现数据的规律和关系及其背后反映的事物的某种本质为研究目的。其次,大数据的数据处理对象可以遍及金融投资、保险、消防、互联网空间、建筑设计和实时交通等各个领域,其数据形式为巨量的非结构化数据和半结构化数据,而应用统计学处理的数据类型主要为规模不大的结构化数据。最后,大数据分析需要复杂的网络技术和工具,其基础的技术包含数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面,而应用统计学的研究方法主要包括市场调查、统计推断、回归分析、综合评价等。[1-3]
综上所述,在乳腺癌患者中实施MRI诊断的方式显著提升了患者的检出率,进而可以使患者得到及时的治疗,由此可知,MRI诊断的方式在乳腺癌患者中具有较好的推广价值。
(二)湖北大学应用统计学人才的培养方案探索
统计学作为一门研究数据的科学,其传统的数据收集和数据分析的知识结构已不能满足大数据时代的高要求,其培养方向已经在与计算机技术、数据库技术等专业领域逐步融合。从学科发展趋势上来看,高校需要对高层次统计专业人才进行培养,以适应大数据背景下对数据处理的需求和发展。对此,湖北大学从2011年开始招收应用统计专业硕士,并从2015年开始招收应用统计专业本科生,旨在培养应用型的统计人才,以适应大数据时代对数据分析人才的需求。
“只可惜啊,平安你现在就只能跟我们这群锦衣卫的糙汉厮混,将来也必定跟朝廷百官是死对头!”张全辉似乎随时都是幸灾乐祸的表情,“怎么样?有没有觉得后悔?”
当今社会,研究中对于大数据运用的优势逐步显现,它所渗透的范围也越来越大。所以,大数据环境下,传统的统计思维必然会发生适应性的改变。[4]
大数据思想的渗透,使人们越来越关注数据处理与数据分析。本研究试图探索能够满足大数据分析需求的人才培养模式,着力提高应用统计学专业学生的数据分析技能。具体表现在以下三个方面:一是调整现有应用统计专业人才培养方案,传统的数据收集和数据分析的知识结构已不能满足大数据时代的要求;二是探索能够满足大数据分析需求的人才培养模式,改变传统单一的课堂授课模式,将翻转课堂的理念渗透到统计课程教学当中;三是将数据分析与计算机技术、数据库技术等专业领域逐步融合起来,更充分地发挥应用统计的数据处理与数据挖掘的功能。
视频监控系统在铁路发挥的作用越来越大,监控范围越来越广,清晰度越来越高,存储时间也由原来3~15天提升到15~90天,视频数据量急剧增加。目前这些数据采用单一的高性能存储、IPSAN方式进行数据存储,其成本将大幅攀升。但是,大多数空前增加的数据却是“冷数据”,即不常访问的数据。存储这些不常用的数据存储设备的空间利用率低、能耗高、成本高。
2.教学内容的改革
在教材教辅资料的选择方面,教师在当前采用的各类统计学专业教材的基础上,编排统计与经济、金融相结合的教学案例,用来做教学的辅助讲解和演示,将专业知识渗透到实际应用当中去;在教学内容方面,教师借鉴经典案例,关注学术前沿,除了专业知识介绍之外,还要注意实际应用的介绍,理论与实践相结合,使学生的专业视野更开阔。
3.教学模式的改革
在教学模式上,教师主要借助案例教学,从社会生活中的一个熟悉案例出发,引申出统计学的某个知识点,并将此案例在基本原理、研究方法及应用介绍过程中贯穿始终,使学生抱着解决问题的态度去学习知识,寓学于乐。另外,革新传统的考试考核模式,加大平时考核的力度,提升学生课堂学习的参与度,鼓励团队研究以使每位学生都参与课题研究,快速提升学生对统计方法的应用水平。
4.教育模式的探索
实施多元化的授课模式。在阶段性的专业知识传授后,教师可以鼓励学生参与课堂教学,分别从数据收集、数据处理、统计软件操作、统计建模与数据解读几个方面,培养学生解决实际问题的能力,让学生真正掌握统计的专业技巧。湖北大学实施本科生导师制,通过定期开展大讨论、鼓励学生参加课外实践活动等形式,帮助学生加深对应用统计学专业的了解。除此之外,湖北大学还注重校内学生与校外企业的联合培养,目前已经与上海缔脉生物医药科技有限公司签订了定向培养协议。校企联合培养的方式,不但增强了学生的专业实践能力,而且为企业输出了专业的数据分析人才。
“控过程”就是校企合作课题研究主要集中在假期空闲时间,定期由公司技术副总主持召开例会,及时解答产品研制过程中出现的问题,必要时开展相对应的专题研讨或培训,并及时安排不同类型的企业技术人员跟进,协助解决教师课题研究合作的需求,以保证过程通畅。
五、结束语
传统统计学在全球大数据化的时代背景下面临前所未有的机会与挑战。统计学学科建设必须顺应时代,进行相应的革新,培养符合大数据时代要求的数据分析与数据挖掘人才,提高学生在社会经济中应用的专业技能,提升学生就业的核心竞争力。统计学教育的改革不应局限于一朝一夕,面对大数据背景下迎面而来的挑战,学校应该制定长期的培养方案,建立有效的检验机制。大数据是推动统计事业新发展的关键动力,能够使应用统计学走得更远。
参考文献:
[1] 孔晓瑞,刘梦玲,靳俊娇.大数据时代背景下对应用统计学专业的思考[J].高教学刊,2016(18):41-44.
[2] 刘春杰.大数据时代对当代统计学教育的挑战[J].统计与决策,2015(8):32-33.
[3] 邱东.大数据时代对统计学的挑战[J]].统计研究,2014(1):16-22.
[4] 李金昌.大数据与统计新思维[J].统计研究,2014(1):10-17.
[中图分类号] G642
[文献标志码] A
[文章编号] 2095-3712(2019)19-0097-03
[基金项目] 湖北大学教学改革研究项目“大数据时代应用统计人才的培养研究”(070/014238)。
[作者简介] 王晓娟(1983—),女,河南南阳人,博士,湖北大学数学与统计学学院讲师;甘澜珊(1995—),女,湖北孝感人,湖北大学数学与统计学学院;胡泽华(1995—),男,湖北武汉人,湖北大学数学与统计学学院。
[收稿日期] 2019-05-06
标签:应用统计学论文; 大数据时代论文; 发展模式改革论文; 湖北大学数学与统计学学院论文;