大数据时代统计学面临的机遇与挑战
阿尔孜古丽·艾合买提
(喀什大学数学与统计学院新疆维吾尔自治区,喀什 844000)
摘 要 :随着科技的不断进步,云技术、物联网技术等呈现到大家的视野中,海量庞大的数据为我们的生活注入了新鲜的“血液”。同时,也为统计学的计算方式提供了有效的机遇与方法,可以在大数据的环境下对统计学进行分析与整合,保证结果更加精准。本文根据大数据带来社会各方面发生的变化,从而浅析统计学所面临的难题、挑战以及机遇,并让这门学科体系得到拓展和延伸。
关键词 :大数据时代;统计学;机遇与挑战
统计学是研究如何测定、收集、整理、归纳和分析的一门社会学科,可以反映客观现象总体数量的数据。在大数据时代的背景下,通过对大数据地统计推断,给统计界带来切实的利益,促进对自然和科学地深度理解。面临复杂数据的增多,大数据时代统计学在面临更多机遇的同时,也面临了众多的挑战。因此,这个时候就需要使用大数据,为统计学理论和方法构建提供更为广阔的发展空间。
一、大数据的意义
从一定程度上看,大数据时代充满了众多的信息,且其种类异常的繁杂,这就使得样本容量变得更加巨大。当出现这样的问题时,则可以利用统计学的知识,将其容量进行科学的减少,并按照具体的要求,使其达到自己想要的精确程度。在面对高维数的情况之下,则需要选择一个合适的变量,然后再对其进行压缩以及降维等。从另外一个角度来看,大数据涵盖的领域较为广泛,其所涉及的行业面比较多,在混合以及多源的数据基础上,实现对社会、自然等方面的数据叠加。从本质上看,各个领域间的数据并不是孤立的,他们之间也有着许多密切的联系。大数据的信息内容非常丰富,其中包括的语言、文字、声音、图像等。我们不仅需要对这些数据进行总结,还需要将这些数据进行集中并统计。从大数据的环境上看,第一,大数据快速的涌现,让存储设备与计算能力很难使用此种十分巨大的数据流。第二,目前形势上看,当前的磁盘存储还不能很好的实现硬盘存储。第三,大数据在分布存储的环境下,需要将海量的数据分布于更多的计算设备当中。第四,众多的数据储存在一台电脑中时,需要在多线条的环境之中,使用多个数据处理器实现内存的双向传输。总之,大数据的目的就是为了把繁杂的数据信息,转变为我们需要的知识。探究数据的产生机制,接着结合自身的实际情况,探究对应的对策与政策,提高预测性与预后性。大数据不仅可以实现纵向与横向的延伸,也可以在自然、经济、社会的现象上发现疾病疫情、科学与社会动态。例如:众多知名的搜索引擎就是利用频繁检索词条,进行搜索信息源来自哪里,其影响的范围等。
二、大数据对统计学的影响
(一)数据下的时代变革
从众多数据变化上来看,人们主要就是根据面临“问题”而去搜集相对应的“信息”。这个时候,我们在外出的时候,就可以查询到想要去的地方的天气与交通状况,其中还包含了宾馆的居住情况。接着就可以通过这些数据,对未来提出查询并作出决策。例如:现在有很多优秀的物理学家与统计学家,计算机专家,通过对大数据的把控与观察,就可以对数据进行敏锐的处理,并进入生命科学领域。
(二)大数据的研究动向
从数据时代所面临的难题来看,现在需要的则是对各类信息资源的处理,并追踪信息的源头,对核实的信息进行样本处理。展现对应的偏倚和异质性,按照其对应的格式与结构进行数据处理,实现分布式算法,保证数据的完整性与可视性、可扩展性。对海量数据进行有效分析时,已经超越了个体领域的范围,需要在社会整体层面上,实现计算机资源与数据源的实时性决策。除此之外,还需要该领域的专业人员,去研究统计推断以及算法的内容,并在此基础上提出合理化建议。
三、大数据时代统计学面临的挑战
大数据时代统计学,在回归预测方法的出现后,拟合优度检验的方式,并且深入的应用到社会各个方面。从当下的形势上看,人们在自主获得相应的数据时,也在从其他领域大量地获取信息,并对收集的大量数据进行观察与分析。此种情况的出现就让一部分人脱离了实验室,专业从事大数据的研究工作。但随着时间推移,信息的获得方式及其规模已经发生了根本的变化,这样就让统计学面临了新的难题和机遇。众多的数据都是多源异质的、且其覆盖范围也不尽同,为了整合这些信息,则需要对其来源、获取方式、描述等,作为支撑进行分析。科学技术的发展催生了大数据时代的变革。在科学的视角下综合分析处理信息,提供方便快捷的数据信息,促进统计学的发展。
统计学是一门传统性的学科,无论是其理论的领域,还是实践的领域,其研究的成果都有极高的价值。随着大数据时代的数据呈现了海量,分散式的特征,这样就对统计学的发展造成了一定程度的影响。这个时代的数据量,其规模已经超越了人们的想象,而它的“全”已经让人们对单一信息的认知变得更加连续、系统。信息的多样性,更是让样本与个体之间的关系得到了更好的优化。另外,新时代下的数据具有多样性特征,这也优化了传统统计学的主观臆断。以往的统计学更多追求的是“为什么”?而现代统计学追求的是“是什么”?因此,个体的选择标准会缺乏一个相应的标准,这样在选择个体数据时其难度更会上升。样本统计是一门极为重要的学科,利用该学科的知识,可以实现对客观事物的复杂关系等进行深入的研究。在这一时代下局部与整体的情况变化,造成了整体变化趋势的进一步变更。随着样本数量的增加,从一单数据源中收集到的信息,全部属于非结构化的信息,但是在之前的结构化的数据当中,需要进一步提升样本的数量,接着提升统计学的精确度。这样就会增加样本选取的工作难度。另外,随着计算机技术的不断提升,计算机的正常工作离不开统计学软件的支持,其软件的使用,不仅可以提升该学科对数据分析的效率,也可以提升精确度。从目前的形式上看,主要使用的统计学软件有Eviews、SPSS、SAS、Stata等。但是,还不能实现较强的传输与存储功能,还需要进一步的创新与研发。换句话说,就是需要在较短的时间内输出结果,但是实现这些软件的升级较为困难。在大数据时代下就需要提升数据的容量,增强更多的获取方式。我国相关统计软件相对缺乏,不少软件还处于英文版本的状态,对于初学者来讲需要花费较多的时间进行学习,这就给统计人员的需求带来了难度。那么,大数据时代在给相关人员带来意想不到惊喜的同时,也造成了不容小觑的挑战。
五、数据时代中统计学面临的机遇
(一)统计效率的问题
在大数据的引领下,统计学也得到了快速的发展。这个时候就需要在庞大的数据上,使用样本进行选取、按照标准进行划分。在新的变化中,传统统计学的样本统计会朝着一个方向进行发展,并在总体的概括中,实现对本门学科体系的构建,消除总体数据收集时的难度,弥补该学科数据采集不足的现象。并在有效的延伸过程中,对学科的体系进行统筹发展。
(二)统计单个体系的拓展
统计学的统计效率想要得到更好的体现,就需要在多元化的基础上保证及时性、弥补传统条件下的滞后性、提升统计学的效率。另外,大数据在高速发展的过程中,不仅可以提升统计动态数据的收集,还可以在反复的应用当中满足各式各样的服务需求。针对于采集数据采集的次数提升问题,需要使用大数据挖掘潜在价值,提升挖掘的全面性与整体性。在信息搜集的时候,其成本不会因为软件运行次数而出现上升,并且在其应用方面,其成本也出现了下降的趋势。
(三)统计学科的应用范围提升
中国城镇化过程的迅速推进促进了能源消费的增长和模式的转化,城镇居民生活能源消费问题也成为中国城镇化进程中面临的重要问题。自2001年起,中国以用电为主导的生活能源消费结构正式替代了以煤炭为主导的生活能源消费结构。电力因其直接使用便捷、价格经济和清洁卫生等特点,得到了国家政策的支持,成为城镇居民生活能源首选。[1]据《2017—2018年度全国电力供需形势分析预测报告》,随着中国城镇化率以及居民电气化水平逐步提高,居民家庭用电量也在稳步增加,2017年,中国居民生活用电量较2016年增长了7.8%,城镇居民人均生活用电量以5%左右的速度增长。[2-3]
以旧的理念为起点,在实践的过程中,需要了解一个结果或者是一个原因,统计学在数据时代的具体应用过程之中,展现惯有的“研究问题”来驱动“收集数据”。从数据时代的角度进行探究,此种功能并不是一成不变的,此种变化中,促进了统计学的进一步发展与扩大。例如:传统统计学一般会作为一种输血形式进行参考信息。但是,在大数据的背景下,展现了更多的多元化与多样性,并在海量的用户当中,开拓更多的信息,这些内容不仅涉及到了他们的生活各方面,而且还在进一步的挖掘过程中,衍生出来新行业。传统统计学结构存在着很多的局限性,在非结构或者是半结构的数据统计下,实现无数据化行业的进一步发展。
参照彭纪生等(2008)[23]的政策测量手册以及芈凌云和杨洁(2017)[24]、蒋园园和杨秀云(2018)[25]等对这一手册的情景化操作与应用,构建“政策力度-政策目标-政策措施”效力评估模型,并对三者分别进行赋值。其中,对政策力度的各个标准赋值1-5分;考虑到政策样本主要是针对机动车这单一污染源,目标客体相对集中,为使评估结果具有显著差异性,对政策目标的赋值层次确定为5、3、1;结合赵新峰和袁宗威(2016)[26]的政策工具理论,对政策措施分别赋值5、3、1分。具体测量标准及赋值如表2。
结语:
新常态的背景下,大数据时代下的统计学是科技与社会经济的主要价值体现,也是社会经济的运行模式与决策模式的构建。只有在日新月异的科技发展过程中统计学要与时俱进、统筹发展、完善统计学创新机制、建构统计学学科体系理论框架。并不断接受机遇与挑战,统计学才能适应大数据时代的发展潮流。
实训以小组为单位,每组4~5人,每个模块要求以任务书的形式下发到小组,小组成员分工合作,协调完成系统设计、接线、编程、调试、运行。在实训实践教学中,学生是主体,教师是指导者。教师需因材施教,因人而异。有的小组实力强,完成的速度快,可在完成基本实训模块内容的基础上,另行增加其他实训模块,如提高控制难度、改变控制要求等。从而调动学生们学习积极性,促使学生自主学习、主动学习,激发学习兴趣、拓宽专业知识面、锻炼自主工作能力和创新能力。
参考文献 :
[1]方巍,徐江.大数据:概念、技术及应用研究综述[J].南京信息工程大学学报(自然科学版),2014(05).
[2]孙艳春.大数据、云计算背景下的统计改革与创新[J].中国管理信息化,2017(17).
[3]李珊,孙丽男.大数据引领统计学专业人才培养模式创新[J].当代教育实践与教学研,2017(07).
[4]张瑜.浅议大数据时代政府统计面临的机遇与挑战[J].管理观察,2014(18).
[5]郑雅倩.大数据时代统计学面临的机遇与挑战[J].新经济.2016(12).
中图分类号 :C829.2
文献标识码: A
文章编号: 1008-7508(2019)02-0132-02
收稿日期 :2018-10-08
作者简介 :阿尔孜古丽·艾合买提(1996-),女,新疆克逊县人,硕士,研究方向为统计学。
标签:大数据时代论文; 统计学论文; 机遇与挑战论文; 喀什大学数学与统计学院论文;