大数据背景下传统统计的SWOT分析
庞立艳
(北京科学学研究中心,北京 100089)
摘要: 大数据的快速发展对传统统计工作产生了巨大影响,对传统统计与大数据的特征进行了比较分析,总结二者的区别和内在联系,在此基础上开展了大数据背景下传统统计的SWOT分析,剖析了大数据时代传统统计的优势和劣势,以及面临的机遇和挑战,认为在大数据背景下传统统计具有数据来源稳定、数据标准统一等优势,同时具有范围相对狭窄、数据来源单一等劣势。在这样的背景下,传统统计面临着拓展数据来源、促进质量提升等机遇,同时面临统计生产方式变革、统计职能弱化等挑战。
关键词: 大数据;传统统计;SWOT
现代信息社会已经进入了大数据时代,2013年被媒体称为“大数据元年”。大数据改变着人们的生活和工作,也改变着企业的经营和运作,个人和组织的行为信息通过物联网、互联网等进行记录、存储,并且数据量呈指数级的增长,产生的信息量远非传统统计分析所能企及。在向后工业转变过程中,大数据将信息技术的发展推向前所未有的高度,它不但成为一种技术,而且是一种资源和能力,并为新一轮的政府治理变革带来革命性的影响[1]。国家层面对大数据的重视程度也是前所未有,2017年12月8日,习近平在中共中央政治局第二次集体学习时再次强调要:实施国家大数据战略,加快建设数字中国[2],2013 年,国家统计局局长马建堂指出大数据对我国统计工作的机遇与挑战,无论如何强调都不过分,甚至都不够。如何应对大数据时代带来的机遇和挑战并主动顺应大数据时代进行政府统计工作改革,是现阶段政府统计部门面临的重大课题[3]。
本文对传统统计与大数据的特征进行了比较分析,总结二者的区别和内在联系,在此基础上开展了大数据背景下传统统计的SWOT分析,剖析了大数据时代传统统计的优势和劣势,以及面临的机遇和挑战。
1 传统统计与大数据的特征比较分析
传统统计与大数据在统计范围、统计标准、数据来源、分析技术等方面都存在很大的区别,然而二者之间又是相通的,在核心思想、核心方法上是一致的。
1.1 特征比较
1.1.1 统计范围
1)传统统计范围。目前,我国政府官方统计分布在各个部门,以统计部门为主,统计部门的统计范围主要包括国民经济核算、工业统计、能源统计、投资及房地产统计、贸易统计、人口和就业、科技和社会统计、农业统计、价格统计、住户调查、服务业和PMI统计等类别。其他部门根据工作需求制定自己的统计制度,例如科技部的科研机构统计调查、教育部的教育统计等。
2)大数据范围。相对于传统统计,大数据更显得无处不在,企业、个人、机构等每个个体所参与的社会经济活动的特征,都会以计算机数据的形式被记录和存储,这些数据都可以通过大数据手段进行搜集、整理、分析。
1.1.2 数据获取技术
1)传统统计获取数据方式。传统统计获取数据主要依靠统计调查,调查方法主要包括统计报表制度、普查、抽样调查、重点调查、典型调查和科学推算。
面对这场来势汹涌的洪灾,云南电网公司以最坏的打算,做最充分的准备,按照“灾前防、灾中守、灾后抢”的应急思路,以高度的使命感和责任感,科学部署、高效决策,从容应对险情。各相关单位、部门落实部署举措,未雨绸缪、积极备战,广大干部员工奋战一线,拼搏奉献,将灾害的损失降低到最小,坚决打赢这场洪水保卫战。
2)大数据获取数据方式。大数据的数据采集方法主要包括网络数据采集方法、系统日志采集方法和其他数据采集方法。
1.1.3 数据来源
1)传统统计来源。传统统计的数据大多来源于统计报表,各类报表分布在不同的部门,主要包括统计局、科技部、教育部等机构。报表填报主体涉及企业、高校、科研机构、各类创新基地等单位。
2)大数据来源。从数据来源上看,大数据手段获取的数据主要有三类:行政记录、商业记录、互联网数据[4]。行政记录数据主要来源于政府部门,包括个人信息记录数据、单位信息记录数据、自然和资源记录数据、其他管理记录数据。商业记录数据包括电子商务交易数据、企业生产经营数据、信息咨询报告数据。互联网数据包括搜索引擎数据、媒体数据、社交网数据。
我期中考的成绩都及格,社团生活也还可以,虽然专业社长很白目,但珊珊学姐人很好,我跟其他社员的相处也算融洽。
1.1.4 统计标准
传统统计经过长期的实践,在全国乃至全世界范围内已经形成了统一的数据标准,例如:R&D活动在全球范围内基本采用统一的分类标准,按照活动类型分为基础研究、应用研究和试验发展三类;国民经济行业分类在我国有统一的分类标准,且根据经济发展状况进行周期性修订。这样统一的数据标准保证了统计数据在根源上的一致性,为后期的数据分析处理奠定基础。
大数据发展时间较短,且主要是从“民间”走向“官方”,在数据产生之初没有统一的指导标准,不同行业、不同企业的数据千差万别,例如淘宝网与京东网两大电商的商品属性数据在分类上完全不同,这就造成了同类数据的不同标准,对后期数据的应用是很大的障碍。
数据分析成本方面,传统统计具有一套系统的分析方法,统计工作人员也都经过专业的培训,具备符合工作要求的分析技能,在数据分析方面基本可以做到有求必应。而大数据的数据处理、数据分析需要具有扎实的计算机软件编程、复杂模型等基础,虽说这些分析技巧也是以传统统计为核心基础,但由于起步晚,发展历史尚短,目前这类人才还相对紧缺,传统统计分析人员需要经过专业学习、培训和实践训练才能从事大数据分析工作,这在成本上是非常高的。
2.2.1 数据范围相对狭窄
3.1.3 促进统计设计标准化
在大数据手段获取的数据中,结构化和非结构化数据都大量存在,并且随着互联网的飞速发展,商业纪录数据和互联网数据中非结构化数据会越来越多,其中所隐含的信息更是结构化数据所不能提供的。
导师与学生之间缺乏沟通交流 由于学生个体间存在性格差异,对于有些性格内向的学生来讲,虽然选择了指导自己的教师,却从不主动与教师联系,在学习或生活中遇到问题时也不愿找教师探讨寻求帮助。而对于一些带领学生人数较多的导师来讲,平时已经担负繁重的教学任务和科研任务,实在无暇顾及每一位学生的情况,通常只对经常来找自己沟通交流的学生比较了解,而忽视了其他学生的需要。这就使得导师制培养对一部分学生发挥了积极作用,而对于另外一部分学生则是名存实亡。
1.1.6 数据频次
目前传统统计依靠调查报表获取数据的频次包括月、季度、半年、年度,其中年度统计数据居多。
大数据手段可以实现实时获取数据并进行存储,例如“双十一”购物节,全国数亿人同时网络购物,在阿里计算中心可以实时采集并展示购物的数量、金额、品类、地区等各类信息。
1.1.7 分析方法
此外,大数据采集的数据信息与传统统计在渠道和来源上不尽相同,大数据可为传统统计提供总体性、非结构化、丰富真实的原始资料,可利用其验证传统统计数据,有利于提高统计数据质量。
具体的分析方法是非常多的,常用的有图表分析方法、基本统计描述、均值检验和方差分析、相关分析和回归分析、时间序列分析、非参数检验等。
2)大数据分析方法。大数据分析与传统统计分析面临的数据量有天壤之别,采用简单的统计分析方法无法处理,多采用复杂的计算机模型,常见分析方法有多维分析、漏斗分析、留存分析、用户路径、用户分群、点击分析等,不同的数据分析方法适用于不同的场景。
1.2 内在联系
通过上述对概念、统计范围、数据获取技术、数据来源、数据形式、数据频次、分析方法的比较可见,传统统计与大数据之间存在着很大的区别,这种区别从根本上是由数据量的大小造成的。但这种区别不应理解为传统统计与大数据是毫无关联的两个学科(或领域),恰恰相反,从二者的概念可知,传统统计与大数据本质上是相通的,主要体现在三个方面:
一是,二者核心思想一致,都是以数据探索事物发展规律。从本质上讲,传统统计与大数据都是人们开展的以数据为基础的探索事物发展规律的活动,只是在数据来源、采集方法、分析方法等方面各不相同。传统统计在探索事物规律时,主要是应用概率论方法建设数学模型,对数据进行分析,发现事物发展现状和趋势。大数据方法能够使人们深入获取数据层次,能够利用系统数据和完整数据,全面探索事物的内在规律,获取更多新的知识和方法。
二是,二者核心方法相同,都是量化分析。从传统统计和大数据的分析方法看,无论采用如何复杂的模型,其核心思想都是量化分析,即将现有的各类现象转化为数据开展分析。传统统计的数据量有限,分析模型也相对简单,大数据分析的数据量大,分析模型也相对复杂,但二者都必须将现象转化为数据开展量化分析。
三是,大数据分析的核心基础是统计学。任何事物的兴起都不是偶然现象,必然有其赖以发展的基础,大数据的兴起和快速发展离不开传统统计的长期积淀。大数据是统计与计算机相结合发展的过程,即通过对经济社会活动与经济社会关系的定量、定性的观测与实验等过程,引入科学的技术和方法,达到对各种规律的有效把控、利用和管理的目的[5]。从信息角度讲,大数据仅仅告知信息,但不解释信息,必须通过系统的方法进行提炼。提炼的过程,就是数据分析的过程,提炼的工具就是统计学。大数据背景下,必须要具有统计思维,在分析过程中,对现代科技中的一些高科技技术和手段进行应用,只有这样才能做好相应的统计研究[6]。大数据时代,统计学依然是数据分析的灵魂。
传统统计数据主要来源于报表制度,数据的基础是报表中的各项指标,报表中的指标是相对固定的,每个调查周期可能会有微调。目前经济社会形势发展迅速,一成不变的调查指标很难满足实际工作对数据的需求,但根据目前全国统计报表制度的管理现状,大幅度的增加调查指标很难实现,这就造成了数据来源的相对单一。从统计内容上看,传统统计是先明确要调查什么,再确定内容,而大数据背景下内容已经存在了,看统计怎么选择,任何来源的数据都可进行采集、处理和分析。
2 大数据时代传统统计的优势和劣势分析
2.1 大数据时代传统统计的优势
尽管目前大数据呈现出迅速发展的势头,但还处于起步阶段,没有成熟到可以在各行各业广泛推广应用的阶段,传统统计的优势仍是不可替代的,依然是我国官方统计的主流。在大数据背景下,传统统计的优势主要体现在以下几个方面:
2.1.1 数据来源稳定
研究人员询问会场眼科医师,简单介绍本研究的目的和意义,知情同意后向自愿参加调查的医师发放“临床指南认知与应用调查问卷”纸质版材料或提供电子问卷二维码。调查问卷由调查对象匿名填写,各项目要求填写真实信息,并确保独立完成;对调查对象看不懂的语句进行详细解释,并避免倾向性用语。调查问卷完成后当场收回。当调查对象由于时间限制或其他条件限制无法亲自作答问卷部分或全部条目时,由研究人员进行面对面提问,代替执笔记录相应信息。调查对象的个人信息被严格保密。
传统统计以报表制度为基础,统计范围、统计对象、填报单位、统计内容等受统计法保护,统计数据在口径、指标上具有较强的可延续性。大数据主要来源于行政记录、商业记录和互联网数据,行政记录存在于不同的政府部门,数据来源相对稳定,但是商业记录和互联网数据不确定性较大,例如共享单车,兴起之时记录、存储了大量的用户数据,若干年后随着行业的逐渐衰落,用户数据自然大幅缩减。因此,相对于大数据而言,传统统计具有更加稳定的数据来源,且具有法律保障。
LI Feng-wei, ZOU Qi-fei, XUE Hui, XIANG Hong-jun, XIA Yong, LI Jun, YAN Zhen-lin, SHEN Feng, WANG Kui
2.1.2 数据标准统一
传统统计在全国乃至全世界范围内已经形成了统一的数据标准,大数据主要是从“民间”走向“官方”,在数据产生之初没有统一的指导标准,不同行业、不同企业的数据千差万别,短期内实现标准的统一难度较大。统一的数据标准保证了统计数据在根源上的一致性,是后期开展数据分析应用的基石。传统统计在数据标准上的优势是大数据在短期内无法赶超的。
2.1.3 数据质量可控
传统统计在进行调查时,需要对报表进行收集审核、整理编码、平衡检查、复核等操作,在以计算机自动根据平衡关系进行数据质量审核的基础上,加以人工辅助审核,提高数据质量。大数据在产生数据信息时,没有统一的规范,数据量大是其根本特征,但这也为数据质量控制造成了困难,人工辅助审核更是难上加难。
2.1.4 成本相对较低
传统统计的成本相对较低主要体现在数据获取和数据分析两方面。
数据获取成本方面,传统统计通过调查方式获取数据,具有固定的流程和渠道,具有非常强的延续性,每个调查周期所需的时间和人力成本相对固定,在调查经费预算上也相对较低。而大数据是二手数据,其拥有权不是政府统计部门,获得这些大数据需要政府机构同各个数据的所有者进行沟通和谈判,因此大数据可获得性差、时间和经济成本都很高。
本I/O模块使用单片机的P1口作为I/O的驱动,设计共八路的I/O口。P1.0-P1.3控制四路数字输出口,P1.4-P1.7作为四路数字输入口。P1.0和P1.1输出口电路采用继电器输出,P1.2和P1.3采用场效应管输出。继电器输出电路如图6所示,电路包含一路常开和一路常闭开关。继电器线圈并联一个二极管起续流保护作用。图6中网络标号P1.0连接到单片机的P1.0引脚。P1.1继电器输出电路与此类似。
1.1.5 数据形式
2.1.5 分析方法扎实稳定
传统统计经过几百年的发展,具有一套非常成熟的分析方法,并且经过长时间的实践检验,在各行各业已得到普遍应用,在理论和实践上都具有扎实的基础。而大数据对软硬件的要求都较高,很多采用自动化处理,必然存在技术风险,技术上的微小故障都可能带来严重的错误。此外,大数据正处在快速发展,未来的发展速度更是无法预测,可能研究出新方法后不久就过时了。
2.2 大数据时代传统统计的劣势
数据的存在形式包括结构化和非结构化两类。
传统统计数据主要通过统计调查获取,报表制度中的填报单位、调查对象、指标等事项都有统一明确的规定,且报表制度在几年内甚至几十年内都相对固定,即使调整也是微调,因此获取的调查数据范围是固定的、有限的。以工业企业统计报表制度为例,例行年报的调查对象仅包括规模以上工业企业,规模以下企业需要在经济普查年份才有完整的数据。大数据的数据采集不受这种限制,已有数据可实施实时采集,新出现的数据通过开发相应的数据采集程序也能很快开展采集工作,可以说大数据的范围是没有限制的,只要有数据产生就可进行采集。
2.2.2 数据来源单一
聚焦基层基础。瞄准政策落实关键环节,着力打通政策落地“最后一公里”,加强基层扶贫队伍建设。在所有有扶贫任务的乡镇(村)设立扶贫工作站(室),确保精准扶贫在基层有组织保障、有机构管事、有队伍做事、按规章办事。全省共建立乡镇扶贫工作站1551个,村级扶贫工作室17320个,实现扶贫工作站(室)全覆盖。坚持把加强农村基层党组织建设作为脱贫攻坚的重要措施,大力实施“连心、强基、模范”三大工程,积极推行以强化基层党组织建设为引领的村级治理模式。
2.2.3 数据形式单一
传统统计的数据基本是结构化数据,其采集渠道、采集手段、分析方法等特点都无法支持开展半结构化和非结构化数据的采集和处理。大数据手段获取的数据中,结构化和非结构化数据都大量存在,且非结构化数据可能会越来越多。
2.2.4 实时性相对滞后
目前传统统计依靠调查报表获取数据的频次包括月、季度、半年、年度,其中年度统计数据居多,且大部分年度统计数据在下年的四季度才能获取,实时性较差,面对当前经济社会的飞速发展,相对滞后的统计数据可能会带来一些误判。大数据手段可以实现实时获取数据并进行存储和分析,能够更为及时的反映现在的发展变化情况。
其中,a为政府提供公共服务的效率,将(10)式代入(11)式,居民公共服务的消费需求函数进一步可变为:
3 大数据时代科技统计面临的机遇和挑战分析
3.1 大数据时代科技统计面临的机遇
3.1.1 拓展数据来源
大数据在数据获取方面具有很大的优越性,可以采集各种数据,不受固定范围的限制,提供了大量真实、完整、及时的原始数据,这对传统科技统计是非常有益的补充,可作为数据源的第二轨。此外,在我们的统计工作中,也可以充分利用大数据的最新研究成果,丰富我们的统计产品,也是促使大数据服务于统计的一个重要途径。
以科研院所统计为例,科研院所的统计仅涉及纳入事业编制的科研机构,共300家左右。全球科技发展日新月异,北京也不例外,各种研发机构雨后春笋般出现,如外资研发机构、新型研发机构等,且越来越成为未来科研的重要力量,目前科研机构的年报调查只是其中的一部分,并不能完全反映科研机构的发展情况。如果运用技术手段进行科研机构数据搜集和数据挖掘工作,可以大量补充科研机构统计数据,提高数据的全面性。
3.1.2 促使技术升级
大数据分析技术的核心基础是统计学,但其数据量与传统统计的数据量是天壤之别,数据模型和分析技术也要复杂得多,“工欲善其事,必先利其器”,要更好的利用大数据为统计服务,必先提高数据挖掘分析能力的技术、工具和方法。
传统统计数据主要来源于统计报表,报表中的数据基本都是结构化数据,视频、音频、图片等非结构化数据非常少。
目前大数据处于快速发展时期,数据量呈指数式倍增,但是大数据发展时间较短,没有统一的数据标准,不同行业、不同企业的数据千差万别,如果仅是进行数据的采集、存储,得到的也仅是数据而已,并不会产生有用的信息,要对这些数据进行分析利用,必须将其标准化,而数据产生之后再进行标准化整合是非常困难的,因此统计部门必须制定和规范数据标准,引导大数据在统一的标准下产生,这样才能开展有效的整合利用,因此大数据将促进统计设计的标准化。
3.1.4 促进数据质量提升
大数据时代的数据记录、存储等工作都是通过物联网和互联网设备自动实现,与传统统计人工填报数据相比,降低了数据出错的概率,也可在一定程度上避免人为编造、篡改数据的行为。
1)传统统计分析方法。统计学作为一门系统的科学已有300余年的历史,其理论基础和社会实践应用非常深厚和广泛。从根本上讲,统计分析就是从数据中找到事物发展的规律,揭示事物特征和发展趋势。核心方法是量化分析,即必须通过定性或定量的数据分析得到结果。
3.2 大数据时代科技统计面临的挑战
3.2.1 统计生产方式面临变革
这是该影片快结束时,当英国反恐指挥部布罗姆尼的手下问他要不要杀了关玉明时,他所回应的一段话。我们注意到,这段话的结尾处用了一个词“dragon”,“dragon”在英文中是一个带有贬义色彩的词,象征着凶残;而它在汉语中的对应词“龙”在中国文化中是吉祥权威的象征,因此若把最后一句译为“将这只龙唤醒是毫无意义的”,中国观众则会认为这位英国官员对关玉明充满了褒奖,从而错误地理解源语作者真实的信息意图。我们看到,该影片的译者在译文中省略了这一文化信息,用“不要再节外生枝了”很好地传递了源语作者的信息意图,也使译文通俗易懂。
大数据的迅速发展已经对传统统计带来了很多影响,必将带来统计工作的变革。大数据是客观存在的,传统官方统计必须对其加以利用,否则官方统计的主体地位势必削弱。大数据应用到统计工作中,是贯穿整个统计生产过程,因此在统计工作中,统计制度、统计标准、数据采集、数据存储、数据处理、数据分析等各个环节都要根据大数据的发展情况作出相应的一整套调整升级,统计体系面临变革。
3.2.2 传统统计职能弱化
大数据未出现之前,传统官方统计是唯一权威、可靠的数据来源,从涉及国家经济社会形势的宏观数据,到关乎人民生活的微观数据,都是由传统官方统计统一出口。随着大数据的日益兴起,企业、个人、机构等各种行为信息都可以通过物联网和互联网进行采集,甚至很多数据是传统统计中不存在的,或者在实时性上远胜于传统统计,并且目前社会公众对一些企业发布的大数据统计结果相当认可,这在一定程度上弱化了传统官方统计的职能。
在环境检验实验室数据处理的相关研究中,以往研究多注重在检测结果的自动处理[10].构建检测数据处理系统,通过测试系统数据库模块、数据处理系统模块和综合评价系统模块,实现实验室检测环境数据的自动处理、汇总及分析评价系统,避免中间环节中数据人为记录、汇总的误差,提高了工作效率.高效、准确的环境检测数据对认清环境现状和相关部门的正确决策有重要意义.
3.2.3 数据处理能力面临挑战
大数据的数据量与传统统计的数据量天壤之别,数据模型和分析技术更为复杂、更为专业化,这对数据处理的软硬件及人员都提出了更高的要求。目前,传统统计在软件和硬件上都无法满足大数据分析的需求,统计工作人员的技能水平也存在较大差距,传统统计在数据处理能力方面面临着很大的挑战。
本文依据具体问题具体分析的原理,遵循问题产生发展的特定环境进行思考分析,结合高中《文化生活》课堂中出现的问题,紧密联系高中政治课教学,深入挖掘分析现有教学环境和条件下所出现的问题及其背后的原因,紧紧抓住教师和学校的作用,提出相应具体可行的措施,以期更好地落实政治学科核心素养并完善教学方法,从而能够在日后对高中阶段《文化生活》的教学产生积极影响。
(3)“氧化”时有中间产物Fe6(OH)1 2SO4生成,该物质中n[Fe(Ⅱ)]∶n[Fe(Ⅲ)]=____;该物质进一步被空气氧化成FeOOH的化学方程式为____。[注:Fe(Ⅱ)表示二价铁,Fe(Ⅲ)表示三价铁]
第一,在实际的口译过程中,译员根据自己对这种角色的理解而有可能采取不恰当的策略,过度行使了自由裁定权,越出了职权的范围。
3.2.4 数据质量更受关注
对着社会公众接受信息量的扩大,人们对数据的质量和细化程度需求也不断提升。大数据时代,传统官方统计不再是统计数据的唯一来源渠道,很多企业也会发布大数据分析结果,有些甚至比传统官方统计更为超前,例如根据淘宝交易数据测算的价格指数,在这样的情况下,传统官方统计的数据质量、权威性必然受到质疑和挑战。
参考文献
[1] 黄其松,刘强强.大数据与政府治理革命[J].行政论坛,2019(1):56-64
[2] 实施国家大数据战略加快建设数字中国[EB/OL].(2017-12-09)[2018-01-15].http://cpc.people.com.cn/n1/2017/1209/c64094-29696290.html.
[3] 马建堂.大数据在政府统计中的探索与应用[M].北京:中国统计出版社,2013.
[4] 马建堂.大数据政府统计的新机遇[M].北京:中国统计出版社,2015.
[5] 赵彦云.对大数据统计设计的思考[J].统计研究,2015,32(6):3-10.
[6] 陈宇秋.小议大数据与统计新思维[J].财经界:学术版,2016(2):288-289.
SWOT Analysis of Traditional Statistics in the Background of Big Data
PANG Li-yan
(Beijing Research Center for Science of Science,Beijing 100089,China)
Abstract :The rapid development of big data has a tremendous impact on the traditional statistics.This paper makes a comparative analysis of the characteristics of traditional statistics and big data,summarizes the differences and internal links between them,and on this basis carries out SWOT analysis of traditional statistics under the background of big data,and analyses the advantages and disadvantages of traditional statistics in the era of big data,as well as the opportunities and challenges faced by traditional statistics.According to the background,traditional statistics has the advantages of stable data sources and unified data standards,and has the disadvantages of relatively narrow scope and single data sources.In this context,traditional statistics is faced with the challenges of expanding data sources and promoting quality improvement,as well as the transformation of statistical production mode and weakening of statistical functions.
Key words :big data;traditional statistics;SWOT
中图分类号: G301
文献标志码: A
文章编号: 1671- 1807( 2019) 05- 0095- 05
收稿日期: 2019-02-19
作者简介: 庞立艳(1983—),女(满族),河北秦皇岛人,北京科学学研究中心,助理研究员,硕士,研究方向:科技统计。
标签:大数据论文; 传统统计论文; SWOT论文; 北京科学学研究中心论文;