浅谈大数据对经济学发展的影响
王荣洁
(北京交通大学,北京 100044)
摘要: 随着互联网大数据的不断发展和完善,经济领域的研究方法以及研究途径在不断的扩宽,一些待解决的实验定理,在近些年通过网络大数据面向大众的不断开放中都有了不小的进展。本文从互联网大数据的基本概念和特点出发,分析了其与经济学结合的成果,并借此体现互联网大数据的时代意义和理论作用。
关键词: 大数据;大数据经济学
一、引言
21世纪各国的科技力量之争促使计算机网络飞快发展,如今的互联网已经渗透进每一户人家,不论是使用车辆GPS导航,还是智能家居每一次被唤醒,这些记录都会被一次不差的存储到虚拟的互联网空间中。这些庞杂的数据被广泛的应用到医学、生物、军事等各个领域中,经济学如是。日前发展起来的共享经济就是依托互联网大数据,判断用户行为进而不断适应时代发展而兴盛起来的,这些新兴企业的做法不得不说,已经将传统经济学所能研究的范围扩大到更具有实时性特点的领域。另一方面,伴随着计算数学,计量经济学等学科和技术的不断发展,处理大数据的能力稳步向前,由此而生的大数据经济学逐渐成为了经济学一大分支。越来越多的企业希望能通过大数据经济学的理论进行决策[1]。
二、大数据的概念和特点
在“数据时代”,我们无时无刻都在处理从四面八方获得的信息。从一瓶水的价格到全球金融资金的动向,这一切都可以称之为“数据”,那么所谓的“大数据”与我们平日中接触的“普通数据”有何区别,我们可以从以下四点进行把握:一是数据总量极大,至少是PB级及以上;二是数据接收的速度非常快;三是数据种类多;四是数据真实性强。
数据量大通常指的是容量多到难以简单处理,即不可能用一般的方法(例如使用Excel数据分析)简单分析数据,处理大数据的方法首先需要去噪,其次分类,将高维数据降维。以处理股票信息为例,在获得挂单数据后,常常需要在做模型拟合数据前,需要先去除开盘与收盘附近的信息,因为这两个时刻非常特殊,不符合一般股票交易行为特点,其次设定最短时间间隔,在一个时间间隔内合计数据,最终使用处理完成的低维信息进行参数估计与预测。
没有就算了。村长适时接过话头。八斗丘补偿问题,村委过些天会研究,你不要到处找人说事。特别是不要找那样专门戳漏洞的什么狗屁记者。
本次分析所比较的是《北语词表》和经ictclas分词所生成的《鲁迅小说》词表中的双音节以上的词,未包括单音节词。原因是《北语词表》对单音节词的频数标记统一为“0”,无法取得定量数值,只能舍弃。《鲁迅小说》词表中单音节词为2297个;《北语词表》中单音节词为2628个。双音节及以上的词数与比例,见表1。
最后,大数据往往很难伪造,换句话说,大数据虽然繁杂无章,但其真实性远远大于“简单数据”,即使获取的一组数据中存在部分可疑信息,但就占比而言很难影响大局结果,甚至在去噪声的步骤中就已经被去除。
传统经济学的第一大特征在于假设检验。为了得到模型,甚至一个确切的函数表达式(如IS模型),需要制定一系列的假设才可以使得模型是合理的。也正是因为现实的多样性,复杂性和时代转移性,传统经济学模型需要不断增加假设以满足较为理想化的情形,并且根据时代变更不断改变。例如传统的CIR仅能描述假设为连续的债券利率变化,而随着研究的深入人们发现,债券利率会因为突然的政策、市场动荡等原因发生突增或突减,即假设是不合理的,因此近些年来CIR模型中被加入了Poisson跳跃项。那么,随着研究进一步深入,更多可能的信息将会被发现,相对的,传统模型中的假设也将会进一步被质疑,也就是说传统模型的假设是其与现实经济最大的障碍。
建议:碰到了不顺心的事情会生气,若是强忍着又非常难受,这时可以试试按内关穴。腕横纹上2寸就是内关穴。用一只手的拇指用力掐住另一只手的内关穴,可以帮助心情很快平静下来,也不会那么易怒。
接受速度快指的是数据的实时性。大数据另一大特点在于是实时数据,这也是大数据经济学与传统经济学的最大区别。大数据是通过互联网统计并传输的海量信息,以极端的间隔不断向主控平台发布数据。而这也就要求分析数据需要非常快的速度以匹配传输,这样才能更好地发挥大数据的实时性。近年来计算数学等领域的发展总目标仍是探究在不牺牲太大精准度的条件下寻找收敛更快的算法。
三、大数据在经济学中的具体应用
现如今越来越多的企业希望能够与“互联网大数据”产生交集,其应用范围也越来越广泛,其中股票交易以及共享事业是“大数据”应用较为成熟的两大经济领域。
1.大数据与股票交易
传统经济学指的是诞生于大数据处理时代之前,是通过假设,因果分析得到的接近客观事实的经济学模型。
为解决电加热启停带来的温湿度惯性,SCR电加热初始以30%的热量输出。当室内环境制热量需求变化时,根据PID控制算法,SCR可控硅电加热无级调节输出精确的加热量。
认为频数能够收敛到概率的理论可以被视为大数据应用的雏形。伴随着各种金融衍生品的诞生,这一思想被普遍运用,在股票市场上,理论学家总结了许多模型,例如CIR模型和IS模型等来表达股票的运动轨迹,但究其本质是股票的运动位置概率,而所谓的参数拟合便是运用大量数据求得可能性最大的股票运动函数。
以IS模型为例,该模型是用以描述资产清算问题的基本模型,其表达式为[2]:
其中S (t )是t 时刻股票价格,μ 是股票漂移率,σ 是波动率,W t 是标准布朗运动,v (·)是清算速度,λ 是永久冲击系数,η 是瞬时冲击系数。所谓资产清算就是某个拥有大量头村的机构希望能够在短时间内将所有股票全部抛出的问题,这一行为绝不能简单一次性交易,因为大量挂单会引起股票价格大跌,而使得此次交易产生很大的损失。因此预估市场对于大量资产被清算的反馈是非常重要的,虽然IS模型可以用以描述这一市场波动,但重点是模型的参数值,也就是漂移率,波动率,永久冲击系数以及瞬时冲击系数,而这些系数的估计,必须依靠高频交易数据才能得到比较可信的拟合值。换句话而言,如果没有大数据的支持,即使有理论模型作为依据,仍然无法对股票作出任何的预测,可见大数据的重要性。
具体的大数据在股票方面的应用与处理方法,近年来有诸多文章可以参考[3-6],其中神经网络等非理论模型类方法相比包括IS在内的理论模型更加依赖数据的稠密度,而就结果而言,也是更快更准确。
2.大数据与共享经济
共享经济的核心目标是闲置资源再配置,而闲置资源有哪些,资源需求在何处,则是数据收集的问题。当共享经济推向社会供应,那么上述的数据就成为了大数据。更具体来说,共享经济对大数据的结合表现在:利用需求方数据整合资源;通过数据定制要求;根据数据实时监控与管理。
(1)利用需求方数据整合资源。正如前文所述,拥有大数据信息的供应方可以得知何处需要资源量大,何处需求小,则可以通过该信息合理分配产品。实际上更多的数据意味着更加准确的需求估计,因此首先大数据助力共享事业实现更精准配置,使得“共享”目标更契合。
(2) 基坑与斜拱桩基承台边缘净距L对基坑围护桩变形的影响规律为: 随着边缘净距逐渐增大,基坑围护桩的水平位移逐渐减小且趋于稳定,当边缘净距达到25 m(此时L/H=1.25)时,即边缘净距超过一倍基坑开挖深度时,大水平推力斜拱桩基对基坑围护桩的变形影响比较小; 随着边缘净距逐渐增大,围护桩水平位移最大值出现的位置深度hL逐渐增大,斜拱桩基产生的水平推力对基坑围护桩水平位移的影响深度也逐渐减小,当边缘净距达到25 m时,影响深度基本为0。
在大数据加入经济学方法后,的的确确对传统经济学造成了突破性的影响。需要经济学家通过经验总结关系的原因追本溯源还是因为数据的缺乏,数据量不够,导致变量之间的函数关系难以清晰刻画。随着数据搜集技术的提升,传统经济学将受到不小的冲击[8]。
(3)根据数据实时监控与管理。仍考虑摩拜单车,众所周知摩拜单车拥有检测单车是否停放在指定区域以及鼓励用户帮助收集偏远车辆的红包车制度,而这些的来源就是对每一辆车的定位数据获取与处理。中控平台需要实时监控每辆单车所处位置,并判断是否处于指定区域,或是否位于偏远位置。然而,如何确定适当的制定停靠区域以及偏远位置,则不是靠人工指出就可以简单完成的(并不能简单地认为人流量大的位置就是合适的停靠区域)。更确切地来说,很难简单的就判断一个区域骑车人流的多少,因此对这些特殊区域的判断需要对历史骑行数据进行分析,寻找解锁聚集点,并与该处地形,交通等特点信息进行比对,根据事先设定的某些鉴别函数才能获得较为合理的结论。
四、大数据对传统经济学的影响
1.传统经济学的概念及特点
预测交易是人们从上世纪就开始深入研究的课题,事实上在最初,应用数据进行预测是为了更好的赌博。在概率还没有确定概念时,人们就已经意识到可以使用大量实验得到的数据描述“可能性”,也就是著名的Bernoulli实验。
大数据的获取快就意味着很难再获取时有人进行鉴别,而仅依靠计算机筛选数据显然是无法遍历所有特殊情形的,因此收集的数据往往带有多种影响因子。大数据分析的一大课题就是如何通过各种可行的算法对数据进行分类,剥离无关变量导致的数据波动。
这些钱可以公积金中心作为业主的住房公积金,用于小区公共设施的维修与保养,及到光伏设备寿命后期的更新,或者也可让业主减少支付一部分物业费。
2.具体影响
(2)通过数据定制要求[7]。此外共享事业也可以根据数据对共享产品进行改善与分类,根据大数据中挖掘出的不同地区的不同需求种类,改变共享产品特点,例如不同种类的摩拜单车,就是对不同人群集中地分别加大投放健身型或可调节座椅型等不同类型的单车。
第一,研究对象及方法发生改变。上文提到,假设是传统经济学的主要方法,包括作为前提的理想化假设以及波普尔伪证主义路线的假设检验,前者产生的原因是数据收集对象,也就是研究对象范围小,后者是在数据量少的情形下使用概率方法得到结论置信度的方法,因此假设存在的本质就是数据缺乏。大数据的引入很好地解决了这一问题,研究对象局限性不再作为很大的阻碍,研究结果也可以把重点从假设检验偏离,转为直接从数据中得到关系,免去需要人工提出的假设前提。如此,会大大降低研究的主观性,增加准确性,而数据中丰富的信息也将使得结论更加全面。
第二,因果为前提实证的思路受到冲击。为了更好的摆脱主观影响,大数据会引导经济学从数据分析中寻求相关性,不再追求难以验证的因果性。经济学不再需要先提出一个合理的关系再做验证,而是转变为分析数据结果得到关系后作出经济学解释,这二者的区别在于后者能比前者挖掘出更多隐藏的信息,而前者更是包含于后者中。
总而言之,大数据时代将为经济学带来不小的改变,为经济学家提供了寻找更复杂更潜在关系的工具,大数据经济学也就此诞生。
五、大数据经济学
1.大数据经济学的概念和特点
大数据经济学指的是使用互联网大数据,解决普通经济学无法攻克的问题,并指导经济学家进行决策的的新方法。大数据经济学与传统经济学存在着互补关系,大数据经济学使得传统经济学的研究效率大幅提升,而传统经济学本身也是大数据经济学的发展航标。
另一方面,传统经济学的表达式总是产生于经济学家对现实的因果分析。在IS模型中,股价的影响因素被认为有时间,大量抛售或买入的市场冲击以及随机的波动,由此诞生了该模型的表达式(1.1),而其他的经济学模型,包括上文提到的CIR模型等同样也是因果模型的代表。因果模型的一大优势是模型往往是可信的,并且所需数据常做实证用,因此数学据需求量少。金融数学中一个重要分支就是探究事物之间的因果,从而发掘新的关系。即使如此,能够由人们肉眼直接看到或想到的总不是所有的关系,正如蝴蝶效应,会有多少人认为一场飓风与一只蝴蝶有很强的因果关系。换言之,存在大量无法轻易识别出的因果关系,而这些关系,也真是竞争者无法轻易捕捉的,在信息时代,企业若希望能够在市场上略胜一筹,必须有能力获得其他对手不拥有的信息,即运用信息差击败对手。这是传统经济学无法提供的战略。
大数据经济学的研究对象是总体而非局部。在拥有了先进的信息获取技术和处理能力后,经济学的分析不再局限于某一具体部分专事专办,而是可以一次性从海量数据中提取相关性,如此一来,分析效率得到了大幅提升,甚至有机会发掘各个部类间的相互作用关系。更具体地,研究不局限于抽样样本,省去了随机抽样的环节(事实上很难做到完全随机,因此随机抽样本身就很难完成),直接从总体入手,分析结果更加客观可信。
大数据经济学不需要假设检验。这一点正是前文所提到的,大数据对传统经济学的冲击。假设总是过于理性的,难以验证的,具有极大的局限性的,从而假设检验对于传统经济学而言常常使得研究非常尴尬[8],研究重心难以掌握,因此大数据经济学在这一方面又是一项很大的突破。
大数据经济学改变了经济学建模的样式。传统经济学建模核心在于参数估计和拟合度检验,但前提是存在可表达的函数,也就是需要经济学家事先给定因果关系。与此完全相反地,大数据经济学一切来源于数据,通过数据分析找寻最可能的表达式,并由经济学家解释从数据中提炼的结果,更有甚者,例如神经网络,完全将关系表达式化作黑匣子,只关心输出结果,这对于原本关系非常复杂的变量得到了刻画的可能性。建模的主要问题从关注提出的模型是否符合”现实,转变到了从现实中提取模型,即将由主观描述客观,转为直接由客观反映客观,这是经济学思维上的巨大变革。
2.大数据经济学与其他领域的联系
大数据经济学是传统经济学发展的必然产物[9]。大数据经济学诞生于传统经济学对于研究结论普适性和时效性的需求,在飞速发展的时代,任何一个结论都将被快速替代,经济学需要当下现实所提炼出的最新结果,并快速投入使用。然而大数据经济学尚未成熟,仍需要传统经济学的引领。
(2)将T-Map中点的坐标转化为规范重心坐标,可使T-Map的空间位置关系更加直观,偏差波动计算更加简单;T-Map降维为飞机装配协调准确度判定提供了直接依据。
大数据经济学与互联网技术相互促进。互联网信息技术的革新不断推动这大数据经济学的研究能力,是将大数据经济学迈向时代尖端理论的动力源泉;另一方面,大数据经济学在研究过程中需求的一切信息处理技术都对互联网科技起着反向推动力,促进信息技术再发展。
大数据经济学方法同样适用于其他学科领域。不论是生物,医药,心理学等学科都可以引入大数据方法,与经济学类似,大数据的加入都将对这些学科的研究带来颠覆性的改变。大数据经济学的崛起预示着互联网信息与一大学科的完美融合,这必将推动大数据与其他重要学科领域的结合。
支付方式:蒙牛此次收购属于出资购买股票式收购,交易金额为124亿港元,约为人民币98亿元。在本次收购中,雅士利的股东可以以手中的每股股票获得现金支付,或者可选择部分现金加上部分蒙牛国际的股票。
六、结束语
互联网的发展给经济学带来了很大的冲击,促使了大数据经济学这一学科分支的诞生。虽然大数据经济学刚刚起步,但其实时性,客观性,总体性等特点使之得以迅速发展。借助传统经济学深厚的理论基础做引领,大数据经济学前景广阔,对经济学乃至社会发展起着至关重要的作用。互联网大数据在经济学中的完美应用,也将作为促进最新科技与传统学科结合的旗帜,使得各领域发展进入崭新篇章。
PHPAnalysis(PHP 分词系统)是一种基于字符串的反向匹配分词方法,采用类似哈希的数据结构存储词库。改进后增加了正向、双向和最短路径的扫描策略。
参考文献:
[1]杨绘兰,姚瑶,唐铭,刘建海.浅谈大数据对经济学的影响[J].环渤海经济瞭望,2018,(05):36~36.
[2]罗启轩,李汉东.一种改进的动态IS算法交易策略[J].北京师范大学学报(自然科学版),2017,53(03):288~293.
[3]杨凯,马育欣,张欣然,陈雪妮,田源,王晓红.基于ARCH(q)模型的高频股票交易数据分析[J].吉林师范大学学报(自然科学版),2019,40(02):68~72.
[4]焦君萍.基于沪港通A+H股的高频统计套利实证研究[D].南京大学,2018.
[5]Almgren,Robert F.Optimal execution with nonlinear impact functions and trading-enhanced risk[J].Applied Mathematical Finance,2003,10(1):1~18.
[6]Bertsimas D,Lo A W.Optimal control of execution costs[J].Journal of Financial Markets,1998,1(1):1~50.
[7]靳嘉铭.浅析大数据对经济学的影响[J].中国管理信息化,2018,21(22):121~122.
[8]俞立平.大数据与大数据经济学[J].中国软科学,2013,(7):177~183.
[9]吕波涛.大数据与大数据经济学[J].全国流通经济,2018,(11):63~64.
[10]张笑雨.试论大数据与大数据经济学[J].现代经济信息,2018,(19):349~349.
[11]Porat M U.The Information Economy[M].Washington,DC,Government Printing Office,1977.
中图分类号: F49
文献识别码: A
文章编号: 2096-3157(2019)20-0142-03
作者简介:
王荣洁,北京交通大学学生;研究方向:产业经济学;劳动经济学。