行为大数据与计算实验,本文主要内容关键词为:数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在人类行为日趋多元化与经济社会发展日益复杂的交互演进过程中,大数据技术的出现、互联网+时代的到来等极大地改变了人们的生存方式和自我认知,由此形成了对传统观念与理论认知方式的强烈冲击和挑战。这将对经济研究乃至人文社会科学的发展及未来走向产生何种影响?从行为本源、历史演进和内在逻辑相结合的视角探讨分析与此相关的问题,将得出更加清晰的科学回答。 一、行为大数据与经济理论的创新发展 用大数据技术聚焦人类行为分析,将使复杂的人类行为变得可被量化、洞悉和预知,既能丰富大数据的含义,又有助于彰显经济研究的人本特性,并促进经济理论及相关学科研究的理论创新。 1.行为大数据彰显经济研究的人本特性。 人类社会发展的本质特征和决定性因素是个性化的人的全面发展,微观主体的价值取向多元化和行为方式多样化是文明进程的必然趋势。当今网络社会中的人类行为特点较之于相对独立的决策个体发生了显著变化,传统经济理论体系中的单一行为假设相对于现实的滞后程度日益加深。人类行为既不遵循固定程式,也不是随机发生的,而是内生驱动和随条件演变的,具有在一定条件下分化、聚集、超过临界点后突然爆发或涌现的特点。通过全面分析和计算人类行为痕迹留下来的大量数据,原本难以捉摸的人类行为和复杂经济现象将变得可以被量化、解析和洞见,甚至能被高精度地预知和把控。近年来蓬勃兴起的基于微观主体的计算经济学/金融(Agent-based Computational Economics/Finance,ACE/F)以及计算社会科学(Boero,2015;Claudio,2014),就是通过捕捉、获取和处理有关人类行为与经济运行的大规模数据,以获得对更为复杂经济现象的更深刻和更确切的理解。 现如今人类行为的价值多元化、方式多样化、结构过程易变和网络多连通性等特性,使得人们与外界和他人的互动频繁且程度加深,相应的观察体验、判断决策、结果反馈等认知分析过程的链条延长,其行为模式、传导机理、影响效果不断改变且更为繁杂,需要更好地记录和反映。我们把能够全面、层次化、精细和动态地刻画描述不同类型主体的行为和社会经济运行及现象的数据称为行为大数据,它具有多种获取方式和来源渠道(多源)、多样化的存在形式和表现形态(多态)、能够反映不同类型主体行为的差别性(异质)和不同的结构关联关系(异构)等特性。此处的定义不同于大数据的3V(Volume,Variety,Velocity)或4V(3V+Value)等侧重存在形态和一般属性的定义方法,而是更侧重于数据生成和本质属性,二者之间类似于内涵式与外延式定义方法的区别①。 以人的行为为基点,探讨深化经济研究与大数据及类似概念之间的内在关联,具有历史使然的规律性(Attewell and Monaghan,2014)。大数据概念及相关技术的出现,是人类社会发展和科技进步的必然,具有鲜明的时代特征,其有效运用于经济学乃至人文社会科学研究的重要基础和主要功用是观察行为表现、记录行为痕迹、展现行为过程和汇集行为结果的行为大数据。大数据为分析人类行为开辟了新的通途,有助于深度挖掘经济学的本质含义、促使其回归本源,并促使相关分支学科的分化、重构和整合,使经济研究进入一个崭新的时代(沈浩、黄晓兰,2013;俞立平,2013)。 经济研究不再只是将人的行为高度简化,在单一、恒定的极端理想化假设下直接借用自然科学的抽象建模、分析推理等方法,而是更加鲜活、生动、更接地气地处理人类行为数据,分析人类真实行为的关键特征,聚焦主体行为在不同类型转折点的临界骤变、权衡准则和方法、备选方案的替代比等,这更加符合人与自然交互中受外部环境条件变化约束的人类社会发展的历史规律和以人为本、以行为为主导的人文逻辑。 通过构建、填充和变换如表1所示的主体行为属性表,将传统的解析优化、建模分析、随机理论和计量实证等规范的统计数据处理方法,扩展到对超长历史和巨量异质性个体的同类数据的归并、叠合和加总,类似于集合运算,借助行为分类器的数据挖掘技术、广义矩阵变换、拟贝叶斯推理和决策判断等方法来处理并非纯数值化的多源多态行为数据集合,以获取全方位、精细翔实的行为痕迹数据记录和科学及时的数据处理,由此实现精准营销、决策模拟和个性化推送等应用。如此处理行为大数据,也必然要用到云计算、高性能计算和终端设备之间的互联互通等技术。 2.人类基本经济行为的拓展与深化。 传统经济研究通过一系列假设将人类行为严格地置于理性黑箱之中,能否打开黑箱探讨主体的多元行为属性,是行为大数据成功应用与否的决定性因素。经济学日益注重个性化分析的走势,符合人类社会发展规律和历史逻辑(王国成,2015)。传统理论在高度简化和理想化情景下对代表性主体行为的抽象和描述,无疑是选择了可行的切入点和构建了便利的参照系,而且随着经济实践的发展变化,不断对基本行为假设进行放宽、修正和完善。从表2中可以看出对人类行为分析不断深化的阶段性特征和内在逻辑。 借助公式化语言,我们可将传统假设下的基本行为模型拓展为如下所示的多主体互动决策模型: 其中,(S—1)式是总量或相互关系约束,(S—2)式是个量约束,n个行为主体都是在个人预算和外部环境的双重约束条件下进行效用最大化决策,每一个主体都面临两个约束条件中约束性较强的一个,或者同时满足(S—1)式和(S—2)式;(S—3)表示任意两个或更多主体与总体特征之间具有某种关联或某种约束(总量、信息分布、文化精神等软约束),表示对个量的一种广义求和(加总方式/生成传导机理)。个性化参数承载了理论模型与经济现实的衔接,可由实验测定和行为大数据估算得到,这样的模型结构更好地反映了异质行为模式和多主体策略行为的相互影响。在主体的异质性和交互性可忽略不计时,该模型退化为经典的个体决策行为模型,即: 其中为m种商品的组合。如此既能够弥补传统数据处理方法的逻辑缺陷,也能在很大程度上释缓大数据技术的应用局限性,在充分体现人文特性的同时又不失科学性和便利实效性。虽然此处只是对微观主体基本决策行为描述上的拓展,但却有可能引起对经济理论研究根本性、全方位的改造与提升,也是理论模型与行为大数据接轨的数理形式。按此方法处理经济金融及管理实践中各种复杂和异象情景下的决策,将使理论有更宽厚的基础、更接近真实的起点和更具人文特色的严整逻辑。特别是,如此基于中国现实社会环境中各类主体的真实行为特性及相应数据发展建立起来的经济理论,自然就有中国特色,自然就会有本质性创新。 二、基于行为大数据的计算实验 社会经济活动不是主宰者的实验产物,但人类却可以通过实验获得更好的自我认知。 1.人类主体与计算机虚拟主体结合(HS+CA)的行为实验。 实验是科学发现的源泉,但由于主观意识支配下人类行为表现的不确定性,社会科学研究在认知和接受实验方法过程中经历了长期的徘徊。经济实验方法的核心价值是行为发现。人类行为实验与物理、化学等自然科学实验显著不同,即使在完全相同的可控实验条件和情景下,重复验证都未必能获得与既往实验一致的行为结果。由此表现出的“随意”性,切实反映出人类在特定情景下各种可能存在和发生的行为响应,并使人类行为的多元化属性、条件依赖性等易变性的本质特征得以证实。行为实验的首要目的是发现,通过精细观察和深入分析,再辅以多主体、多属性、多情景仿真等方法,总结和提炼出比传统假设更真实合理的人类行为特点与规律。而多次重复和更加丰富更加接近真实情景的大规模实验,就要利用大数据和科研信息化(e-Science)通过计算机技术来虚拟实现。 自然科学实验中的研究对象具有相对稳定明确的属性及发生反应的条件和规律,经济研究中的实验主要针对人的行为,其属性不像物质基元的属性那样稳定明确,因而需要将人类主体(HS:Human Subject)参与的实验和计算机虚拟主体(CA:Computational Agent)的实验相结合,用HS实验获得个性化的关于人类真实行为的关键特征数据,为一般化的足量的CA实验赋值,这是基于主体行为的计算实验经济研究的重要基础。HS实验主要用于测定个体的真实行为属性、响应模式、与环境和他人行为互动的差异性及分布等,能够原汁原味地获取特定场景和需求目的下的行为数据,进而进行分类处理(建立对应关系表)、结果分析和移植应用;然后借助CA实验对现实中各种可能存在的情景和可能发生的事件进行多主体、多属性的大规模仿真,再将严谨的科学逻辑与容错的人文逻辑相结合进行综合推理判断,这就是社会科学计算实验。 经济实验的立足点、优势和价值都体现在对行为的深化分析上,无论是实验室受控实验(lab-experiment)、实地实验(field-experiment)还是在线实验(online-experiment)等,之所以强调HS实验与CA实验的结合,是由于人类行为的特性。对人类行为的测度、建模和模拟无法像物的属性那样可精确量化,数值计算或逼近等模拟方法是将行为定量的基本实现形式,是真正的定性与定量的有机结合。通过具有典型代表性的HS实验获取差异化的个性部分,再用大规模CA实验刻画和检验共性部分,两者结合才能完整深入地分析人类行为,由此揭示各类宏观现象的微观成因、内在机理和传导过程,以及微观主体如何对外部环境条件的变化做出行为响应。结合HS与CA的实验技术,可根据人类真实行为关键特征提出和检验其符合何种假设,并由此决定使用何种模型和分析方法,如此才能使研究结论具有更强的解释力和预见性。 在这里,实验的效度问题是不可回避的,同时也是比较棘手的,人文社会科学实验研究的最大争议之一就在于此。关于自然界的实验其效度是可控一致的,因为实验对象的基本物理化学性质在实验室内外是不会改变的;而关于人类行为的人文实验则不同,实验环境、激励强度(或赌资效应)、相关利益方的行为特点等在实验室内外的可控程度是不同的,而且实验室内外的行为表现差异有时是很显著的,尤其是探讨个体与群体行为关系的实验分析,仅靠抽象假设和演绎推理等方法是无法进行的。但并不能由此认定行为实验效果的不稳定性及不可测性,这反而说明了认知行为固有属性的条件依赖性,正是行为实验才使得这类问题暴露得更清楚,由此得到的解决方案也更具针对性,也才能对复杂现实问题有更强的说服力(王国成,2015)。 图1 基于主体行为的一体化建模流程图 2.通宏洞微、一体化建模与计算实验平台。 通宏洞微②,强调以微观主体的行为分析为主线,不仅要基于经验数据建立因素(变量)之间的关系,更重要的是围绕主体行为探寻成因、认知机理,进而循序渐进、开辟通途。基于CA的虚拟实验技术,综合利用计算科学多方面优势,能够突破HS实验中的规模障碍(样本数、选择性偏差、激励强度、场景限定等),平行“再现”从微观到宏观的传导机理、结构演变过程和联动及涌现;用CA实验和人工社会仿真或替代真实行为及社会运行,不仅在随机动态调整和校准、虚拟场景验证、人与情景互动等方面能实现自然衔接,操作上更灵活、便利、可控,而且还可以通过可视化促发人的联想,并丰富相关理论和推动实践。由HS实验到CA实验,从微观到宏观,把相关的做法和过程环节连接起来,构建起一体化模型可作为计算实验平台。一体化建模的基本环节、逻辑关系和建模流程如图1所示。 这里用计算实验方法研究经济学,从理论上讲具有内化生成、经得住检验的特点;从技术路线上看是自下而上(bottom-up)与自上而下(top-down)的结合,通过大数据和线上线下(O2O)行为来实现HS+CA;而且还能够实现自然科学与社会科学的跨学科交叉、科学与人文的融合、人—机(现实与虚拟)的一体化、认知全程的各环节以及多层次贯通等多重含义上的一体化(王国成,2015)。 三、从行为视角揭示经济决策的复杂奥秘 (行为)大数据时代的到来,为破解思维密码、揭秘复杂决策创造了新的契机,也为研究我国的经济新常态提供了更加有力的分析工具。 1.行为大数据与复杂决策。 个体偏好的差异性是天生的,复杂的社会经济情景及后天环境使不同微观主体在各自行为转折的临界变化点(邻域中)的学习适应性和敏感性、对外界条件(他人行为)变化的响应模式和强度、在备选方案和策略的替代比等方面会产生扭曲,掩盖或放大这些差异性,导致在异型结构的网络上扩散和传导的结果差异性更甚和更为复杂。人类与自然界交互过程中决策复杂性的内在奥秘和主要原因就在于决策主体在主观与客观、愿望与能力上的行为不对称和不匹配。从学术上讲,所谓复杂性是由人格物化、用单一假设来解释多彩现实导致的,这是一种个性化的、内生的信息不对称,在备选替代、临界选择等抉择关键点上的个体行为不对称尤为明显。深化异质行为分析、通宏洞微地构建微观宏观一体化模型作为计算实验平台,分析模拟各种可能出现的现实场景和行为根源上的诱发因素及传导机理,最后概然推断微观行为与宏观现象的内在关联,是破解人类复杂决策之谜的可行途径。 复杂决策推理中,不仅要用到严谨、精确、唯一、稳态的演绎逻辑,还要考虑适当引入符合社会历史和行为演变的,具有模糊、容错、多元和可变属性的人文逻辑,如广义矩阵变换运算、拟贝叶斯决策准则和校准以及情景模拟等。这是由人类社会活动的本质决定的,也是在大数据和e-Science的助推下最有可能体现人文社会科学特色并实现创新发展的。通过合理地考虑和融入心理(主观)因素,彰显人文特色的行为大数据使数据、图表和模型等变得鲜活生动、富有灵魂。借助于数据挖掘中类似于两分法的行为分类器等技术,将真实行为的关键对应条件组构成一个关键行为特征截面或剖面(参见表3),对真实全面的行为数据进行分类,在深入、细致、独到的个性化行为分析的基础上,把现实中可能出现的各种情景抽象和转化成一系列影响不同类型(异质交互)微观主体行为和决策的条件组。通过严谨的演绎逻辑与容错、模糊的人文和社会历史逻辑的结合,大数据能够推动精准决策,更好地预见和把控群体行动中的突变等结果涌现,做好相对大范围甚至是全社会的风险与危机管理工作。 现实世界中微观与宏观的联系无疑是错综复杂的(参见图2),而从大脑思维对现实的反映来看,人类决策与大数据有着天然的密切联系:大脑无疑是在处理(行为)大数据,相应的决策过程本身就是大数据工程,而研究揭示决策之谜必然也要使用大数据,以更加客观、深邃地描绘和理解人类社会发展与文明进步。 图2 人类社会微观行为与宏观现象内在关联示意图 2.对研究方法的促进和创新。 基于行为大数据的计算实验方法,是对传统经济理论研究方法的全方位发展与创新,后者可看作前者在特定条件下的特例。这类直观实验和理论思辨互补的研究方法,既能不失严谨地放松经典假设,明确重点,突出人本特色,又能动态地校准经济理论发展方向。这种方法自然地将科学与人文、行为模型与心智模型联系起来,有望打开行为黑箱,让微观主体(agent)活起来,通过人的真实行为的综合作用,在很大程度上减少传统建模实证过程中来自共线性、互为因果、自相关、伪相关、变量不可分离等方面的困扰。计算实验方法与ACE/F方法相结合,能够极大地缓解行为与实验经济学中的样本选择性偏差、实验规模和效度等方面的局限性,拓展ACE/F的应用范围和适应性。而大数据也只有与深化行为分析和计算实验相结合,才能在经济学乃至社会科学研究中真正发挥其特有优势和独特价值,使相应的研究更接地气、更具针对性、更加有效,从而也能更好地在人文社会科学研究中体现思想自主与学术自主。 传统的研究方法侧重研究事物和现象间的因果关系或相关关系,而基于行为大数据的计算实验方法更加注重情(景)—行(为)—(结)果关系分析,探索各种复杂现象、结果和决策是在什么情景下由哪类主体的何种行为导致的,基于这一内在逻辑关系,能将原来的趋势外推预测推进到基于机理的内在生成式预测,这无疑将大大提升理论的预测能力。 3.应用案例。 在近年来的若干应用实践中,我们尝试性地应用行为实验和一体化建模等方法,通宏洞微地进行复杂决策和经济金融的计算实验研究,并在与传统方法的对比中展现其对原有方法的全包容和促进、补充与拓展③,主要包括以下几个方面: 第一,收入差距演变。通过引入对收入满意度和公平感等异质性个体的主观感受或心理因素,探讨在不同的发展阶段、制度体制和文化传统等背景下,相同或相近的基尼系数对社会经济和人们主观感受的不同影响,据此制定和实施更具针对性的收入分配调节政策,让更多的人分享改革红利。 第二,投资行为与股市异象。资本市场波诡云谲,偏峰厚尾、波动集聚、暴涨暴跌等典型化事实和市场异象丛生,供求、信息、制度和规则以及外生冲击等无疑是重要的影响因素,但这些都要通过投资者的行为发生综合作用。我们深入细致地分析投资者真实行为的一些关键特征,如个体的冲动行为、情绪因子、羊群行为和不同主体对政策信息响应的不对称等有限理性或“非”理性行为,试图更合理地解释和预见股市诸多异象的微观成因、影响方式、演变路径及走势等,寻求微观行为与宏观现象交互反馈的内在联动和传导机理。 第三,宏观调控的微观基础。传统经济政策制定的理论依据是针对同质的理性主体而言的,而现实中宏观调控政策能否收到预期效果,不仅取决于市场基本运行状况和相关数据,更重要的决定性因素是微观主体行为的本质特点及响应方式。从微观经济学与宏观经济学人为地相对分离到为宏观理论寻求选择性微观基础,由理性预期演变到宏观政策的适应性微观基础,再到宏观与微观的相向匹配和交互适应,面对日趋复杂的现实经济,行为实验和一体化建模为实践中由预调、微调的审慎调控到定向精准调控与区间调控奠定了更加坚实的理论基础。 此外,我们正从事的一些相关应用包括:更加注重以人为本和双向选择的人力资源管理创新(HRM2.0),以实现个性化和稳定的人职匹配,由此可显著提升企业绩效;运用异质性机制设计和实验分析线上与线下行为的联系与差别,在网络拍卖活动中更加精准地设计优惠率和拍卖词,引导广告商等用户进行行为优化,进而提升互联网公司业绩。这些复杂决策具有多主体、多属性、多目标、多因素、多状态、多情景、多阶段、多路径、多层次、多解性等特点。这些应用的共同点表现为:从微观主体的行为分析切入,注重个性化、异质性与交互性,重点研究行为临界点(区域)的属性和传导机理及其复杂易变性(临界状态下行为对结果的影响程度是一般常态下的数倍,甚至是数十倍,更容易表现出异质性和交互影响,所要收集和处理的数据量也呈幂指数态势增长),由此揭示微观行为与宏观现象的内在联系并据此进行决策。借助行为科学实验、神经科学实验和计算实验等方法能够更好地处理临界状态下的个体差异化等内容,更集中地体现人本特色和人文因素,类似的现实需求也更为迫切和广泛。这也就是为什么要通过大数据技术深化行为分析、构建计算实验平台和破解复杂决策之谜的根本缘由与内在逻辑。 行为大数据是计算实验的原材料,一体化模型、计算模拟平台、引入人文和社会历史逻辑推理等是实验条件、基础设施和实验规程,从行为根源上破解人类复杂决策之谜是实验研究对象、发展动力和实现目标。传统的理论方法可看成某种理想情景下的特例和参照系,而破解人类复杂决策之谜则需要更具实质性和更独到的拓展与创新。大数据经济学(Einav and Levin,2014)不是原有研究在数据规模上的简单扩容和升级,更不是贴标签和换包装;而是在研究视角、基本行为假设、核心模型、微观与宏观的连接、传导机理和经济现象的解释以及政策模拟评价等方面都有实质性的改造与创新,其依靠行为大数据对真实经济现象进行深刻透彻的映像与揭示,必将带来经济理论的全面提升甚至是全新重塑。 一系列的行为大数据矩阵或表格,一体化的HS+CA计算实验平台,一整套全程全覆盖的复杂实景模拟、观察认知、推理判断等思维和决策模式的形成,使经济研究及各分支学科在更高层次上得以分化解构、整合提升,大大超越由传统的观念、经验、方法和标准做出的判断、评价和预见(Boero,2015;Claudio,2014),这是由人类社会发展的根本性需求决定的,是人类智慧的必然延展和发展的共同愿景。行为大数据及相关的信息网络技术等的发展,促使经济研究对人本取向的回归,更加凸显人文灵魂与人性特征,使科学为人文类学科的发展提供更有力的技术支撑和保障,同时人文科学又能为现代科学的发展注入人文精神和提出更高需求,进而真正实现科学与人文的融合升华。 注释: ①此处所说的行为大数据,既不同于一般意义上的大数据,也不同于特指的用户行为大数据,而是更加强调以人为本、对各类主体的异质行为的全方位、全过程、精准化、分层次、关联式的记录和反映。 ②通宏洞微,由通幽洞微转化而来,相近的词汇有见微知著、一叶知秋等,倡导的是以人为本和以行为分析为主线的学术观点与技术路线:欲通晓和把控宏观现象,必须从洞察和深化微观分析入手。换句话说,任何宏观复杂现象,都应该且可以找到其微观行为成因。 ③其中部分案例是团队的合作贡献与共享成果,感兴趣者可查阅相关文献或直接与本文作者联系交流。标签:经济研究论文; 相关性分析论文; 经济模型论文; 微观经济论文; 经济学论文; 机理分析论文; 关系逻辑论文; 决策能力论文; 经济论文; 数据分析论文;