从理性、有限理性到现代心理学与经济学_心理学论文

从理性、有界理性到现代心理学与经济学,本文主要内容关键词为:理性论文,心理学论文,经济学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

DOI:10.3773/j.issn.1006-4885.2014.01.073

中图分类号:F019.4 文献标识码:A 文章编号:1002-9753(2014)01-0073-22

1 理性

1.1 历史

理性是西方文明的精髓。谈到理性,不能不提及古希腊—西方理性主义的发源地。在古希腊时期,理性是和逻辑这个概念紧密联系在一起的。从毕达格拉斯把证明引入几何学开始,到苏格拉底重视对话体中的逻辑性,再到后来亚里士多德提出的三段论(syllogism)和早期的模态逻辑(modal logic),古希腊人对推理规则本身的认识已经高度抽象和系统①,他们对逻辑真的追求和对抽象的审美,标志着人类理性主义兴盛的开端。

然而,到了古希腊文明的晚期,亚历山大东征;面对战争和死亡,人们开始重新思考理性。哲学家们开始关注人性,讨论道德哲学。当时有两个对峙的观点:伊壁鸠鲁(Epicurus)的享乐主义和斯多葛学派(Stoicism)的禁欲主义。享乐主义是经济学的渊源,追求享乐是目的论导向的,说明每个人是有追求的。

继古罗马帝国崩溃后,西方黑暗了上千年。

之后是文艺复兴,文艺复兴其实就是复古希腊人理性的兴。边沁(Bentham)继承了享乐主义传统,开创了功利主义(utilitarianism)。今天经济学里理性人所优化的效用函数就是从这时候开始的。接着,最后一个古典经济学家穆勒(Mill)发展了功利主义,使得效用函数被后来的新古典经济学家们广泛采纳②。

1.2 理性选择论

现代理性选择论的贡献之一是为功利主义的效用函数提供了公理化的基础,使我们知道在什么情况下可以使用效用函数来分析人们的行为。

在现代经济学里,理性有两种定义:行为理性和过程理性③。

行为理性就是要求人们的行为具有某个规律性的特征,即不相关对象独立性公理(Independence of Irrelevant Alternatives,IIA)。IIA是说,如果决策者在一个选择集里选了a,那么现在把选择集缩小但仍然包含a,理性的行为应该是在这个小的集合里仍然选a。于是,行为理性使理性这个概念成为了一个具有经验内容的概念,我们可以通过对人们行为的直接观测来判断他们是否理性。

过程理性用数学中的关系概念来建模偏好,假设每个决策人都有自己的偏好,如果决策人能把所有的备选方案从好到坏排成一个线性序列,那么这个决策人就是理性的。从二元关系的角度理解,理性的偏好关系具有完备性(completeness),即给出任何两个备选方案a和b,决策人都能比较它们的好坏,不是a好就是b好(或一样)。另外,理性的偏好具有传递性(transitivity),如果a比b好,b又比c好,那么a也一定比c好。传递性是过程理性的核心特征,如果某人的偏好没有传递性,那我们就可以把他当成提款机(money pump),假设某决策人认为a比b好,b比c好,但c又比a好。你可以免费给他c,然后让他给你一分钱把c换成b,他显然会答应;然后你可以让他再给你一分钱,同时你把b换成a,他还会答应;再然后你可以让他再给你一分钱把a换成c:这样一直循环下去,你就把他的钱包掏空了。这样的人在长期的演化中会被淘汰,所以经济学家们假设人是过程理性的,偏好满足完备性和传递性。

然而,偏好关系是个形而上的概念,看不见,摸不着。我们不能从经验上来判断人是否过程理性,我们所能观测的对象仅仅是人们的行为。

通过数学证明,经济学家们发现过程理性和行为理性这两个定义是等价的。也就是说,如果一个人是过程理性的,他表现出来的行为就是行为理性的;反之,如果一个人的行为是行为理性的,就存在一个理性偏好关系合理化这个行为。于是,如果我们在人们具有行为理性的假设下观察到一个人在不同情况下的各种选择行为,我们就可以反推出他心中的偏好关系,建模他的过程理性;另外,在非常一般化的情况下,如果偏好关系是过程理性的,我们还可以用一个效用函数来表达这个偏好。所以,理性的行为可以用优化效用函数来表达,这是现代微观经济学的公理基础。这也就是弗里德曼(Friedman 1953)所提出的“好像(as-if)方法”:我们可以理解人们的行为,“好像”他们在最大化自己的效用函数。在一个最广义的跨期、不确定性消费选择框架里,如果人们是理性的,那么经济学家所能观察到的消费行为就是以下优化过程的结果:

至此,仿佛一切都顺理成章;然而,首要的问题是人们的行为到底是不是理性的。既然行为理性是经验可测的,那么我们可以从观察到的人们的消费、投资等行为核实或证伪理性假设。如果人们不理性,那么人们的行为将在哪个方向系统的偏离理性?这就是有界理性以及心理学和经济学等交叉学科所探讨的问题。将人们在经济活动中的非理性行为进行规律总结并修正传统经济学结论的经济学分支叫做行为经济学,而在现实中检验行为经济学的假设和结论是否正确的学科分支是实验经济学④。

1.3 有界理性

“有界理性”这个名词最早由西蒙(Simon 1955)提出,西蒙认为人并非完全理性,理性计算具有思考成本(deliberation cost)。然而,西蒙的思考成本从微观经济学的角度看不过是一种特殊的成本,将思考成本引入效用函数中后,人的优化行为仍然是理性的。

另外,西蒙提出了人们决策的“满意过程”(satisficing procedure),他指出人们的选择并不是在选择集里寻求最优解,而是遍历各个备选方案,直到找到满意的为止。有趣的是,尽管满意过程的决策并不是真的基于某一理性偏好,它却满足行为理性的条件,因此这一决策过程仍可以被最大化某一效用函数的行为来表达。

所以,早期西蒙的有界理性概念并没有对经济学大厦构成威胁。对微观经济理论真正的冲击来自于后来心理学和经济学的结合。反映了人们的行为有着规律性的非理性的经典例子是Tversky和Kahneman(1981)提出的框架效应(Framing Effect)。它是指,对同一个对象,人们对它某个特征的判断会因为环境不同或它的表达方式不同而异。在认知心理学里,关于框架效应的讨论非常广泛。比较多的例子是关于视幻的,比如图1中两个线段一样长,但是看上去上边的要长一些,因为它们的端点分别被“框架”了。

图1 框架效应(Müller-Lyer illusion)

除了视幻,还有听幻,如谢伯音节(Shepard Scale),可以让人感觉某声音的音高在不断地上升,但实际上是一些声音在循环播放,因此具有提款机式的非理性的人还普遍存在。

当然,框架效应不仅仅限于感知上的偏差,它还存在于偏好的扭曲。传统的经济学假设人们对某个东西的偏好不会受到不相关因素的影响,然而,消费者在购买商品时会有折中效应(compromise effect)(见Simonson 1989)。他们往往不会挑最贵的,也不会挑最便宜的,而选择比较折中的产品。因此,如表1,如果把a和b放在一起,消费者不知道应该买a还是b,如果把一个更便宜的c加进来,消费者往往会选b,因为b不贵不贱,相反如果加入d而不是c,消费者会选a,尽管c和d都是不相关的因素,在任何情况下都没有被选中,但它们的存在影响了消费者的选择。因此,厂家把一些不相关的产品摆到柜台会影响消费者的选择。具体到笔记本电脑的销售,我们发现其实最高端的笔记本销量很低,人们往往不愿意买最新的那款,而选择比最高端稍微差一点的,值得注意的是,也许市场上主要销售的是低端的a和高端的b,本来消费者想买a,但厂家把不相关的高端笔记本d放到了柜台,于是消费者本不想买高端的,但还是买了b。

另外,政客也利用框架效应来操控公民的偏好。比如,右翼政党推行减税计划时经常会用“舒缓税收负担的口号”,听起来很舒服,公民都很支持,但他们却没有意识到减税所带来的社会保险和公共支出的降低。因此,框架效应不仅存在于视幻、听幻,还有“偏好幻”。

可见,当框架效应对决策者产生影响时,求解最优化的过程(1)式就显得不再那么合理。换言之,我们将很难判断消费者是否和经济学家一样还在做着不带幻觉的最优化判断。

在下文中,我们从最优化的基本表达式(1)出发,从社会偏好、时间不一致、自控、风险态度等各个角度,一一展开近年来国际学术前沿里心理学对经济学的冲击。

2 心理学和经济学

在新古典时期,数学方法精练的需要使经济学家们舍弃了心理、政治和制度等方面因素,而围绕着经济人(homo economicus)的简单假设开展经济分析。“经济人”这一名词,由帕累托(Pareto)从古希腊语中正式引入经济学,代表了理性和自利。然而,早在亚当·斯密(Adam Smith)时期,他在《道德情操论》一书中就已经较为全面地讨论了本文所涉及的对传统理性概念挑战的几乎所有方面⑤,所欠缺的只是严谨的数学论证。今天,数学方法在经济学中的运用已经相当成熟,所以是时候重新思考这些以前被抽象掉的问题了。

针对(1)式的过程理性决策模式,近现代的挑战主要可以划分为三个方面。

2.1 社会偏好:对的质疑

经济人假设的一个核心内容,是个人关注的对象仅限于自身经济利益,从而个人在社会交往中将最大化自身的消费量(即),而并不关心这些行为对他人造成的影响。这预示着个人与集体利益潜在的冲突。正如萨缪尔森条件所揭示的,如果存在外部性,公共产品的自愿供给将远远无法达到社会最优的水平,这也就是我们所熟知的搭便车现象。Sen(1977)将这样的经济人称为“理性傻瓜”——在他们自以为是的“最优”行为下,社会效率变得可望而不可即。然而在现实中人们的行为往往与经济人假设相背离:自愿的合作行为确实能够实现公共产品的供应;援助灾区、见义勇为这一类的行为也屡见不鲜。单纯依靠经济人假设所不能理解的这些“异常”现象,经济学家试图通过丰富U(·)的内容来诠释⑥。

2.1.1 利他主义与公平关注

利他主义(altruism)假设是首先与自私自利直接相对的。一个利他的人,既关注于自身收入的提高,也从别人的效用中获得快乐。以简单的独裁者博弈(dictator game)实验为例。在这个实验中,甲方(独裁者)有全权决定怎样在自己和乙方之间分配一定数额的资产。一个自私的甲方会把所有资产划到自己名下。然而实验观察到,大多数甲方选择的是分给乙方相当一部分资产。如果说乙的利益也在甲的考虑之内,那么这样的行为就比较容易理解(Andreoni,2002)。在现实中与之相应的应有慈善捐赠、骨髓捐献等活动。基于以上的观测,利他主义假设将效用函数中所关注的对象拓展到既包括自身消费也包括他人消费,并为二者分配特定的权重⑦。这样的一个利他主义者愿意承担一定的成本来使他人获得相对更大的利益,其结果是能够自发地将外部性内部化,从而增进社会效率的实现。正因此,我们也不妨称之为效率关注(efficiency concern)。更有意义的是,Becker(1974)指出,如果个人能够影响他人收入,譬如掌管财政大权的一家之主,他的利他精神将促使自私的其他成员做出同样利他的行动,从而在最大限度上实现社会的最优。

公平关注(fairness concern)则从另一个角度来诠释这些现象。它强调人们对平等的追求,指出应是个人收入差异,而不是对效益的关注导致了种种非自私的行为。独裁者博弈中的甲方之所以愿意和乙方共享资源,是因为消除双方在收入上的差距能够给他带来物质之外的满足。这也说明了为什么甲方从不会给乙方超过一半的资产。Fehr和Schmidt(1999)在他们开创性的文章中指出,通过一个简单的线性模型,公平关注足以解释诸多“异常”现象,并能进一步预测人们在面对市场竞争时向经济人行为的回归。而与Becker(1974)就利他主义的发现相似的是,一个足够关注公平的个人若能够强制采取事后惩罚手段,也同样能够促使自私的同伴都变得对公平关注起来。

从另一个角度看,Fehr和Schmidt的公平关注发展继承了功利主义传统的政治哲学,比如罗尔斯的社会正义理论(Rawls 1971),即给予处于最劣势的一方最高的关注。区别只在于,前者的元目标是平等,而后者则秉承“最大最小值规则”(maximin rule),若不能济贫便不会劫富。从这一点出发,Charness和Rabin(2002)后来提出的准最大最小值偏好周全地将利他与平等相结合,从而兼顾了对社会效率的思考(故后又称之为社会福利偏好)。

2.1.2 互利互惠

与利他主义和公平关注对应,互利互惠(reciprocity)更强调实现的过程和隐藏在行为背后的动机。用一句话来概括,互利互惠代表的是以德报德、以怨还怨的行为原则。它重在刻画在人与人之间动态的交往过程中人们心态的决定因素和变化过程,从而得以描述在现实生活中所常见的由受恩惠而思报答,由仇恨而施以报复的现象。同样在实验中,无论是互赠博弈(gift exchange game)中人们所表现的以多努力回报高工资,还是公共品博弈中对搭便车者施惩罚而致收入差距增大的行为,都明显超出了单纯考虑收入分配所能够解释的范畴,促使我们不得不转向互利互惠这一能够更好描述互动关系的非经济人假设。

具体来说,互利互惠偏好建立在利他偏好的基础上,效用函数中对他人的权重取决于他对我的行为。如果他人表现出友好,譬如使我获得超过某一“公平”水准的收入(Rabin 1993),或者慷慨地让我的预期收入高于他的预期收入(Falk和Fischbacher 2006),那么我对他给与正面回报,并乐于改善他的效用。反之,则我对他给与负面回报,这样,我的报复行为变得有据可依。

区别于利他主义者出于纯粹的关怀而采取有利他人的举动,一个互惠的个人这样做的目的若不是为了报答,便是为了在将来取得回报。一方面这使得互利互惠假设得到来自进化理论的支持⑧,另一方面也决定了它在静态合作关系之下较难有用武之地。此外,如何选择个人态度决定的参照标准⑨,以及解决针对高阶信念(belief about belief)的心理博弈(psychological game)难题⑩,都成为互惠互利偏好在运用中的难点。

2.1.3 社会规范

另一重要的研究方向是在之外将社会规范考虑进来。在纯粹的物质利益之外,人们的行为还受到道德思想、社会规范等方面的约束。大多数人都会按照自我或者社会群体所认可的好的标准来行事。对此,一个较直接的理论处理办法是推定个人可以从做“对的/好的”事情本身来获得效用,典型的有Andreoni(1990)提出的不纯粹利他主义(warm glow)。与之直接对应的还有康德法则(Kantian)。具体来说,如果一个人自己遵从,并相信他人也同样遵从康德法则,便可推断他人会采取和自己同样的行为,从而能够在个人最优化问题中充分考虑到相应的外部性,使得结果贴近社会最优(见Laffont 1975)。从反面来说,当道德标准在个人效用中占据重要地位的时候,个人也就有了为维护社会道德而主动惩罚违规者的理由,即便自己要为此支付成本。

2.1.4 其他

当代经济学对偏好要素的扩展包括除上述几方面之外更多可能决定或影响人们行为的社会因素。比较典型的有人们关注别人怎样看待自己,也就是好面子的问题。从经济理论的角度来看,就是效用还取决于别人的信念(belief)。面子问题早在1989年已由Geanakoplos、Pearce和Stacchetti(1989)引入了博弈论中。Glazer和Konrad(1996)的实验结果也显示,人们会在公开的场合下更加慷慨捐赠,只因这时能有更多人看见。有趣的是,对一些自愿行为,如献血,支付金钱报酬往往会适得其反:因为人们会担心别人认为自己为了钱付出,于是干脆选择放弃(见Benabou和Tirole 2006a)。同样的结论适用于人们关注自己怎样看自己,或者说自我形象(self image)的影响。再广泛一些,社会偏好之外的非消费性要素也影响着人们的效用。例如Brunnermeier和Parker(2005)就指出,人们当下的幸福还取决于对未来的希望,因此人们最快乐的时候,并不是消费量最大的时候,而是既富裕又还有希望的时候,也就是禅宗里所说的“花未全开月未圆”时。众多理论模型,诸如后悔规避(regret aversion)、期盼(savoring),乃至更广义的参照依赖(reference dependence),都丰富了扩展后我们对人们行为的认识。

当代经济学研究中,社会偏好的重要性已不再受争论。值得商榷的是,面对具体问题,究竟哪些要素应该加入到效用函数中。收入差异也好,行为动机也好,都经过了心理学、社会学的长期检验。引进它们并不是对效用函数中的要素随意增减,更没有触及经济学基本的理性假设,而使现有的经济学方法都得以直接运用到拓展后的问题中。

2.2 时间不一致的偏好和自控问题:对的挑战

标准的理性经济学假设人们跨期之间的效用评价采用模式的折旧轨迹,这样的折旧路径意味着人们在各期之间的选择具有一致性,短期与长期利益之间没有冲突,人们选择的消费路径与它起始于哪个时间点无关。但是,大量的文献探讨发现,人们在跨期问题上并不是如此理性,短期和长期利益并不是完全一致。

2.2.1 时间不一致(time-inconsistency)

我们先来回顾一下布坎南(Buchanan 1979)提出的方法论个体主义(Methodological Individualism)研究范式,就是说,我们对社会的认识和解释应该通过个体的行为来表达。但是,什么是个体?明天的你是否还是今天的你?大多数人的偏好随着时间的迁移而变化,在不同的时间让人们做抉择,面对同样的选择问题,他们会给出不同的答案,这就是Strotz(1955)、Phelps和Pollak(1968)及Laibson(1997)所引入的时间不一致的偏好。

经济学家对于时间不一致的行为特征的处理方法是多重自我(multi-selves),即通常指的个体人格分裂,人有长期的自我、短期的自我、理性的自我、感性的自我,每一个经济个体是多个自我的集合,各个自我之间互动,进而表现为时间不一致的跨期选择偏好。

一种偏见是投射偏见(projection bias),意思是人们通常以为自己对一个东西的偏好会永远不变,但实际上很快偏好就变了。比如说,很多人买书,认为自己会读完它,但买回家就把它当枕头了,因此买书的和看书的人不是同一个自我。另外,很多情侣的海誓山盟等也是典型的例子,一个人说他会永远爱她,但随着时间的流逝他却变心了,其实他并不一定是在骗她,只是没有意识到自己的投射偏见(11)。

另外,一个人日常生活中更严重的偏见是当下偏见(Present Bias),即人们没有耐心,相对于他们长期的优化方案,在执行时,他们会给当下的满足过大的权重。Fudenberg和Levine(2006)指出存在一个冷静的自我在优化长远利益,在每个时刻又有一个当下的自我去及时行乐。在做长期优化的自我是“冷”的,它体现的是人大脑皮层的深思熟虑的活动。而当下的自我是“热”的,它更多体现的是中枢边缘系统的对外界刺激的反应,是来自本能的活动。比如说,很多人一直想节食,但冰淇淋到了他眼前,他还是没有忍住。另外,很多人想存钱,但一发工资就忍不住去购物。很多学生认为明天完成作业是最理想的,到了明天又说明天,一拖再拖。这就是O' Donoghue和Rabin(1999a,1999b,2005)所讨论的拖延问题。值得一提的是,这种行为的确违反了行为理性的IIA。因为,在时间t=0时,学生的选择集是{0,1,2,…},即{今天,明天,后天,…}完成作业,他们的选择是1,即明天。到了明天,选择集是{1,2,…},这是昨天选择集的子集,IIA要求小学生还应该选1,但是他们却选择2!

文献中对时间不一致偏好的数学描述主要基于Laibson(1997)提出的准双曲线折旧——β(β<1),它是连续时间双曲线折旧轨迹在离散时间状态下的数学近似,一个β的加入很好地刻画了不同时间点的自我对未来消费的不同态度。在β折旧的框架下,当期和未来的瞬时折旧率是不同的,比如第0期的人看待第2期对第1期的人的影响是δ,但是第1期的人看待第2期对第1期的人的影响就变成了βδ,这意味着人们对于短期的诱惑更不具有抵抗力。

不仅如此,DellaVigna和Malmendier(2004)还指出,具有β型时间不一致问题的人,还可能具有幼稚性(naivety),即误以为今后的个体对待未来的态度会和今天一样(12)。对于幼稚的消费者而言,存在着预期的决策与实际的决策不一致的问题。另外,他们还易在市场上遭到理性人的剥削。一个典型的例子:健身房往往是会员制的,一次性付固定注册费,每次去的边际费用是零,人们一次性交了很多钱,然后到该去的时候他们发现自己懒得去了,于是先前交的大额注册费实际是白送给健身房了。相反,信用卡服务往往启动成本是零,一旦赊账成本就很高,消费者接受了服务却没有想到自己事后由于过度消费而赊账的问题那么严重。

2.2.2 时间不一致和幼稚性情况下的福利分析

经济学不同于自然科学的一个重要特征是,在分析人们的行为规律之后,我们还可以做福利分析,判定结果对社会福利是好还是坏,然后给出有条件的政策建议。然而,在多个自我存在的情况下,政策建议比较难以给出,因为不知道应该以“冷”的自我还是“热”的自我的福利作为标准。在多重自我情况下应该如何定义社会福利函数,在经济学界目前还没有定论,因为给不同类型的社会选择者的政策建议大相径庭,一个事件对社会福利比较静态分析的结论也不一样(见Yan 2010)。

大部分文献中取“冷”的自我作为标准,忽略“热”自我的福利,称之为社会对短期冲动自我行为的纠正,即家长式(paternalism)的社会选择者:家长可以通过童话故事让孩子对世界有美好但错误的认识,从而让他们积极向上;运动员除了奥运会拿金牌时的名利,平时的训练也要有赏罚;家人、老师、朋友可以通过纠正作用使他们更幸福。但如此一来,芝加哥学派的自由主义主张就不是全能的了,因为人们在“热”自我的干扰下不能做出“冷”自我的最优行为。然而有趣的是,Benabou和Tirole(2002,2004,2006b)发现,如果“冷”的自我没有意识到“热”自我的存在,他的一些有动机的错误信念刚好可以抵消长短期、理性与感性的冲突问题,这个结论又合了芝加哥学派的胃口。首先,对于能力和努力互补的问题,由基本归因谬误(fundamental attribution error)造成的自负,可以让人决定给出比实际能力需要更多的努力,但由于当下偏见的存在,人没有实现预期的努力程度,但刚刚好符合自己实际能力。因此,每个年轻人有远大理想都是最优的自负,想拿诺贝尔奖的,最后当了教授,其实他的能力正好符合教授,但如果他客观地估计自己,以教授为目标来给出努力,也许最后连博士毕业都成问题了。这种最优的有动机的自欺欺人和毛泽东“战略上重视敌人,战术上轻视敌人”的思想异曲同工。另外,基本归因谬误带来的自负本身也会给有对自我信念偏好的人带来快乐。其次,对于能力和努力互替的问题,有时自卑反而更好,因为自卑可以让人觉得自己不行,于是需要付出比实际能力所需更多的努力,同样由于未来偷懒自我的存在,人没有实现预期的努力,但刚刚好符合自己实际能力。因此,当给定了任务时,如考试,自卑有时也可以让人克服多重自我矛盾,从而通过考试。

这一部分对跨期间理性选择模式的挑战,在数学表达上可以用一个更广义的时间偏好函数如ρ(t)来代替原来的指数折旧

2.2.3 诱惑(temptation)、自控(self-control)和对选择集的选择

下面这个故事也许会让你产生共鸣。设想,再攒几个月,存款就够买那部苹果台式电脑了。这几天下班后我特地绕远路避开本来必经的苹果店,以免路过橱窗一时冲动刷卡搬了它回家,搞得后两个月天天吃泡面还贷款;也不用只能看不能买平白内心受煎熬。应用双曲线折旧偏好可以说明前者考虑,却难以解释为什么不买就不要看。Gul和Pesendorfer(2001)针对此给出了与双曲线折旧偏好迥异的诱惑偏好(temptation preferences with self-control)解释。这一偏好模型从人们面对诱惑与抵抗诱惑入手,描述了这样一种状况:当个人尚未直面诱惑时,他冷静地选择对自己最优的商品组合;当诱惑就在眼前时,他先试图抵抗诱惑来坚持原先的最优计划;但当诱惑大到难以抗拒,他也会理智地选择放弃转而选择在原先看来是次优的结果(13)。这就同样解释了人们的前后不一致行为。在效用函数的构建上,诱惑偏好由两部分加总构成:一是未受诱惑时的物质效用(commitment utility),完全符合经济学的传统设定;二是在面对诱惑时的自我控制成本,记为实际所选商品组合所具有的诱惑效用(temptation utility)与原本有可能获得的最高诱惑效用之差。个人优化的过程,就是尽可能地提高物质效用同时降低自我控制成本的过程(14)。

应用诱惑偏好得出的一个结论是,由于诱惑的出现产生了自我控制成本,甚至是对原先最优选择的放弃,使得人们倾向于在生活中寻求这样或那样的承诺机制(commitment device)来限定自己在未来的选择集(15)。这一点和在准双曲线折旧偏好下的选择并无不同。区别就在于,在诱惑偏好下个人在各时期(无诱惑时/有诱惑时)对承诺机制的态度是一致的:如果允许,无论是在先还是在后他都会选择将诱惑因素排除在外的较小的选择集;而在双曲线折旧下后来的自我却必然要反对先前自我所实施的承诺机制,因为这限制了后来自我的行为。一句话,在诱惑偏好框架下,个人偏好在时间上不存在不一致性,所不一致的仅存在于(当无法实施承诺机制时的)理想行动与实际行动之间。借此,诱惑偏好得以避免了准双曲线折旧偏好所不得不面对的福利分析的困难。

2.3 不确定性下的偏好:对的质疑

在经济学里,由伯努里(Bernoulli)开创并由后来的决策理论家Von Neumann和Morgenstern发展的期望效用理论一直占主导地位。直到上个世纪70年代,以卡内曼(Kahneman)和特沃斯基(Tversky)主导的一批心理学家开始实证地研究人们是如何在不确定下做出选择的。他们的很多理论直击期望效用理论的要害(16)。

2.3.1 展望理论(Prospect Theory)

传统的期望效用理论的核心思想是人们对于不确定事件的效用评价是以各个状态发生的概率为权重线性加权各个状态下的效用,即:,其中i=1,…,n是x这个不确定性事件的n种状态。由于概率是以线性形式进入效用评价的,所以期望效用理论需要一个与此相对应偏好的独立性公理,即两个随机事件(彩票)a和b,如果a比b好,那么a和任意一个彩票c所组成的复合彩票一定也优于b与c的对应组合。但是Allais早在1953年(Allais paradox实验)就指出复合彩票的相对评价其实与选取哪一个c进行复合是有关的,这一结论对期望效用理论中概率以线性方式进入效用评价提出了质疑,人们对某一状态下效用的权重评价,未必是它发生的客观概率,而是对客观概率的主观评价

经过不断总结与发现,目前经济学界在非期望效用领域被广泛使用的是展望理论(Kahneman和Tversky 1979)。它认为人们对于风险事件x的评价遵循:。总结起来,展望理论在以下几个方面对期望效用理论进行了修正:首先,w(·)的形式体现出人们高估小概率事件,低估大概率事件;其次,人们并不是只在乎结果的绝对值,而是依赖于一个参照点(reference point)r,高于参照点的值人们规避风险,低于参照点人们喜好风险;另外,人们更厌恶失去,同样的一个东西,损失它所带来的痛苦远大于得到它所带来的快乐。

把这些因素放在一起,我们得出同样一个人有可能同时存在四种模式的风险态度:第一,面对小概率的损失,人们规避风险,这解释了人们为什么会买保险;第二,面对小概率的收益,人们喜好风险,这解释了人们为什么在买保险的同时还会买彩票或赌博;第三,面对大概率的损失,人们喜好风险,也就是俗话说的“破罐子破摔”、“豁出去了”;第四,面对大概率的收益,人们规避风险,于是谨慎地选择资产组合来分散投资中的风险。

2.3.2 “含糊规避”(Ambiguity Aversion)

展望理论对期望效用一个重大的改良就是用对概率的主观评价来代替客观概率,但是当决策者对状态发生的客观概率也具有不确定性时,他们的行为会是怎样的呢?Ellsberg(1961)的实验指出,当行为人对风险事件各个状态的概率分布有所“含糊”(ambiguous)时,人们的行为模式与期望效用理论的预测相悖;在风险态度(有可能风险规避、中立或喜好)的维度之外,人们普遍体现出“含糊规避”(ambiguity averse)的倾向:即,人们对于事件发生的概率分布具有不确定性时,往往“悲观”地选取那个使自己风险评价最差的概率分布。

在金融学界,一直存在着“股票溢价之谜”(equity premium puzzle),即期望效用理论中的“风险规避”不足以解释证券市场里的“风险溢价”幅度。近年来对“含糊规避”的研究由于引入了一个新的维度的“风险补偿”概念,也使它成为解释该谜团的一个候选(Gollier 2006)。

2.3.3 小数定律(Law of Small Number)

Tversky和Kahneman(1971)提出了小数定律。举个例子,一个诗人、一个经济学家和一个数学家一起出国旅行,在火车上,诗人望着窗外的一群羊,感叹道:“啊!原来这个国家的羊全都是黑的。”经济学家说道:“你太不严谨了,我们只能说我们窗外看到的这群羊是黑的。”这时,数学家说:“你们说的都不对,其实,我们只能说我们窗外看到这群羊面向我们的这一面是黑的。”这说明,大部分人们的判断总是以偏概全,看到某个个体,就会认为潜在的总体都会如此,这就是小数定律的思想;在例子里,只有数学家在随机抽样后对总体做贝叶斯推理。Spiegler(2006)应用小数定律,解释了市场上为什么会有如此多的江湖骗子,很多号称治疗白癜风和牛皮癣的神医或算风水的大师都有很多偶然成功的案例,但是人们受骗恰恰因为他们认为这些成功都是必然的。

2.3.4 实证偏见(Confirmatory Bias)

Wason(1960)最早提出实证偏见,即人们往往有先入为主的偏见,当已经认定了某一结论,之后就不愿意更改自己的信念,面对新的信息,会更偏向支持这一结论的信息而拒绝反驳它的信息。实证偏见后来被Rabin和Schrag(1999)引入经济学,它也代表一种特殊的非贝叶斯推理。这种实证偏见也可以由对信仰的偏好来理解,尽管人们发现自己错了,他们不认错,因为对他们来说,偏见导致错误判断的物质成本要小于坚信错误结论的快乐。比如,第一印象往往比较稳固,另外,基督教国家长大的孩子一生信耶稣,伊斯兰教国家长大的孩子一生信安拉。政治上的左派只看左派的报纸,右派只看右派的报纸。值得注意的是,把小数定律和实证偏见放在一起,我们发现,人们很容易产生极端的思想,并且极端的思想会持续,因此很多市场上的算命先生和风水大师不仅存在,而且还有长期的垄断地位。

2.3.5 后见之明(Hindsight)偏见

与常见的先见之明(Foresight)偏见(17)相反,Fischhoff(1975)所提出的后见之明偏见的观点是人们对以前事件的判断会因为受到当下信息的干扰而发生偏差。这个思想与佛学里的“所知障”殊途同归。有时候,我们已有的知识会成为我们进一步认识世界的障碍。比如,有些知识让我们无法理解人们在没有这些知识状态下的行为。受过理性选择理论训练的经济学家很难明白常人的非理性行为,于是假设世人都是理性的,造成了严重的社会认知错误。在商业实例中,我们发现很多专业人员无法理解为什么用户觉得他们设计的产品使用不方便,这也是因为对产品的充分知识让他们无法认识对产品一无所知的用户是如何对产品进行“自然”操作的:比如,没有经验的电脑用户会抱怨输入密码的时候明明输入的是数字却只能显示出星星,或者抱怨无法读取光盘因为里面放的是软盘,或者干脆以为弹出来的光驱托是茶杯托。

2.3.6 可得性启发法(Availability Heuristics)和无意识(Unawareness)

Kahneman和Tversky(1973)提出了可得性启发法,即人们对一个事件的概率判断往往取决于这个事件的某个具体场景在他们的脑中是否可以获得,如果可以获得,那么这个事件的主观概率就大,反之则小。比较常见的偏见是合取谬误(conjunction fallacy)(见Tversky和Kahneman 1983),说的是人们赋予一个事件的概率可能会小于它的一个具体子事件(如果这个具体的子事件在判断大事件的时候不能被获得)的概率。比如,人们在判断以q开头的单词数时往往想象不到qu这个常见组合,于是,平均来看,人们认为以q开头的单词数目小于以qu开头的单词数目。在经济学里,和可得性启发法最相关的概念是无意识(unawareness)——关于不可预测事件(unforeseen contingencies)的正式模型之一。

经济学里对不可预测事件的分析是从对不完全契约的研究开始的。马斯金(Maskin)和梯若尔(Tirole)等一些契约理论家一直在分析现实中契约不完全的原因并为其提供微观基础(18);其中,契约不完全的一个最主要的原因就是不可预测事件。

目前,关于不可预测事件的正式模型主要有两种:决策论模型和认识论模型(19)。

决策论模型的方法就像检测行为理性一样,直接观察人们在不确定的情况下做出的选择行为,然后判断哪些行为表明他们没有预测到一些事件。

认识论模型的框架基于奥曼(Aumann 1976)的共同知识模型,如今已有两套方法来把知识形式化:一个是句法分析的方法,通过现代的模态逻辑来建模知识,把知识作为一个模态算子来处理,并赋予一定的公理;另一个是语义方法,即经济学家们熟悉的集合论的方法。两个方法使用不同的符号体系,但内容等价(20)。

从认识论的角度分析有界理性,重点在不完美知识,即“无知”。无知是人类的本性。在经济理论中,发展得比较完善的一种无知是“不确定”,即不知道一件事,且知道自己不知道。比如,我们不确定明天是否下雨。然而,更普遍的情况是,人们不知道自己不知道,不知道自己不知道自己不知道,等等,即“无意识”。在古代,人们没有意识到地球是圆的。工业革命时期的人们也没有意识到未来的温室效应。几年前,我们也没有意识到“非典”(21)。

人们无意识的对象主要分两类:外生变量(天灾)和内生变量(人祸)。

外生变量是指自然给与的不可人为改变的事件,如地震、水灾。大自然也给人们造成了很多不可预测的事件。同样,意识到大自然的一些规律,也不一定让人类的福利更大。比如,很多科学的贡献让人们以为自己的生活更好,但环境问题、战争问题让我们发现有些知识让我们自掘坟墓。

内生变量是指参与人的行动,如员工偷懒、雇主拖延工资。无意识人祸的例子也很多。Zhao(2008)提出,在人们的互动行为中,很多未料到的事件是人为的。正所谓“道高一尺,魔高一丈”。比如说,投资者没有意识到企业家会用资金去豪赌;工人没有意识到事后糟糕的工作环境。Gabaix和Laibson(2006)指出打印机消费者没有意识到以后墨盒的昂贵,酒店房客没有意识到酒店电话、停车等附加成本。这些现象说明无意识恶化了经济行为中道德风险的问题。另外,Von Thadden和Zhao(2012)指出在最优的激励设计问题里,如果员工没有意识到一些特殊的偷懒行为,则不应该主动地禁止他们的这些行为,因为禁止它们会让员工意识到这些坏行为,而这些偷懒行为不能被直接控制。因此,在某些坏行为上沉默也是契约不能太完全的理由之一。

最后,在互动博弈的问题里,很多行为经济学的相关文献都涉及参与人的无意识问题:比如在Camerer、Ho和Chong(2004)的认知构架模型里,部分参与人没有意识到更高阶推理人的存在;在Jehiel(2005)、Eyster和Rabin(2005)、Fryer和Jackson(2008)以及Mullainathan、Schwartzstein和Shleifer(2008)的类比思维模型里,人们往往意识不到一些外生变量和内生变量之间的因果关系。

(21)见Liu(2007)对无意识应用的总结。

3 结束语

今天越来越多的经济学家已经加入到有界理性、行为经济学和实验经济学的研究队伍,他们把各种人们偏见的摩擦加入传统的经济模型,并导出有趣的结论;与此同时,一些保守的经济学家试图理性化非理性行为。这个领域正呈现出一派百家争鸣的景象。

通过对各家前沿话题的介绍分析,我们可以把目前考虑到各种非理性行为的最广义跨期不确定性消费选择模型表述为:

从(1)到(2),我们看到有以下几点改变:

第一,max变成了:表示调整后的优化过程内化了框架效应产生的幻觉,说明消费者的选择并不完全像经济学家在数学上的最大化一样,其中受到一些非理性幻觉的干扰。

第二,被优化的不再仅仅是的序列,还有每一期的选择集,这是考虑到了Gul和Pesendorfer(2001)的为避免诱惑而选择选择集的问题;另外,我们注意到,的函数,这也是“无意识”部分里所说的对某些环境信息的认识会改变选择集的大小。

第三,变成了ρ(t,τ):时间偏好的表达更加广义化。首先,ρ(·,τ)函数打破了指数折旧下的时间一致特例(指数折旧下对于未来各期的瞬时折旧率是一致的);其次,第二维自变量τ是做抉择的时间点,它的引入,允许t(待决策的未来目标时间点)和τ(做决策的目前基准时间点)之间的远近差异产生前后决策不一致的偏好,即幼稚性问题。

第四,U的自变量里增加了代表社会偏好的变量,U的函数形式也会受到环境信息的影响。

第五,变成了:首先,人们评价不确定下效用的方式可能不再是传统的期望效用理论,代表一些新的如展望理论的风险态度;其次,<表示对信息集的更新可能采取一些带有实证偏见的非贝叶斯规则。

广义的框架使得模型更加复杂、难于处理,蕴含了更多的数学工具。更关键的是,非理性,有无穷多种,而理性只有一种,如今的有界理性文献已经超载。因此,有界理性研究的终极任务是像新古典时期的理性模型一样,寻求一个一致的可操作的框架能够容纳各种非理性因素,最终实现理论的统一。

①实际上,在古代东方,古印度大乘佛教之瑜伽行派所发展出的逻辑学(因明)也达到了古希腊逻辑的抽象和系统程度,但此论梵文原典已经失传;后来,唐玄奘从印度把因明学说传入中国,并在此基础上创立了法相唯识宗,但由于佛教后来在中国经历的多次法难,大量因明经典已经被毁。见Chi(1984)。

②关于完整的经济学思想史,见Spiegel(1991)。

③见Rubinstein(1998)第一章。

④另外,经济心理学也属于心理学与经济学的交叉学科,它用经济学方法来研究心理学问题,即用优化和均衡的方法来合理化心理学中的各种偏见效应,如Benabou和Tirole准备付梓的新书《Egonomics》,在这里就不做重点介绍了。

⑤见Ashraf、Camerer和Loewenstein(2005)。

⑥虽然无限期的重复博弈也可以解释人们的合作行为,但事实是,人们在大多数没有未来互动机会的情况下仍然愿意合作。

⑦在更广义的情况下,如果允许“权重”为负,这一利他效用函数也能够表现仇恨、嫉妒或其他类似的负面情绪,从而有助于描述一个人不惜牺牲个人利益来损害、报复他人的行为。

⑧一个具有互利互惠偏好的个人及其所处的群体,在长期内较不具备这一偏好的个人和群体容易获得高的收入/适应度(fitness),故而互惠偏好可以在进化过程中得以保存并扩散开来。(见Axelrod 1984)

⑨确定对他人态度的前提是能够将他人行为与某一事先确定的参照标准相比较。在相关文献中,这一标准的选择往往离不开收入分配这个基准。

⑩在某些环境下,行为并不代表动机(intention)。实验发现,尽管自私行为通常受到惩罚,但如果是迫于环境限制而别无选择,那么自私的举动往往能够得到谅解。因而,互利互惠偏好要求形成对别人动机的信念,并更深一层于对方对己方信念的信念。这不但构成复杂的心理博弈问题,也要求对选择集本身以及其中未被采纳的选择进行考察。这对传统经济学理论又是一个重大的挑战。我们在后文的参照依赖偏好和诱惑效用部分将再次涉及这一点。

(11)见Loewenstein、O'Donoghue和Rabin(2003)。

(12)如果没有幼稚性问题,我们完全可以用传统的完美信息动态博弈方法(如Laibson 1997)来分析各个人格之间的互动行为,相关的建模方法还有Jehiel(2001)的有限预期(limited foresight)模型。

(13)戒烟又是一个很好的例子。一个人下决心戒烟的时候,清楚地知道远离香烟是最好的选择。但是待烟瘾发作兼又身边众人吞云吐雾之时,诱惑往往战胜决心,早早宣告本次戒烟的失败。

(14)详尽描述的话,我们可以将时间分为两期。决策者在第一期尚未感受诱惑,认为在{x,y}选择集中x将在第二期提供较高的物质效用。然而在第二期,诱惑伴随着选择同时出现,如果y的诱惑力大于x,此时再坚持x而不选y就意味着要付出自控成本。如果这个成本过高,决策者就可能不得不弃x而取y,以选择次优的y的代价来避免过高的自控成本。值得注意的是,既然出现了诱惑,无论最终是选x还是y,个人所实现的最终效用都将低于第一期所预计的水平。

(15)相对于传统理性选择理论中的选择集越大越好的结论,诱惑偏好导致较小的选择集可能优于较大的选择集,由于即便最终未被采纳的选择的存在也可能降低个人的效用。这就是Gul和Pesendorfer的set betweenness公理。

(16)见Tversky和Kahneman(1974)的开创性论文。

(17)如Tversky和Kahneman(1974)提出定锚偏见(Achoring)。

(18)见Maskin和Tirole(1999)不相关定理、Tirole(1999)的综述和Tirole(2009)内生化无意识模型的最新研究成果。

(19)见Dekel、Lipman和Rustichini(1998a)的综述。

(20)见Geanakoplos(1992)及Dekel和Gul(1996)对共同知识的讨论,以及Dekel、Lipman和Rustichini(1998b)对不可预测事件正式模型的综述讨论。

标签:;  ;  ;  ;  ;  ;  ;  ;  

从理性、有限理性到现代心理学与经济学_心理学论文
下载Doc文档

猜你喜欢