互惠利他博弈的人文价值_合作博弈论文

互惠利他博弈的人文价值_合作博弈论文

互惠利他博弈的人学价值,本文主要内容关键词为:互惠论文,人学论文,价值论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 互惠利他博弈的人学前提

为了解决古典达尔文理论面临的利他主义难题,哈佛大学生物学家罗伯特·特里弗斯(Robert Trivers)提出了互惠利他理论。1981年,密歇根大学政策科学家罗伯特·阿克塞尔罗德(Robert Axelrod)与威廉·汉密尔顿(William Hamilton)合作进一步发展了这一理论。互惠利他理论的基本思想是,如果施恩者在今后与受惠者相遇时得到回报,合作便会在利益部分冲突的理性个体之间产生。从人学角度分析,这个理论存在着三个重要的基本前提。

(1)博弈者是处于社会交往中的理性个体

互惠利他理论假设博弈者是理性个体,理性个体行为的动机就是追求自身利益的最大化。但这并不意味着,个体的理性必然会导致残酷的斗争。合作可以在一定的条件下产生,其中一个很重要的条件便是社会交往。人的本质是一切社会关系的总和,人存在于社会交往之中,并不是孤立的生存体,每个人都是在他者包围的世界中生存。在这种情况下,如果想获得自身利益的最大化,最好的策略并不仅仅取决于自身的行为,而是取决于与其他理性个体相互作用的过程。每个理性个体所采取的策略的优劣取决于与之相博弈的他者所采取的策略。“一个策略是有效的不仅取决于一个特定策略的特征,而且取决于它所要遭遇的其他策略的特性。一个有效的策略必须在任何时候都能考虑到相互作用的历史。”[1]也就是说,对策者之间的行为是相互制约的。一方面,你最好的策略取决于对策者会怎么做;另一方面,对策者会怎么做又很大程度上取决于这个对策者对你行为的预期。这样一来,即使是极力追求自身利益最大化的理性个体都不得不考虑他者的影响,在他者的约束中,理性个体如果希望自己的策略最好,最好的方法就是与对方合作,因为如果试图通过背叛来占便宜则可能引发更多的问题,会冒被激怒的对手报复的风险,并且,一旦陷入这种报复的僵局,就很难解脱。

(2)博弈是非零和的

合作之所以能够进化是因为互惠利他博弈是非零和的。非零和博弈意味着博弈双方并不一定要形成竞争式的对抗关系,因为一方所得并不等于另一方所失。这一点与零和博弈不同,在零和博弈中,一方的收益就是另一方的损失。如足球比赛就是一种典型的零和博弈,两支参赛球队的目标都是赢,存在着明显的利益冲突,一支球队赢得比赛便意味着另一支球队输掉比赛。但是在非零和博弈中,参与者的利益并无明显冲突,甚至有一部分利益是一致的。一般来说,博弈双方可以通过相互合作都做得很好,也可以因为相互背叛都做得很差。博弈的非零和性质,为博弈双方提供了合作的空间。博弈双方完全有可能联手合作,共同受益,而不必斗得头破血流,两败俱伤。人生中有许多非零和博弈,“在所谓文明的‘冲突’中,其实常有相当大的合作空间。那些看起来是零和的抗争,可以在一些存在的善意中,被转化为‘互利的非零和游戏’”。[2]在一个非零和的世界中,你的目的并不是要消灭对方,“为了你自己做得好,你没有必要非得比对方做得更好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得更好就让他们每个人做得和你一样或略好些。没有理由去嫉妒对方的成功。因为在长时间的‘重复囚犯困境’中,其他人的成功是你自己成功的前提。”[3]如在生意场中,供应商和销售商的关系就是非零和的。对于一个销售商的主要威胁并不是供应商的相对成功,销售商嫉妒供应商的利润是完全没有意义的。销售商如果把供应商当作“假想敌”而采取不合作行为,其结果就会激起供应商的报复行动,如拖延发货、不打折扣、不交换市场信息等,最终会导致自身的利润也同样降低。与其这样,就不如建立一种双方都能获得好处的合作关系,互惠双赢。

(3)博弈是叠演的

博弈者之间能够合作还有一个很重要的条件,就是他们有可能再次相遇。试想博弈如果是单局的,博弈者有理性的策略应该是背叛。但是如果两位博弈者得知彼此在未来可能再次相遇,那么未来的影子便会投射进现实中来。这就意味着现在的选择不仅仅决定着当前对局的结果,而且还会影响对策者以后的选择决策,因此未来会对当前的对策局势产生影响。由于未来是重要的,聪明的博弈者不会只急功近利地看待眼前的直接利益,而会关心自己的长远利益,并担心自己采取的策略所造成的未来后果。另外,博弈的多次性使得惩罚背叛得以可能,这就进一步抑制了理性个体想要背叛对方的企图,因为理性的博弈者都不希望自己的背叛行为遭致对方的一连串无休止的报复。如果为了自己的利益而太富于竞争性,从长远来看是要付出大代价的。

只要未来的影子既长又不确定,就足以培养出互惠式的合作关系。阿克塞尔罗德精辟地分析了在第一次世界大战的堑壕战中的“自己活也让别人活”的系统,这个“自己活也让别人活”系统充分说明虽然战争是一种极度冲突的对抗形式,但是在长期战乱的时代,当迅速结束战争的希望很渺茫,即未来的影子很长时,也会出现短暂的合作现象。如一位英国的资深军官惊讶地发现他们的士兵会允许德国兵在他们的来福枪的射程里随便走动。甚至在圣诞节时,还发生过英国和德国的军队在杳无人烟的荒芜地带一起喝酒往来的事情。

2 互惠利他博弈的建立及其人学内涵

互惠利他理论的建立发展得益于博弈论工具尤其是囚徒困境博弈分析。囚徒困境博弈源自两个囚犯的故事,这个故事假设有两个合伙犯罪的罪犯被抓入监牢隔离开来审讯,他们每一个人都有两个选择:合作或背叛。如果双方都选择合作,会得到“对合作的奖励”R=3;如果一方背叛一方合作,那么背叛者得到“对背叛的诱惑”T=5,合作者得到“对傻瓜的欺骗”S=0;如果双方都背叛,那么会得到“对背叛的惩罚”P=1。(如图所示)

囚犯B

合作 背叛

合作 3,3 0,5

囚犯A背叛 5,0 1,1

(第一个数字表示的是囚犯A的所得值;第二个数字表示的是囚犯B的所得值)

那么,囚犯A和囚犯B将如何行为呢?对于任何一个人来说,他的最佳选择总是背叛。为什么呢?以囚犯A为例分析,囚犯A作为一个理性的人,他会在心里这样考虑:“如果囚犯B合作,那么对于我最有利的行为是背叛,因为背叛会得到更多的好处;如果囚犯B背叛,那么背叛仍旧会比合作好。所以无论囚犯B怎样做,我的最佳选择总是背叛。”同理,囚犯B也会得出相同的结论。结果是,双方都会背叛,只能得到1分,比他们双方都合作得到的3分差很多,这便是两位囚徒共同面临的困境。

单局博弈只有合作和背叛两种策略,在这种情况下,博弈者更容易选择背叛而不是合作,但是如果把博弈次数增加,多种多样的策略就会涌现,如全合作策略(每一步都合作)、全背叛策略(每一步都背叛)、交替策略(随机地选择合作或背叛,但采取合作和背叛的机会各占一半的次数)、一报还一报策略(第一步首先采取合作,如果别的竞争对手也采取合作,双方就继续合作;如果别的对手采取背叛就以牙还牙报复,直至对方重新恢复合作为止),两报还一报策略(第一步合作,如果对方连续两次背叛它就背叛一次,在其他情况下都采取合作)等。为了征集最佳的策略,1979年,阿克塞尔罗德设计了电脑竞赛,结果表明,一报还一报策略获得了成功。该策略是一种基于回报的互惠合作策略,这就说明,博弈次数增加后,合作可以在理性个体之间产生并发展。

可以看到,互惠利他的本质是以回报为基础的利他互惠。利他并不是纯粹单方的无私奉献,而是一种基于回报的互惠关系。这种回报不仅仅局限于回报合作,也要求回报背叛。回报合作意味着互惠利他不会主动背叛,只要对方不背叛,他就会和对手一直合作下去并获得较高的分数。它不把利益孤立化,而是把自我的利益效用和他人的福利相联系。由于对方会把你的行为看作你是否回报合作的信号,你的行为会通过他者反射到自己的身上来。因此,如果希望对方合作,最好的方法就是回报合作,这样就可以巩固继续合作的基础,使双方在这一基础上互惠互利。如果只是考虑自己的利益而忽略他者的利益,并耍一些小聪明却希望他者宽宏大量,其结果只能是聪明反被聪明误,最终陷入双方背叛的两难境地。回报背叛意味着互惠利他并不是在倡导一种无条件的合作,即无论对方如何待你,你总是不计前嫌地与对手合作。鼓励把无条件合作作为道德基础的理想虽然崇高,但是在现实生活中却是不可行的。原因是处在真实世界中的理性个体并非个个“善良”,许多理性个体在追求自己利益最大化的时候是希望利用他者的“好说话”而占一些便宜的。这样,无条件合作的结果不仅伤害了“好说话者”的利益,而且会把这些“希望通过背叛而占便宜的人”宠坏。如果这些使用剥削性策略的人在社会中大量生存,更多的无辜者将会受到伤害,社会的整体利益就会下降。相反,回报背叛就是要通过适当的惩罚让这些剥削性策略无法生存,并且引导出更多的合作。通过惩罚对方的背叛,使得对方的小聪明没有获得任何好处,这样一来,试图剥削者要么会因为继续执迷不悟而在恶性地相互报复中被淘汰出局,要么会改过自新,通过重新合作摆脱僵局。互惠利他是鼓励对手改过自新的,因为回报并不是严厉的,也就是说,只要对方愿意合作,它就宽恕并停止继续惩罚对方,与对方建立新的友谊。回报的原则就是要坚持公平。它不主动伤害对方,但也不容许对方伤害自身。我们认为,坚持公平的最好方法就是以其人之道还治其人之身,即“对方如何待你,你就如何对待他。”如果对方是合作的,那就和对方真诚合作,而不要试图去背叛对方,因为在公平的世界中,侥幸的心态并不会带来任何实际利益的增加,这种侥幸获得的直接利益迟早会在未来的接触中被他者的报复所抵消;如果对方背叛,当然最好也是用背叛“回敬”对手而不要退让,因为软弱可欺并不能教化对方,只会使这个世界丧失更多的公平。概言之,互惠利他就是一种建立在回报基础上的合作。

3 互惠利他博弈的人学价值

(1)填补德育中的人学空场

德育是教育的灵魂,但是在现行的德育研究中却面临着种种困境,其原因主要是在我国有时把利己动机和利他动机片面对立,忽视合理的个人利益,只是单方面强调集体利益,在教育中存在着严重的人学空场。针对这种情况,我们认为互惠利他博弈强调个体理性和集体理性的统一,强调人的主体性,为我们研究德育提供了一个新的视角。

无可否认,人都有追求自身利益的欲望,人的多数行为都是在自身利益的驱动下产生的。但是传统的道德教育否认人的利益追求,把个人需要看作是利己主义,认为道德教育的任务便是约束人的利己动机。结果是,这种教育过分过高地注重道德的利他性,忽视道德的利己性,道德成为了一种异己的力量,只是义务、责任、奉献甚至成为一种限制和约束。

互惠利他理论并不否认人的利己动机,也不把利己动机和利他动机看作是不可调和的矛盾冲突,相反,它认为利己和利他是互为前提的:一方面,利他动机的产生是个体利己动机和社会环境相互作用的结果,而不是与当事人的利己动机无关的外在规范强制灌输的结果。“人类利他精神的多数表现形式最终都含有自利的性质”[4],可以说,没有利己动机就不会产生利他动机,这并不是为了提倡利己才利他,但是当一个人明白当时当地的利他行为从长远来看实质上是利己时,就更容易产生利他的道德行为。从某种意义上说,正是因为个体具有源于利己动机的自主性和能动性,才能对外在的规范要求做出反映,使外在的规范教育得以可能。另一方面,利己动机必须在利他动机的约束下才能真正实现,源于社会的利他动机重塑着人的利己动机。人的利己动机源于人的生物本能,趋利避害是人的天性。但是人的行动却不完全是源于生物本能的行动,这是因为,人不仅仅是生物意义上的人,还是社会意义上的人,一个经历了社会化过程的人不仅具有先天的利己动机,还具有一个经过后天价值内化而形成的利他动机,后天形成的利他动机会约束和重塑先天的利己动机,由此决定着人们追求利益的方式和手段。尊重个体理性并不是要无条件地去满足个人利益,而是要在这个前提下,让人明白完善的理性是懂得让度,能够考虑他人利益的理性;让人明白个人利益的获得不能通过损害他人的利益来实现;让人明白牺牲自己的利益从长远来看,将会得到物质和精神上的回报。总之,作为社会人的个人动机是由利他动机和利己动机两部分组成的,两者之间的相互作用决定着人的道德行为。互惠利他博弈模型对个体从利己走向利他的分析过程真正体现了参与者的主体地位,实现了个人价值和社会价值相统一的德育价值观。

(2)建立以人为本的和谐社会

和谐社会是人的和谐。建立和谐社会的核心是以人为本,尊重人的本性。马克思指出,人的本质是由人的需要决定的。这实际上是一种生存的利益现象。也就是说,人都有自身的利益追求,人们奋斗的一切,都同他们的利益有关。利益主体有着不同的表现形式,如个人、集团、阶级、民族和国家等。不同的利益主体有着不同的利益需求,表现出不同的愿望和行动,这便造成利益主体之间的利益矛盾。幸运的是,矛盾并不一定是不可调和的极端冲突,大多数矛盾都是非零和的,这就存在着大量合作的空间,存在建立和谐社会的可能。

这就是说,和谐社会既要承认人的正当利益需求,又要协调人与人之间的利益冲突。我们认为,互惠利他理论为协调人与人之间的利益冲突,建立和平发展的和谐社会提供了有利的思想工具。

首先,互惠利他强调公平的原则,和谐社会必须是公平合作的社会。和平和发展已经成为当今社会的两大主题,无论是经济领域还是国家政府决策都越来越凸现合作双赢的趋势。实现社会的和谐发展,需要的就是一条合作之道。互惠利他理论无疑从一种新的角度开辟了一条合作之路。这个新的角度就是在公平回报的基础上利他互惠。换言之,人与人之间之所以能够合作,是因为能够互惠双赢,而互惠双赢的实现是公平回报的结果。公平回报就是既要回报合作,也要回报背叛,即奖罚分明。这就需要我们建立健全法制体系,维护合作基础,惩罚背叛行为。当然,惩罚是有限度的。从互惠利他理论的分析中,我们看到,具有宽容性质的策略可以使双方从无休止的背叛冲突中解脱出来。缺乏宽容的策略由于过于严厉,无法让对方感受到愿意重新合作的任何激励,很容易使冲突升级,代价更高。这就启示我们,在利用法律手段惩罚背叛行为的同时,应该通过适当的教育教化背叛者改过自新。一旦背叛者愿意恢复合作,更应该建立适当的激励机制鼓励他的合作行为。总之,公平回报是合作能够持续下去的基础,失去了公平,合作关系将会中断,利益冲突将会升级,社会将不再和谐。

其次,互惠利他协调了短期利益和长期利益之间的矛盾,和谐社会是可持续发展的社会。正如单局博弈所揭示的,如果未来对于现在不重要,博弈双方最有利的选择就是背叛。但是,如果博弈次数增加,未来相对于现在足够重要,双方的利他动机将会增加。因此,对未来的预期对于促进合作起着关键性的作用。只要未来的影子足够长,使得背叛所获得的短期利益远远小于合作所带来的长期收益,合作就有可能出现。和谐社会要获得可持续发展,需要放眼于长期利益而不仅仅局限于短期利益,互惠利他理论启示我们,只要把未来的影响增大,就可以使短期利益转化成长期利益,缓解两者的矛盾。这可以通过使利益主体的相互作用更持久、更频繁来实现。只要未来是重要的,利益主体就会看到合作的长期收益明显大于背叛带来的短期收益,便可加强对未来预期的信心,在更大更广的范围内继续合作。

再次,互惠利他化解了个体利益和集体利益的矛盾,和谐社会追求个体利益和集体利益的统一。互惠利他理论表明在利益休戚与共的社会中,只要理性个体在追求自身个体利益的同时必须考虑他人利益的制约,个体利益和集体利益就是统一的。人与人之间利益的相互依存、相互渗透,会使得理性个体在考虑内部个体利益的同时,顾及团体的整体目标,以集体利益来协调个人需要。因此,为了让每个人都能自觉维护集体利益,必须根据个体的实际需要,合理规划和调节集体的共同利益,只有这样,资源才能有效配置,社会矛盾才能缓和,和谐合作的社会共同体才能建立。

总之,得益于博弈论工具,互惠利他研究已经成为异常活跃的领域,“及时把握这个领域的进展,无疑会发掘出新的哲学问题,大大开阔我们的哲学视野,丰富哲学研究内容”。[5]

标签:;  ;  ;  ;  

互惠利他博弈的人文价值_合作博弈论文
下载Doc文档

猜你喜欢