基于报酬的合作:生物竞争中的制胜策略_合作博弈论文

基于报酬的合作:生物竞争中的制胜策略_合作博弈论文

基于回报的合作——生物有机体竞争中的制胜之策,本文主要内容关键词为:有机体论文,之策论文,生物论文,竞争中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:N031文献标识码:A文章编号:1009-055X(2006)03-0017-06

竞争与合作是生物有机体两种不同的进化途径,也是生物学家和哲学家共同关注并众说纷纭的问题。1859年,达尔文(Charles Robert Darwin,1809-1882)在《物种起源》中直截了当地解释了生物有机体的竞争进化,指出新物种就是在生存竞争中,通过自然选择作用得以形成并实现进化的。[1] 145达尔文进化论经过在牛津的公开辩论,在此后的20年中广为传播,得到科学界的普遍认同。然而,自然界同样存在着合作与利他现象,不育的工蜂勤勤恳恳地抚养兄弟姐妹和保护蜂王,危险时以牺牲自己的生命换来家族的安全;鸟类和哺乳动物的报警换取了同伴的安全,自己却陷入了危险的境地;亲代为了养育子代甘愿付出时间、精力和能量,而自己一般不获益。这类现象深深困扰着达尔文,他无法做出解释,只能把它们看作是自然选择学说的致命反例。

1902年,俄国地理学家、无政府主义者克鲁泡特金(Peter Kropotkin,1842-1921)关注并研究了自然界和人类社会的合作与利他现象,指出互助、合作是一个自然法则和进化要素,认为有机体进化的重要因素是合作而不是竞争。[2] 与自然选择学说不同,克鲁泡特金更强调有机体的合作进化。然而,由于他对合作的描述和解释相当模糊以及合作一直被误认为是一种适应,克鲁泡特金的观点没有引起生物学家的注意,有机体的合作与利他行为的研究也没有得到应有的重视。

在克鲁泡特金之后的几十年中,生物学家们的野外考察和实验室研究为个体间的合作和利他现象提供了大量例证。随着1973年康罗·洛伦兹(Konrad Lorenz,1903-1989)、卡尔·冯·弗里施(Karl Von Frisch,1886-1982)和尼古拉斯·廷伯根(Nikolaas Tinbergen,1907-1988)因动物行为研究方面的突出成就分享了诺贝尔生理学或医学奖,动物行为学尤其是利他行为引起了科学家们的广泛兴趣和深入研究,近30年来出现了大量研究成果。

1964年,伦敦大学帝国理工学院的生物学家汉密尔顿(William Hamilton,1936-2000)从概率的观点出发,提出了亲缘选择理论[3];1976年,牛津大学生物学家道金斯(Richard Dawkins)用基因的自私性进一步发展了该理论;1971年哈佛大学生物学家特里弗斯(Robert Trivers,1943-)提出了互惠理论[4];1990年卡内基-梅隆大学教授西蒙(Herbert A.Simon,1916-2001)提出了驯顺性理论[5]。亲缘理论、互惠理论和驯顺性理论分别对有机体的近亲利他行为、非近亲个体之间基于回报的利他行为以及不求回报纯粹利他行为进行了探讨。[6]

本文所要考察的是生物有机体的互惠利他行为,互惠利他行为即非近亲个体之间基于回报的利他行为,是指两个有机体之间相互交换适合度(fitness)代价和利益的行为。有机体的适合度是衡量一个个体存活和繁衍后代成功率的一种尺度。适合度越大,个体存活的机会和生殖成功率就越大。一个有机体付出代价帮助另一个有机体,可以在下一次受另一个有机体帮助时获得更大利益,这是两个无亲缘关系的个体之间建立的以降低当前适合度来换取日后更大适合度的利他行为。

为了分析合作与利他行为的产生,特里弗斯运用囚徒困境分析了个体的策略选择。[4] 53-571981年,在此基础上,密歇根大学政策科学家艾克斯罗德(Robert Axelrod)与汉密尔顿合作,运用博弈论研究了策略在合作进化过程中的性质,指出利益部分冲突时个体采取合作而不是背叛的策略是有机体竞争中的制胜之策,个体的这种合作和利他行为实际上也是一种生存策略。

一、背叛还是合作:囚徒的两难选择

在生物有机界,处处存在着各种各样的冲突现象。博弈论就是研究个体活动中的互动行为的理论。用博弈论的模型,我们可以对类似的情况进行精确分析。博弈论的经典例子——囚徒困境讲的是两个合伙作案嫌疑犯被警察抓住后隔离审讯。在警察面前,两个囚徒(A和B)都会面临两种选择:坦白(背叛)或抵赖(合作)。如果两个囚徒都抵赖,不招认罪行,各判刑1年(因证据不足);如果两个都坦白,即供出罪行,各判刑8年;如果其中一人坦白另一人抵赖,坦白的放出去,不坦白的判刑10年。对于每个囚徒来说,这四个结果按对自己有利的排序依次是:自己坦白对方抵赖>双方都抵赖>双方都坦白>自己抵赖对方坦白。在这种情况里,就个人来说,最优选择是什么?是坦白还是抵赖呢?以A为例,如果B选择抵赖,A若选择坦白则被放出来,若选择不坦白则被判1年,所以A坦白比不坦白好;如果B选择坦白,A若选择坦白则被判8年,若选择不坦白则被判10年,所以A还是坦白比不坦白好。总的来说,A的最优策略是坦白,同样,B的最优策略也是坦白。因此A和B都将选择坦白。[7]

这两个囚徒的决策反映了一个深刻的问题,这就是对个体来说为最佳决策和对集体来说为最佳决策之间两难的矛盾。因为这种冲突和矛盾,在单局性的囚徒困境博弈中,个体的选择都会是背叛。推广而言,在局数一定的博弈中亦是如此,按照逆向归纳法可知,最后一次双方显然是不合作的,在倒数第二次,因为他们预知对方在最后一次会背叛,双方还是不会有合作的动机。依此类推下去,在已知次数的博弈中,从第一步开始就会是双方都背叛。照这样,似乎导致的是一种令人悲观的结论,那么有没有办法使个体摆脱这种困境,实现个体之间长期的稳定的合作呢?答案是,如果博弈双方还会相遇,并且将无限进行下去的话,博弈者就不知道何时是他们的最后一次对局,任何的背叛都可能使对手在下一场合背叛,博弈者也就都将对背叛举动三思而行,因为如果背叛的话,在某一次博弈中期望的收益最大,但是在多次博弈中期望的总体收益可能不甚理想,这样,合作就有可能出现了。这个问题实际上是一种重复囚徒困境(Iterated Prisoner' s Dilemma,IPD)。当利益部分冲突时,生物有机体采取合作还是背叛行为,需要回答两个方面的问题:第一方面是合作怎样才能开始出现,第二方面是在诸多策略中,合作策略如何能够抵制其他策略的侵入,最终得以进化而能够继续下去。

二、合作与强健性策略

在重复囚徒困境中,合作之所以能够出现,主要原因是双方可能再次相遇,同样的或类似的情境将再次出现在双方未来的博弈中。对未来的这种“期望”或“担心”意味着今天做出的选择不仅决定当前对局的结果,而且还影响对策者以后的选择,因而未来在很大程度上影响当前的对局局势,使得当前的合作变成可能。

事实上,在有机界和人类社会,交往的双方大多数情况下不止一次地持续进行着接触,现在做出的选择不仅决定当局的结果,而且影响对策者以后的选择,因而,未来对策的结果对当前的影响不可低估。在对策者认为未来所得到价值会随着时间的推移而减少,或者双方的交往因一方的迁移、去世、破产等而结束时,对策者就不会在乎未来的收益,倾向于较少合作,更多的是争取一次性好处。这种机制甚至在微生物水平上都会起作用,像在有些共生现象中,如果原来的宿主受到损伤或出现衰老等,与之继续接触的可能性变小时,共生者就可能从共生转变为寄生,并逐步加重剥削程度。由此,足见个体交往保持连续的重要性。为了更好的说明这种持续交往,我们引入未来贴现ω(shadow of the future,大于0小于1的常数)的概念,它表示对远期的收益在当期进行折现,也就是在对局中下一步相对于前一步的重要性,通常ω在取值时仅考虑对局双方再次相遇的概率,而忽略远近期收益本身的意义不同。ω参数取值的大小对合作能否出现和合作的稳定性等问题有着重要的影响。

在单局性或局数一定的囚徒困境博弈中,只有合作和背叛两种可能的策略,而且很容易就可以预期背叛是惟一合理的策略,在重复囚徒困境博弈中,却允许一切策略的存在。策略是一种行动规则,它决定了在每一重复博弈的回合,依据对策的历史做出合作或背叛的决策。以下是几种代表性的策略。像交替(ALT):不管对手采取什么策略,总是交替采取合作和背叛,合作和背叛各占一半的次数。全背叛(ALLD):博弈者每一步采取的策略都是背叛。全合作(ALLC):博弈者每一步采取的策略都是合作。一报还一报(TFT):第一步试图合作,第二步再根据对方的反应决定如何行动,即对方合作,下一次相遇时继续合作,对方背叛,则下一次背叛。显然,这是一种基于回报的合作策略。更复杂一点的,比如乔斯(JOSS):由合作开始,以背叛对付背叛,但是在对方合作时并不总是以合作来响应,而是会随机背叛一次。在众多策略中,如果未来是重要的,也就是说未来贴现ω足够大的情况下,并不存在独立于对方所用策略之外的“最佳策略”,在某些场合成功的策略不能保证其他场合同样有效。例如,如果对方始终合作,那么你就最好始终选择背叛。但是,如果对方在你背叛之后就再也不合作,那你就最好是从一而终的合作,因为第一步背叛得到的好处最终将被长期的互相背叛所带来的低收益抵消。因而,只有在各种策略具体的相互较量中,才能比较策略的优劣。

为了比较策略的优劣,艾克斯罗德组织了两次计算机竞赛[8]。竞赛中,博弈论专家提交体现在每一步选择合作或背叛规则的计算机程序参加较量。各参赛程序会重复相遇,且每一个参赛程序不仅要与自己相遇,还要与所有其他程序相遇,在这一过程中,每一个程序可以根据与对手交往的历史选择合作或背叛。在这两次竞赛中,获胜的均是所有程序中最简单的一种,即一报还一报。一报还一报之所以能够获胜,是因为它综合了善良性、报复性、宽容性和清晰性四个特点。它的善良性就是从不首先背叛,防止它陷入报复的恶性循环之中;它的报复性显示博弈者的可激怒性,能有效地对付欺软怕硬者,使对方试着背叛一次后就不敢再次背叛,这正如孔子在几千年前说的“以德报德,以直报怨”;它的宽容性有助于小的冲突之后重新恢复合作;它的清晰性使自己的行动容易被对方理解,从而引出长期的合作。一报还一报在比赛中获胜,它的成功并不是通过打倒对手,让自己过得更好,而是激发对手的合作,在合作中,对手可能会过得更好,但就是由于一报还一报的不妒忌,在这种长期反复进行的博弈中,它的收益一直居高不下。

艾克斯罗德把在由多策略所组成的环境中表现较好的策略称为“强健性”的策略,对于一报还一报策略“强健性”的最好证明要数艾克斯罗德在两次计算机竞赛之后所试验的“生态比赛”。这种生态比赛的重要意义在于,它模拟一组固定物种,其群体数量按照它们动态发展的环境而发生变化。一个回合的比赛只涉及一个世代,而连续多次的博弈则相当于在连续多个世代内模拟最适对策的选择过程,其中每一次参赛程序的拷贝数量与它上一次比赛的得分成正比。例如,在上一轮比赛中一个程序的得分是另一个程序的两倍,那么,在下一次提交的这个程序就是另一个程序的两倍。每个程序在比赛中的得分则是适合度的度量,也即子孙后代的数目。随着一代又一代的生态模拟,起初,差的程序同好的程序都同样得到表现,但是在长时间的考验中,差的程序被淘汰,好的程序繁荣昌盛,而且成功孕育着更多的成功。在整个生态模拟中,一报还一报策略不仅遥遥领先,而且它的增长率要比其他任何程序都要大,由此可以预见,在与其他策略的竞争互动中一报还一报将越来越占优势并且最终取代其他策略而被固定下来。

三、进化稳定策略

一个行为策略一旦被固定下来,还要看它能否抵制住其他突变策略的侵入,成为进化中的一种稳定策略,这就是进化稳定策略(ESS--evolutionary stable strategy)问题。该问题是由梅纳德·史密斯(Maynard Smith)和普赖斯(G.R.Price)提出[9] 的,并且成为研究合作进化的问题核心。

道金斯在强调ESS理论的重要性时指出:“我总是有一种预感,人们可能最终会承认ESS概念的发明,它是自达尔文生物进化理论建立以来进化的最重要的发展之一。凡是有利害冲突的地方,它都适用,这也就是说它几乎适用于一切地方……史密斯的ESS概念使我们第一次能够清楚地看到,一个由许多独立的自私实体所构成的集合体,如何最终变得像一个有组织的整体。我们认为,这不仅对物种内的社会组织是正确的,而且对于由许多物种所构成的‘生态系统’以及‘群落’也是正确的。从长远观点来看,我们预期ESS概念将会使生态学发生彻底的变革。”[10] 107

进化稳定策略的基本思想是:假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变个体,如果突变个体得到的收益大于原群体中个体所得到的收益,那么这个变异策略就能够侵入这个群体,反之,就不能够侵入这个群体而在进化过程中消失。如果一个群体能够消除任何突变个体的侵入,那么就称该群体达到了一种进化稳定状态,此时该群体所选择的策略就是进化稳定策略。梅纳德·史密斯和普赖斯还给出了进化稳定策略的精确数学定义。以E(i,j)表示策略i与j相遇时i所获得的收益或支付,当同时满足以下条件时,i是ESS。

(1)对任意j,E(i,i)≥E(j,i);

(2)如果E(i,i)=E(j,i),则E(i,i)>E(j,j)。

从这个定义可以看出,如果你的对手采用i,则你用任何策略的效果都超不过用i的效果;如果你用j对付对手的i时效果与用i一样好,则对手用j时,你用i更好。下面我们借助一个简单的模型来进一步理解进化稳定策略的定义。

假设在一个物种中,当个体与其同类为获得某种资源而发生冲突时,它们可能采取两种策略——“鹰”式策略H(hawk)和“鸽”式策略D(dove)。“鹰”式策略在战斗中全力以赴,采用逐步升级的战术,除非对手败逃或自己身负重伤,否则决不退却。“鸽”式策略只是进行恫吓、对峙,不主动攻击对手,耐心等待对手退却,对手若主动攻击则在未被击伤之前逃走。“鹰”与“鹰”相遇时会一直斗到有一方受伤,另一方获胜得到资源为止。“鸽”与“鹰”相遇时,“鸽”逃走但不受伤,“鹰”取胜。“鸽”与“鸽”相遇则任何一方都不会受伤,而是长时间对峙,直到一方先逃走,另一方获胜取得资源。在这里,个体的收益取决于三个因素:个体获胜的收益V(value),在战斗中严重受伤的代价W(wood)以及在战斗中长期对峙的代价T(time)。这三项都以适合度来评价。在评价“鹰鸽”策略时存在以下四种情况:

(1)“鹰”攻击“鹰”的情况。在战斗中,胜者将得到V的收益,而败者付出W的代价,由于每只鹰都有相等的获胜机会,所以每只鹰的平均收益为E(H,H)=(V-W)/2。

(2)“鹰”攻击“鸽”的情况。在这种情况下,鹰总是赢,不需付出任何代价,所以鹰的平均收益为E(H,D)=V。

(3)“鸽”遇到“鸽”的情况。获胜一方得到V的收益,但是双方因长时间对峙都需付出T代价,因此胜者的收益是(V-T),败者的收益是(-T)。同样每只鸽获胜机会相等,因此平均收益是E(D,D)=V/2-T。

(4)“鸽”遇到“鹰”的情况。鹰会攻击鸽,但鸽会选择逃走,所以鸽的收益是E(D,H)=0。

现在我们规定V=10,W=20,T=3,由此可以得到如图1所示的收益矩阵。

“鹰”

“鸽”

“鹰”(V-W)/2=-5V=10

“鸽” 0V/2-T=2

图1 “鹰”与“鸽”相遇时的收益

假定在一个完全由“鹰”组成的种群中,有一个“鸽”的突变体,大量的搏斗在“鹰”与“鹰”之间进行,其收益E(H,H)是-5,“鸽”每次战斗都遇上“鹰”,虽然它每次都输,但它不会受伤,收益E(D,H)为0,因此,“鸽”的收益反而较高,于是“鸽”的数量在种群中越来越多。反之,如果在一个完全由“鸽”组成的种群中,有一个“鹰”的突变体,“鹰”与“鸽”搏斗,“鹰”的收益E(H,D)为10,远高于“鸽”的收益2,于是“鹰”式策略在种群中扩散开来。显然,一贯采取“鹰”式策略或“鸽”式策略在进化上都是不稳定的,两者都能受到相对策略的侵蚀,因而都不是ESS。

虽然纯“鹰”或纯“鸽”式策略都不是ESS,但是有一种由“鹰”和“鸽”构成的混合型策略却能够达到稳定进化。这种混合型策略是按照特定的概率分布决定在一场争斗中所应采用的不同策略。我们可以通过计算得出“鹰”、“鸽”式策略的比例。设p为种群中“鹰”式策略的比例,则(1-p)为“鸽”式策略的比例。且种群中个体间的相遇是随机的,那么“鹰”的平均收益为:

p[,H]=pE(H,H)+(1-p)E(H,D)(1)

“鸽”的平均收益为:

p[,D]=pE(D,H)+(1-p)E(D,D)(2)

当p[,D]=p[,H]时,“鹰”和“鸽”就会有相同的收益,此时种群就会处于ESS的稳定状态。由(1)式和(2)式可得:

pE(H,H)+(1-p)E(H,D)=pE(D,H)+(1-p)E(D,D)

p(V-W)/2+(1-p)V=p·0+(1-p)(V/2-T)

化简,得:

(W/2+T)p=V/2+T

最后,得:

p=(V+2T)/(W+2T)(3)

将W、V、T的实际数值代入(3)式计算,得:

p=(V+2T)/(W+2T)=(10+6)/(20+6)=8/13

就是说,当种群中“鹰”与“鸽”的比例为8∶5时,“鹰”与“鸽”的平均收益是相等的。此时的策略即为ESS,“鹰”与“鸽”之比对ESS的任何偏离都将受到自然选择的压力而回到这一比例。确立了ESS的种群的稳定不是因为它特别有利于其中的个体,而是因为它没有内部背叛行为的隐患,从而有利于群体的稳定。ESS种群的稳定可以通过两种方法来实现:一种是每个个体均可以采取上述两种策略,但采取“鹰”式策略和“鸽”式策略的比例为8∶5,而且必须是随机的;另一种是每个个体只能采取一种策略,但“鹰”式策略者和“鸽”式策略者之间的比例为8∶5。

艾克斯罗德的研究表明,一报还一报在与众多使用不同策略的个体相互作用时,显示出惊人的成功,并且将继续繁荣,最终取代其他策略,而在个体之间未来贴现ω足够大的情况下,一报还一报还是一种ESS。因为一报还一报只有一步记忆,所以它最有效的挑战者就是全背叛策略和交替策略,如果这两个策略不能侵蚀一报还一报的话,就不会有其他策略能够侵蚀它了。这两个策略能否侵入一报还一报取决于ω的大小,当ω大于一定的临界值时,一报还一报就显示出明显的稳定优势:合作一旦固定下来,就不会受到任何突变策略的侵入。

但是,不可否认的是,不管ω值的大小,全背叛策略也是一种ESS。在一个全部由采取背叛策略个体组成的种群中,每个个体每步都背叛,若突变产生采用一报还一报策略的个体,该个体在第一步将因为对方背叛自己合作而损失利益,而且在将来也不会有任何机会补偿。这就引出了一个问题,一报还一报策略一旦固定下来就会保持稳定,但是它最初是如何打入“小人”世界的呢?答案是,“小人”的世界能阻止单个合作者的侵入,然而如果是合作群体,即使是一小群,也足以使合作有立足之地,并传播开来。因为小的合作群体相对于“小人”世界而言,似乎是可以忽略的一部分,但是对于它们自己而言,彼此之间的合作所带来的好处远大于小人之间背叛所带来的低收益。

诚然,小的群体可以在全背叛的环境中建立合作的机制,那么,在一报还一报策略固定下来以后,相反的情况是否会发生呢?也就是说,一报还一报策略不能被一单个个体侵入,但能否被这类个体的小群体侵入呢?事实上,如果一报还一报策略不能被单个个体侵入,那么它也不能被这类个体的小群体侵入。全背叛策略能够阻止采用任何策略的个体的侵入,但是,如果它们是小群体的话,全背叛策略就能够被侵入,这反映了全背叛策略不可避免的结构性弱点。但是,合作一旦建立起来,它就会永远持续下去。

四、合作策略的动机

通过对个体策略选择的分析,我们认识到,一个个体之所以采取合作策略是期待日后得到更大利益回报,在某些情况下,利他的个体比利己的个体更有利于自身的进化。事实上,在互惠利他行为的背后隐藏着自私的动机,利他是为了更好地利己,即表现型利他,基因型利己。道金斯的理论为我们进一步解释这一动机提供了某种启示。

道金斯认为自然选择的基本单位既不是物种,也不是群体甚至不是个体和染色体,而是基因。基因是绝对自私的,自私的基因既是遗传的基本单位,也是自然选择的基本单位。它的主要特性是:长寿,基因通过拷贝形式而实现延续和稳定;生育力强,基因具有较高的复制速率;复制的准确,基因不会湮没在性生殖、染色体分裂和重组之中,就像洗牌不会改变牌本身一样。从遗传学的角度看,个体或群体仅仅是一些临时聚合体或联合体,在漫长的进化过程中是不稳定的;染色体也像打出去的整副牌,要被混合甚至湮没。有机体一代代都死去,可是基因在个体的死亡中生存着,因而,有机体只是基因暂时的“运载工具”或“生存机器”,就像塞缪尔·巴特勒所说的“小鸡只是一个鸡蛋制造另一个鸡蛋的工具”。基因的这三个本质特征使它成为自然选择的终极单位,而基因的自私性则是各种生命行为的深刻原因。当然,我们说基因是自私的,但基因本身是没有自觉意识和目的性的,它们凭着自己的特性操纵着机体的行为。

基因通过编制程序支配它们的“运载工具”,而基因编制程序的目的,完全是为了自己的生存。基因为争取生存,直接同它们的等位基因进行你死我活的竞争,因为染色体上等位基因之间,在竞争基因位点中,谁能使自己的拷贝更多地存活下来,谁将最终代替对方。因此,生物进化中的自然选择可以说体现在一对等位基因的生存差异性上。虽然自然选择的直接形式总是在个体水平上表现出来,但是在进化中真正发生变化的是基因的相对频率。所谓进化,实际上指基因库中的某些基因变得多了,而另一些基因变得少了。最成功的基因是那些最有效地增加生物个体适合度的基因,适合度增加了,基因也就随之得以保存。对于基因成功与否的判断标准是冷酷无情的:优者胜,劣者汰。基因必须利己,不利己就不能生存。因而,在自然选择过程中,生物个体何时采取利己行为,何时采取利他行为,完全取决于保存基因的需要,在进化过程中被选择下来的行为,都将使个体在为增加自身基因在种群基因库中的比例的激烈竞争中得到巨大的成功。

对于互惠利他行为而言,当一个个体做出利他举动时,从表面上看似乎付出了适合度的代价,有损于个体生存和后代存活。但是,个体做出某种牺牲期待的是日后能够得到受益者相应的回报,因而合作实质上是自私的,只不过是利他的个体通过无私达到自利,通过利他达到利己,这是一种开明的自私自利。就像在动物中普遍存在的保姆行为,从长远观点看就是利己的动物通过借仔练习做保姆,积累照看孩子的实践经验,这样等将来自己有一天当了妈妈时能成为“育儿能手”,更好地养育自己的孩子,更多地繁殖后代、繁荣种群。保姆行为是奉献、服务和利他性的,但采取保姆行为的动物个体也期待在某种场合、某一时候得到对方的补偿。由此可以看出,在互惠利他行为中,指令这种行为的基因什么也没有丢失,相反,与该个体有关的基因在群体内出现的频率会增加并被保存下去,这也就是个体选择利他行为的最大动机。“个体可以对其他个体表现出道义和无私的行为,但利他行为的结果,使得他的基因比单纯的自私行为得到更多的繁殖机会。”[11] 43达尔文选择理论强调的是生存竞争,适者生存,在这里适者既不是个体,也不是群体,而是自私的基因,在基因层次上,自然选择理论得到新的表达。竞争与合作、自私与利他是个体在不同的生存环境中所采取的不同策略。合作与利他行为同达尔文自然选择学说并不相悖,竞争与合作不过是生物有机体进化的两种不同方式和途径。

标签:;  ;  ;  ;  

基于报酬的合作:生物竞争中的制胜策略_合作博弈论文
下载Doc文档

猜你喜欢