亲缘选择下不同博弈的收支比b/c对合作进化的影响论文

亲缘选择下不同博弈的收支比b /c 对合作进化的影响

岳休云

摘 要: 互惠利他主义、亲缘选择和种群选择等机制可以引导合作的进化。考虑不同博弈,引入亲缘选择机制,建立相应模型,讨论收支比b /c 对合作进化的作用。从两方面进行讨论,博弈次数确定时,囚徒困境和雪堆博弈下,b /c 在一定范围内逐渐增加有利于合作的进化,当b /c 达到某一定值后对合作的进化并无明显的作用,鹰鸽博弈下收支比b /c 逐渐减少有利于合作的进化;博弈次数不确定时,囚徒困境和雪堆博弈下b /c 在一定范围内逐渐增加促进合作的进化,鹰鸽博弈下b /c 在一定范围内逐渐减少促进合作的进化。

关键词: 互惠利他主义;亲缘选择机制;收支比b /c ;合作

1 引言

合作者(C)付出代价c ,另一个个体获得收益b ;背叛者(D)不需要付出任何代价。在进化博弈理论的框架[1]下:一个只包含合作者的种群,由于发生突变出现背叛者,变成了一个合作者和背叛者共存的混合种群,此时合作者相对背叛者繁殖率较低,所以合作者逐渐消失,最后种群完全由背叛者构成(图1)。进化的本质是突变和自然选择,而自然选择青睐背叛,所以自然选择需要相应的机制引导合作。Nowak[2]提出互惠利他主义、亲缘选择和种群选择可以有效地促进合作的进化。

自然选择青睐背叛

图1 由于突变和自然选择的作用,个体更加倾向选择背叛行为,一个完全的合作者群体逐渐被少量的背叛者入侵并且取代,在此过程中,背叛者相对合作者具有更高的适合度(繁殖速率),导致合作者逐渐消亡,最后种群完全由背叛者构成。

亲缘选择机制的本质在于,基因有关的两个体优先考虑与对方发生博弈。Hamilton[3]用r 表示亲缘选择的参数(非随机接触的概率),并且得出r >c /b 时,亲缘选择引导合作的进化。直接互惠表示:个体间的博弈进行了很多次。个体在每一次博弈时都有两种选择:合作(C)和背叛(D),重复接触的个体有可能会根据对方上一回合的行为来决定下一回合的选择(合作还是背叛)。直接互惠会产生很多策略,如TFT,ALLD,ALLC,WSLS,GTFT等策略。TFT(tit-for-tat)策略者第一次与其他个体博弈时会采取合作行为,如果对手上一次采取合作行为,那么TFT策略者这一次也会选择合作行为,如果对手上一次选择背叛行为,那么TFT策略者这一次也会选择背叛行为,TFT策略会根据对手的行为决定自己的行为。使用ALLD(always-defect)的个体每一次博弈都选择背叛行为。以重复的囚徒困境作为背景,Axelrod[4]研究直接互惠中的随机策略,最终发现TFT策略在引导个体选择合作行为上具有极强的优势。如果TFT策略被ALLD策略侵占并且取代,那么将无法找到任何一个策略可以战胜ALLD策略。所以TFT策略的稳定发展就是合作行为的稳定发展。Ale[5]等考虑亲缘选择与个体间重复接触的概率w 建立相应模型,研究结果表明:亲缘选择机制和w 的增加有利于合作的进化,但是亲缘选择下不同博弈的收支比b /c 对合作进化的影响还不太清楚,下文就这个问题展开分析和讨论。

2 模型与方法

考虑收益矩阵

(1)

其中,C 与D 分别表示合作和背叛,收益矩阵(1)表示:当C 与C 相遇时,C 获得的收益是a ;当C 与D 相遇时,C 获得的收益是b ,D 获得的收益是c ;当D 与D 相遇时,D 获得的收益是d 。

定义r (0<r <1)作为亲缘选择的参数,r 表示两个选择相同行为(合作或者背叛)的个体接触进而发生博弈行为的概率,称r 为非随机接触的概率,即两个选择相同行为的个体接触进而发生博弈行为的概率;1-r 为随机接触的概率,即个体在种群里面任意选择某个体接触进而发生博弈行为的概率。选择合作行为的个体与选择背叛行为的个体在种群中的比例对r 值没有影响。

母亲大概是被他太长时间的颓废状态气坏了,脱口而出,“你看看你现在的样子,人家好看的姑娘能跟你吗?”许诺就是被这句话打败了,他也就只配不好看的姑娘吧。于是,他妥协了,认命地接受了他的后半生。也有朋友调侃他,他跟丁小慧结婚,以后的人生简直少奋斗二十年。

由于亲缘选择下个体之间博弈的收益要兼顾随机接触与非随机接触,所以合作者与合作者博弈的收益要从两方面考虑,首先随机接触下,合作者以1-r 的概率随机遇到合作者,此时它的收益是(1-r )a ,另外合作者在非随机选择下以r 的概率遇到合作者,此时它的收益是ra ,兼顾两类接触可见,合作者此时的收益为(1-r )a +ra 。同理可得亲缘选择下背叛者与背叛者博弈的收益为(1-r )d +rd 。合作者与背叛者博弈,合作者以1-r 随机遇到背叛者,此时它的收益是(1-r )b ,另外合作者在非随机选择下以r 的概率遇到合作者,它的收益是ra ,兼顾两类接触,合作者此时的收益为(1-r )b +ra ,同理此时背叛者的博弈收益为(1-r )c +rd 。基于收益矩阵(1),兼顾两类接触可得

干孔作业具有施工速度快,工艺简单,对环境无污染等特点,一般分为机械成孔和人工挖孔。人工挖孔桩一般需要做刚性护壁,孔径一般在0.8~2.5m,孔深一般不大于30m;机械干作业成孔一般采用长螺旋钻(小直径桩)或旋挖钻(大直径桩),适用于地层条件简单的粉土、黏土、黄土、砂砾及风化岩层,孔深一般50m以内且高于地下水位至少2~5m。

(2)

(3)

兼顾个体的两类接触情况,得到亲缘选择下合作者与背叛者进行一次博弈时的收益矩阵为

(4)

TFT策略者、ALLD策略者相互之间,自身与自身进行博弈[6]的行为图如(5)所示。

(5)

在三种不同的博弈类型下,得到亲缘选择机制下TFT是进化稳定策略(ESS)的条件(14)、(15)、(16),由此给出囚徒困境、雪堆博弈和鹰鸽博弈下m 与b /c 的关系图(图2、3、4)。

(6)

在三种博弈类型[7]-[9]—囚徒困境、雪堆博弈和鹰鸽博弈下建立相关模型,讨论亲缘选择下b /c 对合作进化的影响。

3 亲缘选择下不同博弈的收支比 b / c 对合作进化的影响

3.1 假设个体间发生博弈的次数为m

考虑两策略A与B之间的收益矩阵

个体有合作和背叛两种选择,合作者遇到合作者,它们各自的收益都为b -c (b >c )。背叛者遇到背叛者,它们各自的收益都为0。合作者遇到背叛者,合作者的收益为-c ,背叛者的收益为b ,其收益矩阵如下

(7)

雪堆博弈:

若满足

“高官不如高薪,高薪不如高寿”“金山银山不如寿比南山”这些说法,广为人们接受。“健康就是幸福”“健康是人生最宝贵的财富”,成了当下大大小小医院墙体上、玻璃橱窗里广而告之的宣传用语。

大雪封路导致两名司机同时被困在回家的路上。铲雪表示合作行为,呆在车里休息属于背叛行为,两司机可以选择去铲雪或者待在车里休息。用b 表示两司机回家的收益,用-c 表示铲雪付出的代价。假如两个司机都去铲雪,那么两人的工作量都将减少一半,这时两人的收益都为b -c /2;假如两司机都在车里休息,只有等到铲雪的机器经过时,雪被机器清理干净后,他们才可以开车回家,这时他们的收益都为0;假如两司机其中一个人去铲雪,而另一个人在车里休息,那么铲雪的司机获益为b -c (b -c >0),休息的司机获益为b 。其收益矩阵如下

(8)

鹰鸽博弈:

假设存在两种策略:鹰策略和鸽策略,鹰策略是一种攻击性策略,鹰策略遇到鹰策略会让斗争加剧,之后一个鹰获胜,这过程既有收益又有损失。两个鸽策略者相遇,斗争比较温和,最后一鸽获胜,这过程中只有收益不会有损失。鹰策略者遇到鸽策略者,鹰策略者会让斗争变得更加残酷,此时鸽策略者会选择撤退,最后鹰获得全部收益,鸽由于撤退所以既没有收益也没有损失。假设斗争最后胜者获益为b ,败者付出的代价为c 。若两者都选择鸽策略(合作),它们不会出现损失,最终其中一个会获胜,其期望收益是b /2,若两者都选择鹰策略(背叛),此时它们成败的概率都是1/2,所以它们最后的期望收益是(b -c )/2,鹰策略遇到鸽策略,由于鸽策略者会选择撤退,鹰策略者不战而胜,此时鹰策略者获益为b ,鸽策略者获益为0。将鹰策略看成背叛行为,鸽策略看成合作行为。其收益矩阵为

(9)

由个体之间发生m 次博弈时,亲缘选择下TFT策略和ALLD策略的收益矩阵为(6),将囚徒困境,雪堆博弈和鹰鸽博弈的收益矩阵分别代入(6)式可得,个体之间发生博弈的次数为m 时,亲缘选择下三种不同博弈类型对应的TFT与ALLD的收益矩阵分别为(10)、(11)、(12)。

(10)

(11)

(12)

囚徒困境:

(13)

对于囚徒困境下的收益矩阵(10),若满足

m (b -c )>(1-r )b

即满足

(14)

上面的模型建立在博弈回合数为m 的前提下,假设两个体博弈结束,它们之间再次发生博弈的概率是w (0<w <1),那么它们发生博弈的平均次数为:

做好基建工程项目档案资料管理工作,可以为工程的各环节提供真实可靠数据,使工程项目顺利完成。在开展基建工程项目中,对档案资料进行科学化管理和监控,做好基建档案管理是一项必不可少的工作。

对于雪堆博弈下的收益矩阵(11),若满足

高中阶段的学生在学习历史知识的过程中,通过激发其兴趣,就有助于学生掌握有效科学的学习方法,学生在兴趣的基础上,能提高学习的效率。尤其是在新课改的背景下,高中历史教师要对学生掌握科学有效的教学方法充分重视,这是促进学生学习发展的重要举措,而从兴趣激发着手实施,就成为重要的突破口。再者,历史课堂教学中对学生学习兴趣的激发,能为学生营造和谐的课堂氛围,保持师生的默契配合。通过对学生兴趣的培养,也能有效减轻学生学习压力,促进学生快乐的学习。

即满足

1)乔化砧苹果苗。具有根系发达、树体高大、抗寒、抗旱、抗病、抗瘠薄能力强等特点。树体寿命长,树冠大,但管理较难,丰产、稳产性差,品质也不如矮化砧苹果树。适宜在贵州土地零散,地势不平整、土壤瘠薄的区域栽培。

(15)

时,TFT策略是ESS。

对于鹰鸽博弈下的收益矩阵(12),若满足

(16)

TFT策略是ESS。

图2 囚徒困境下,TFT是进化稳定策略的变量关系图

图3 雪堆博弈下,TFT是进化稳定策略的变量关系图

图4 鹰鸽博弈下,TFT是进化稳定策略的变量关系图

假设博弈进行的次数为m ,忽略个体出错及突变的情况,由(5)式可见TFT策略者与TFT策略者进行博弈时,两个体首次相遇都会选择合作行为,之后由于TFT策略的属性,它们彼此会采取对手上一次的博弈行为,两个TFT策略者往后会一直选择合作行为。由亲缘选择下合作者与背叛者进行一次博弈的收益矩阵(4)可知,两个TFT策略者发生m 次博弈获得的收益是ma 。ALLD策略者与ALLD策略者进行博弈,由于ALLD策略者的永恒背叛性,两个ALLD策略者会一直选择背叛行为,所以它们各自的收益都为m ·d 。TFT策略者与ALLD 策略者相互博弈,由TFT策略的属性可知它会在第一次博弈时选择合作行为,往后一直采用对手的行为,所以由亲缘选择下合作者与背叛者进行一次博弈的收益矩阵(4)可知此时TFT策略者的收益为1·[(1-r )b +ra ]+(m -1)·d ,ALLD策略者一直选择背叛行为,它获得的收益为1·[(1-r )c +rd ]+(m -1)·d 。个体间的博弈行为发生m 次时,亲缘选择下TFT策略者与ALLD策略者的收益矩阵为

由图2、图3及图4可见,亲缘系数r 越大,所需博弈次数越少,TFT策略是ESS的条件(14)、(15)、(16)更容易满足,所以亲缘选择机制在这三种博弈类型下都促进合作的进化。由图2、图3可见,m 随b /c 的增加而减小,但是随着b /c 的达到某定值时,变化不再明显,因此在囚徒困境与雪堆博弈的收益矩阵下,b /c 在一定范围内逐渐增加促进合作的进化,当b /c 达到某定值后对合作的进化没有明显的作用。由图4可见,m 随b /c 的增加而增加,所需博弈次数越来越多,TFT策略是ESS的条件(16)更加不容易满足,因此在鹰鸽博弈的收益矩阵下,b /c 的逐渐减少促进合作的进化。

3.2 博弈回合数不确定时

时,TFT策略是ESS。

(n →)

蒙田在《随笔集》的第三卷第九章中曾写道:“我写此书只为少数人,而且不图流传久远。如果此书的题材足以耐久,那就应当使用一种较为稳定的语言。”中世纪前期的法国在语言上是‘雅’与‘俗’的杂烩……凌驾于这些方言之上的是拉丁语[8]。到了文艺复兴时期,作为法兰西民族语的法语也仍处于形成阶段,蒙田及其同时期的作家如龙萨、杜贝莱等人,以法语书写篇章,使法语脱离中世纪的贫乏、停滞不前的状态。到了17世纪,现代法语基本形成,历经几百年,法语也成为世界上最为稳定而严谨的语言之一。正如蒙田所言:“有意义的优秀作品起到稳定语言的作用……”

(17)

基于三种不同博弈收益矩阵下TFT策略是ESS的条件(14)、(15)、(16)中的m 此时用1/(1-w )替代,得到囚徒困境下

使用传统他手术进行治疗,让病患平卧,全麻病患,头部稍向后仰,将手术区域暴露,于胸骨前切出8至10毫米的切口,离断甲状腺前肌群与颈阔肌,将切口缝合。

(18)

则TFT是ESS。

雪堆博弈下

一个由A策略者构成的无限大种群,假如有极少的B策略者入侵,A策略者与B策略者的收益矩阵为(13),若a >c ,则A策略是进化稳定策略[10](ESS),自然选择会抵制B策略入侵A策略。假设个体间发生m 次博弈,亲缘选择下三种博弈类型对应的TFT策略与ALLD策略的收益矩阵(10)、(11)、(12),由进化稳定策略的定义可知

我们从上述看出,这时期体育改革推动体育公共服务建设和完善,以青少年体质健康和老年人健康为重点加快了体育公共服务改革,逐步形成以政府服务为主体,以社会和市场机制为补充的体育公共服务体系。

(19)

则TFT是ESS。

鹰鸽博弈下

其最优分配方法为Adam(s)法,即s的算术平均绝对偏差法,做法是在进行预分配后,将剩余席位优先分给预-后分配率算术平均Ai(s)=(si-+si+)/2与总分配率s的偏差s-Ai(s)最大的部门.且指标s-Ai(s)最大等价于偏差Hi(r)-r最大,而通常使用的Q值方法相当于指标Gi(r)-r最大优先法,其中H(r)与G(r)表示代表率r=s-1的调和平均与几何平均.由于Huntington的Q值法不满足公理Ax.6,所以相比之下,Adam(s)法优于Huntington的Q值法.而在1913年之后,美国国会众议院的席位就大致固定在435席,所以应该采用Rdam(s)法。

(20)

则TFT是ESS。

面板特设抗高温防滑硅胶圈,让锅具安放更稳妥,可以轻松拆卸,清洗更便捷;加大专用防滑脚垫,让使用过程也能更加稳固安全。

考虑各个参数的取值范围,固定亲缘系数r =0.2得出三种博弈收益矩阵下TFT是ESS时b /c 与w 的关系图如下:

图5 r =0.2不同博弈下 b / c w 的关系图

由图5可见,令亲缘参数r =0.2。在囚徒困境与雪堆博弈下,b /c 在定区间内逐渐增加有利于合作的进化。在鹰鸽博弈下,b /c 在定区间内逐渐减少有利于合作的进化。

4 结论

将亲缘选择机制引入到不同的博弈类型中,从个体之间发生博弈的次数确定以及不确定两种情况进行讨论,建立相应模型,通过TFT是进化稳定策略(ESS)的条件分析可得:针对三种不同的博弈类型,亲缘选择都有利于合作的进化。

亲缘选择机制下,个体之间发生博弈的次数确定时,囚徒困境和雪堆博弈下b /c 在一定范围内逐渐增加有利于合作的进化,当b /c 增加到某一定值后对合作的进化并无明显的作用;鹰鸽博弈下b /c 的逐渐减少有利于合作的进化。

RJ版教科书与CM教科书中分别有4.76%和3.39%的例题背景是无实际意义的,如CM教科书中的一道例题(如图11所示).

亲缘选择机制下,个体之间发生博弈的次数不确定时,囚徒困境和雪堆博弈下,b /c 在一定范围内逐渐增加促进合作的进化;鹰鸽博弈下b /c 在一定范围内逐渐减少促进合作的进化。

[参 考 文 献]

[1] Nowak, M. A.进化动力学:探索生命的方程[M]. 北京:高等教育出版社,2010.

[2] Nowak, M. A . Five Rules for the Evolution of Cooperation[J]. Science, 2006, 314(5805):1560-1563.

[3] Hamilton W D. Thegenetical evolution of social behaviour. I.[J]. Journal of Theoretical Biology,1964, 7(1):1-16.

[4] Axelrod R , Hamilton W D . The evolution of cooperation[J]. Science, 1996, 211.

[5] Ale S B, Brown J S, Sullivan A T. Evolution of Cooperation: Combining Kin Selection and Reciprocal Altruism into Matrix Games with Social Dilemmas. PloS one, 2013, 8(5): e63761.

[6] Imhof L A, Fudenberg D, Nowak M A, et al. Evolutionary Cycles of Cooperation and Defection[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(31):10797-10800.

[7] Kummerli R , Colliard C , Fiechter N , et al. Human cooperation in social dilemmas: comparing the Snowdrift game with the Prisoner\"s Dilemma[J]. Proceedings of the Royal Society B: Biological Sciences, 2007, 274(1628):2965-2970.

[8] Zhang H ,Gao M , Wang W , et al. Evolutionary prisoner’s dilemma game on graphs and social networks with external constraint[J]. Journal of Theoretical Biology, 2014, 358:122-131.

[9] Doebeli M , Hauert C . Models of cooperation based on the Prisoner's Dilemma and the Snowdrift game[J]. Ecology Letters, 2010, 8(7):748-766.

[10] Schaffer M E . Evolutionarily stable strategies for a finite population and a variable contest size[J]. Journal of Theoretical Biology, 1988, 132(4):469-478.

中图分类号: O211.9

文献标识码: A

文章编号: 1673- 1794( 2019) 05- 0026- 05

作者简介: 岳休云,皖南医学院公共基础学院教师(安徽 芜湖 241002)。

基金项目: 皖南医学院科学研究项目(WK2018Z08)

收稿日期: 2019- 07- 09

责任编辑:刘海涛

标签:;  ;  ;  ;  ;  ;  

亲缘选择下不同博弈的收支比b/c对合作进化的影响论文
下载Doc文档

猜你喜欢