报酬激励下遗失物归还的演化博弈分析论文_古俊杰

北京物资学院北京 101149

摘要：个体行为会对社会整体产生影响，在遗失物制度中，将报酬法定，采用演化博弈的方法，分析拾得人与遗失人之间的博弈，得出有限博弈方在长期的学习和策略调整之后，最终会收敛于拾得人采取“不归还”策略，遗失人采取“给予报酬”策略的均衡。这为报酬法定的设立提供了一定的理论依据，并有利于遗失物制度落实的有效性和高效性。

关键词：报酬激励；报酬请求权；演化博弈；遗失物制度

随着个人权利的觉醒，有关遗失物拾得人向遗失人索要酬谢费用的事件层出不穷，若没有合理的制度进行引导，可能会产生不好的社会导向。本文从演化博弈的角度，分析遗失人与拾得人在报酬激励下进行遗失物归还选择的过程，期待为报酬法定提供一些理论支撑。

一、理论介绍

由于制度的规范群体中，成员的学习能力差别较大，不能认为博弈方是某一种确定的类型，因此分析大群体成员的随机配对形成的反复博弈，选择的博弈是动态策略调整博弈。在这个演化博弈过程中，博弈方学习速度对趋于稳定性的进程不产生影响，学习速度较慢的博弈方会表现为向优势策略转变，策略调整速度可用复制动态公式来表示[ ]。本文由于博弈双方采取的策略和得益都不对称，所以是一个非对称博弈。

二、博弈分析

在这个博弈中，博弈双方为拾得人和遗失人。我们假设拾得人可选择归还或者不归还，这里所讲述的归还包括拾得人自己寻找遗失人主动归还，也包括拾得人将遗失物上交的情况；不归这里指的是拾得人的选择，而不是拾得遗失物的最后结果。相应的，遗失人可选择给拾得人报酬作为激励和答谢，也可选择不给报酬，假设遗失人有在积极寻找遗失物，物的价值要大于所给付的报酬，遗失人的总成本（不包括报酬）为r，遗失物自身价值为a，报酬为e，报酬的存在给遗失人带来的隐形福利为n，遗失物对于遗失人特殊的价值为q。此外假设拾得人付出的成本为c，有报酬激励时所可能承担的道德负担为m1，没有报酬激励时可能承担的道德负担为m2。表1中得益矩阵表示的就是一个关于遗失物归还的博弈，为后续的简化计算，将表1中效益用括号中的字母表示。

表1 遗失物归还博弈

对有限理性的博弈方，不管是哪种策略总会有部分博弈方采用。故假设在这个遗失物归还的群体中，拾得人选择归还的比例为w，不归还的比例为1-w；遗失人选择给予报酬策略的比例为y，不给报酬策略的比例是1-y。用u拾还和u拾不来分别表示作为拾得人博弈方选择归还和不归还策略的期望得益，用u拾表示拾得人群体的平均得益。

u拾=w*u拾还+(1-w)*u拾不=w*[y*A+(1-y)*C]+(1-w)*[y*E+(1-y)*G]

同样用u遗给和u遗不来分别表示作为遗失人博弈方选择给予报酬和不给报酬策略的期望得益，用u遗表示遗失人群体的平均得益，分别为

u遗=y*u遗给+(1-y)*u遗不=y*[w*B+(1-w)*F]+(1-y)*[w*D+(1-w)*H]

在这个博弈中，模仿对象数量的多少和模仿的成功程度影响着博弈方学习模仿的速度，因为这两个因素关系到观察和模仿的难易程度、判断差异的难易程度和对模仿激励的大小[2]。动态微分方程可表示出来这个动态变化速度。现在可得到拾得人博弈方类型比例的复制动态方程为

遗失人博弈方类型比例的复制动态方程为

将表1中的具体成本效益带入拾得人博弈方的复制动态方程，可进一步分析。

不难发现，当时，始终为0，也就是所有的w都是稳定状态；当时，w*=0和w*=1是w的两个稳定状态；当时，仍然是w*=0和w*=1是w的两个稳定状态。

作为进化稳定策略的点w*，除了本身必须是均衡状态外，还必须能够禁受住偶然的偏离，即在稳定状态处，的导数F（w*）必须是小于0的，这是微分方程的“稳定性定理”。

所以当时，w*=0和w*=1虽然是w的两个稳定状态，但只有w*=1是进化稳定策略；当时，只有w*=0是进化稳定策略。

同样地，遗失人作为博弈的另一方，根据其动态复制方程也可进一步分析。

当时，是一直为0的，此时所有的y都处于稳定状态；当时，只有y*=0是进化稳定策略；当时，只有y*=1是进化稳定策略。

接下来将两个群体类型比例变化复制动态的关系用一个坐标平面图表示出来，如图1所示。

图1 非对称拾得人遗失人两博弈方群体复制动态和稳定性

在图中和都不是具体的数值，但这些字母代表着一定的含义。在这个非对称博弈中，w*=1、y*=0和w*=0、y*=1是这个博弈的进化稳定策略。一般动态过程究竟会向那个方向发展，取决于博弈方采用策略比例的初始状态,复制动态进化博弈的结果常常取决于带有很大偶然性的初始状态。

当初始情况在B区域，会收敛到进化稳定策略w*=1、y*=0，即拾得人群体都采用“归还”策略，遗失人群体都采用“不给报酬”策略；当初始情况在C区域时，会收敛到进化稳定策略w*=0、y*=1,即拾得人群体都采用“不归还”策略，遗失人群体都选择“给予报酬”。

当初始情况落在A和D两个区域时，和数值的大小影响着初始状态选择策略人数的多少。若我们假设和都是大于二分之一的，那么很大可能最后收敛到进化稳定策略w*=0、y*=1。

三、结论

可见社会稳定性的趋势是要根据现在我国遗失物制度的实施现状来进行判断的。在报酬激励下，拾得人与遗失人的博弈最终会呈现两种情况：一是拾得人群体“归还”，遗失人群体“不给报酬”；二是拾得人群体“不归还”，遗失人群体选择“给予报酬”。很明显现实生活中悬赏广告的出现，就是博弈期间出现了采取收益策略占优势的一方，其他人会学着调整策略来使自己获得较大利益，即倾向于第二种选择。既然如此，我们可将其以制度条例的形式确定下来，促进稳定转化过程。当然无论是从法律物权方面，还是从道德方面，我们都是不支持拾得人在拾得遗失物时，事实上将其占为己有的。故本文认为应在遗失物制度中纳入报酬激励措施，减少社会交易成本，依靠制度的完善，来保障精神文明的建设。

参考文献

[1]谢识予.经济博弈论[M].上海：复旦大学出版社，2007.

[2]易余胤,刘汉民.经济研究中的演化博弈理论[J].商业经济与管理,2005(08):8-13.

论文作者:古俊杰

论文发表刊物:《基层建设》2019年第26期

论文发表时间:2019/12/16

标签：拾得论文; 报酬论文; 策略论文; 稳定论文; 遗失物论文; 动态论文; 人群论文; 《基层建设》2019年第26期论文;

报酬激励下遗失物归还的演化博弈分析论文_古俊杰

猜你喜欢