非合作博弈的扩展分析:加入共同代理角色
张 帅
(潍坊学院,山东 潍坊 261061)
摘 要: 由于共同代理能实现一定程度的合作,那么将共同代理引入非合作博弈中,能解决“囚徒困境”的问题。本文的结论是:共同代理以与委托人组成联盟的方式参与非合作博弈,联盟具有协同效应,而且联盟会对联盟外的委托人造成损害。当满足一定条件时,在非合作博弈中加入共同代理能够实现一定程度的合作,整体收益和个体收益都会增加。
关键词: 共同代理;非合作博弈
引言
非合作博弈的均衡结果经常会出现“囚徒困境”的局面,即参与人同时不合作的行动使得整体的收益最小,而且并不能实现个体收益的最大化。解决“囚徒困境”一般采用的方法是无限次重复博弈和策略性让步,这两种方法能比较有效的使非合作博弈中实现一定程度的“合作”。
近年来,该矿区的矿产资源开发在为国家经济发展做出巨大贡献的同时,也使得流域的生态环境受到了很大程度的破坏。一些地方土法炼金使地表水和地下水受到氰化物污染,当地牧民癌症高发[1];某些地方铜铅锌选矿废水长期向江河排放,饮用水源受到污染,导致局部河段水产资源发生变异。矿产开发对雅砻江水质乃至流域的生态环境有着深远的影响,甚至危及到人民生产及生活。
“联盟”是合作博弈中的概念,它是指存在具有约束力的协议时每个参与者根据自己的利益与其他部分的参与者组成的小集团。联盟是合作的最直接表现,参与者组成联盟并实现联盟利益的最大化,这是参与者的集体理性。当然参与者组成联盟也必须满足个体理性,即参与者从联盟分到的利益不能低于它自己能保证的最低收益。可以说,联盟是合作的载体。但是,在非合作博弈中参与者是不可能组成联盟的,原因有两个:第一是非合作博弈中不存在具有约束力的协议,联盟利益不能保证;二是非合作博弈中的参与者同时采取行动,不能在博弈开始前进行协商。所以,在传统的非合作博弈中,合作不能通过联盟来实现。那么,问题是:怎样对非合作博弈进行扩展才能使联盟能够应用于非合作博弈呢?本文试图通过将共同代理引入非合作博弈中以解决问题。
目前研究表明,分期越晚的恶性肿瘤患者血液中越容易检测到CTC,但尚未证实CTC数目与肿瘤TNM分期有相关性[11-12]。本研究发现,Ⅰ、Ⅱ、Ⅲ及Ⅳ期胃癌中均有CTC,其中阳性率分别为36.4%、50.0%、61.9%和50.0%;CTC阳性率与胃癌的分期无明显相关性,早期胃癌患者外周循环血中也可以出现CTC。胃癌患者CTC阳性与患者的年龄、性别、肿瘤位置、CEA、CA19-9、胃癌早期/进展期、肿瘤大小、分化程度、Borrmann分型、淋巴结转移、远处转移及TNM分期等无关。因此,早期与进展期胃癌患者的肿瘤细胞均有进入血液循环的可能,形成肿瘤转移的“种子”。
共同代理是指一个主体(代理人)的行动能够同时影响多个参与者(委托人)的收益状况,这些参与者的偏好往往是冲突的。自1985年Bernheim&Whinston(1985,1986)提出共同代理问题以及基本模型以来,共同代理框架内的研究问题及方法可以说百花齐放。学者们构建了多种模型并证明了一个基本的结论:在共同代理下,委托人合谋能实现更高的收益(Bernheim&Whinston,1985、1986)。这里的合谋本质上与合作博弈中的联盟是一致的,那么也就是说,共同代理能够使联盟出现。所以,又有一个问题:如果将共同代理纳入非合作博弈中,联盟是不是也能够解决“囚徒困境”?从博弈的角度来看,当多个委托人选择独立代理的方式进行竞争时(共同代理不存在时),这就是一个传统的委托人之间的非合作博弈,博弈的均衡结果使得整体收益最小,每个委托人的收益也不会最大,均衡结果效率很低。但是,当多个委托人选择共同代理方式时,传统的非合作博弈就有个改变:第一,共同代理人不属于非合作博弈的参与者,它可以与非合作博弈的参与者进行协商或者签订具有约束力的协议,即共同代理人可以选择与参与者组成联盟,一旦联盟形成,共同代理人变成非合作博弈的参与者,目标是最大化联盟的利益;第二,共同代理人不论是否与参与者联盟,他的行动都会影响所有参与者的收益状况,即非合作博弈的参与者的收益不仅仅受其他参与者行动的影响,而且受共同代理人行动的影响。因此,在非合作博弈中加入一个共同代理的角色之后,联盟就可能组成,合作也就有可能实现。当然,联盟必须符合联盟者的集体理性、联盟理性和个体理性,因此,联盟的出现是有条件的。如果当满足一定条件时,非合作博弈的整体收益、所有参与者的个体收益以及共同代理的个体收益都能增加的话,“囚徒困境”就得到了解决。
一、对“鹰鸽博弈”的扩展
(一)传统“鹰鸽博弈”及均衡结果
根据沙普利值的结果,当即时,厂商1 和2 的平均收益都增加了。当时,零售商3 的平均收益增加,因为,一定成立。
通过对教学知识点及技能点的分析梳理,结合电商职业技能鉴定要求,拟建实践教学基地建筑面积约200平方米,按照企业实际电商工作场景,引入企业真实工作没项目,设置4个电商(商务秘书)职业场景实验室,细分为19个具体项目,配置76个标准工作位,并依据企业真实项目灵活调整,以培养学生电商(商务秘书)实践应用和创新创业能力为目标,将企业真实工作项目融入电商实践课程。使教学内容具体化、任务化、场景化。每个项目任务都是电商(商务秘书)一项场景实验室系列学习任务,教学内容安排围绕电商场景实验室任务来完成。
其中,当两国都表现出鹰态时,双方都损失2个单位,并平分资源。
在这个非合作博弈中,(鹰,鹰)是一个严格占优的策略,即无论对方国家的策略如何,本国最优的策略都是鹰态。在(鹰,鹰)的策略下,双方都获得3 各单位的收益,整体收益为6 个单位。从上面矩阵可以看出,非合作博弈下实现的结果使得整体收益最小,效率很低。
(二)对“鹰鸽博弈”的扩展
假设有一个第三国3,它可以与两个国家中的任何一个组成联盟,并为其联盟的国家提供武力支持。当3 与1 组成联盟时,收益矩阵如下:
其中当两国都表现出鹰态时,由于1 国与3国联盟,它们会夺得整个资源的拥有权,但双方都还要损失2 个单位。
在这种情况下,博弈的占优策略是(鹰,鸽),即不论2 国的策略如何,1 和3 的联盟的最优策略都是鹰态;不论1 和3 的策略如何,2 国的最优策略都是鸽态。此时,非合作博弈实现的整体收益为10 个单位,效率很高。1 和3 的联盟获得的收益为10,联盟的收益大于不参加联盟时1 国收益(3 个单位)和3 国(0 的单位)的和;2 国获得的收益为0。可以得到一个结论:在扩展的“鹰鸽博弈”中,1 和3 的联盟能使整体收益增加,而且能使联盟内的个体收益也增加。
同样地,3 也可以与2 联盟。
(三)联盟收益的分配
在扩展的“鹰鸽博弈”中,3 国可以与1 国联盟也可以与2 国联盟,那么如何计算所有可能情况下每个国家能够分配的收益呢?本文利用合作博弈下基于每位参与者对联盟的期望边际贡献得来的沙普利值计算在所有可能情况下每个国家能够分得的收益的加权平均数。沙普利值是通过考虑各个主体做出的贡献来公平的分配合作收益,某一参与主体的沙普利值是该主体对于一个合作项目所期望的贡献量的平均值。
扩大经营规模,是实现可持续发展的必要条件。要抓住集团公司快速发展的良好机遇期,改革营销体制,发挥专业优势,坚持“内部市场为主、外部市场为辅”的原则,努力打造加工制造、钢结构工程、租赁业务市场,做大营销规模,将规模优势转化为发展优势。
(4)对老旧管线的清管作业,应事先根据管道实际情况,有选择地在适当位置断管,摸清管道内黑粉情况,然后选择适当的清管器,并采取多段清管的方式清除管道内黑粉。
“30年前,我审别人;30年后,我被别人审,我怎么也没有想到自己会有这一天。”从“好同志”到“阶下囚”,李青海的角色转换似乎颇具戏剧性,然而听了他讲述自身成长经历和思想转变后,其身陷囹圄的结局就不令人惊奇了。
其中N 表示所有可能联盟S 的集合是联盟S 的成员数量。
在铁腕重拳整治下,近3年全市共查获食品药品违法案件4898件,移送司法机关276件,食品安全满意度不断上升,2015年公众食品安全满意度达81.22%,较2013年提升15.29个百分点。全市食品药品安全形势稳定趋好。
4.{1,2,3}
1.{1}、{2}、{3}
命题二:在传统的“古诺双寡头模型”中加入共同代理人(共同的零售商)之后,在满足一定的条件下,博弈的整体收益和个体平均收益会实现帕累托改进。
2.{1,3}、{2}
翻转课堂中,教师对学生的影响是由始至终的,实际上学生也同时影响着教师的教学活动。翻转课堂中的师生互动关系在实际教学中开始的更早,教师的教学内容在进入课堂之前就已经通过网络平台传达给学生了。从图中可以看出,翻转课堂的教学模式是连续互动的过程。
3 国与1 国组成联盟,此时的结果就是扩展的“鹰鸽博弈”下的均衡(鹰,鸽),各个联盟的收益为。
3.{2,3}、{1}
3 国与2 国组成联盟,根据博弈的对称性,此时的结果为(鸽,鹰),各个联盟的收益为:。
要计算沙普利值,首先要找到所有可能的联盟结构并计算所有可能联盟结构下各个联盟的收益状况。
3 国与1 国、2 国组成总联盟,此时的联盟收益。
3 选择与1 和2 组成联盟,根据假设1 和2都知道3 会把垄断产量投入市场,根据博弈的对称性可得,1 和2 的均衡产量是;1、2、3的联盟收益是。
定义 5 设(T,[·,·],α,δ)是Hom-Jordan李代数,(V,ρA)为T-模,则线性映射⊗2→V称为2-上圈,满足下面等式成立:
命题一:在传统的“鹰鸽博弈”中加入“第三国”后,能使博弈的整体收益实现帕累托改进,并且每个个体能分配到的平均收益也实现帕累托改进。
证明:在传统的“鹰鸽博弈”中加入“第三国”后,不论第三国与哪一个国家组成联盟,联盟的收益总是大于联盟前第三国的收益与联盟国收益的和,因此,联盟是一定会发生的。存在联盟的博弈均衡结果会使整体收益由6个单位变成10个单位,即联盟能使整体收益增加。
上海华谊能源化工有限公司多年来始终将培育安全文化作为公司企业文化建设的重要组成部分,注重安全文化对企业安全生产的引领、保障作用,坚持安全文化建设以人为本,营造了人人参与安全文化建设的浓厚氛围,使安全生产不仅成为一个目标,更成为员工的一种生活习惯、工作方式。
各国的沙普利值代表了所有可能联盟情况下各个国家能分得的收益的加权平均数,其中1 国和2 国的平均收益为(即三个国家都不联盟时,1、2 国的收益是3),3 国的平均收益(即三个国家都不联盟时,3 国的收益是0)。可以说,联盟使得每个个体的平均收益都增加。证毕。
二、对“古诺双寡头模型”的扩展
(一)传统“古诺双寡头模型”及均衡结果
市场上有两家厂商1、2,这两家厂商生产相同的产品,用代表厂商的产量,用代表市场的总产量。P 为市场出清的价格,P 是市场总产量的函数。这两家厂商没有固定成本,生产成本,。这两家厂商同时决定产量。厂商的利润为。
非合作下,企业i 的最优产量满足:
厂商的均衡产量为厂商的均衡利润为。
(二)对“古诺双寡头模型”的扩展
假设两家厂商同时选择一家零售商(记为3),零售商决定每个企业产品投入市场的数量,记为。市场出清价格P 由和决定,。
3 可以选择不与任何厂商组成联盟,那么3会把企业1,2 的全部产品投入市场,即;如果3 选择与1(或2)组成联盟,那么3 会把1(或2)的全部产品投入市场,而把2(或1)的一半产品投入市场① 3 将2(或1)的一半产品投入市场是本文模型的一个具体化的假设,一般化的模型是用一个比例δ ,来表示3 投入市场的厂商2(或1)的产品数量,然后根据联盟收益的最大化来决定最优的δ ,在本文第三部分的一般化模型中就采用了这种方法。,即(或);如果3 与1 和2 都组成联盟,那么3 会把垄断总产量(即)投入市场,联盟的利益为垄断利润(即)② 这个假设是为了保证博弈是有结合力的,即总联盟的收益比任何一个小联盟的收益高。 。③ 这些都是市场信息,即1,2,3 的公共信息。 当3 与厂商组成联盟时,它要与联盟的厂商一起分享联盟收益;当3 不与厂商组成联盟时,3 的收益是厂商销售额的一定比例(记为)的抽成。
(三)联盟收益的分配
在扩展的“古诺双寡头模型”中,所有可能的联盟结构有:
1.{1}、{2}、{3}
3 不与1 和2 组成联盟,此时的结果就是传统“古诺双寡头模型”的均衡,1 和2 的均衡产量是;1、2、3 的均衡收益是,;整体收益为。
2.{1,3}、{2}
3 选择与1 组成联盟,那么1 和2 的均衡产量满足:
1 和2 的均衡产量是;1 和3的联盟、2 的均衡收益是;整体收益为。
3.{2,3}、{1}
3 选择与2 组成联盟,根据博弈的对称性,这种博弈结构下的结果与第二种情况的结果实对称的,即1 和2 的均衡产量是;2 和3的联盟、1 的均衡收益是;整体收益为。
4.{1,2,3}
应用沙普利定理,计算各国的沙普利值,结果为。
同样的,利用沙普利定理计算所有可能联盟情况下厂商1、2 和零售商3 能够分配得的收益的加权平均数,结果为,。
3 国不参与到1 和2 的冲突中,此时的结果就是传统“鹰鸽博弈”下的均衡(鹰,鹰),各个联盟的收益为。
证明:传统的“古诺双寡头模型”加入共同的零售商后,在本文模型设定下,总联盟的收益一定大于联盟前的整体收益,因为垄断利润一定大于寡头竞争的总利润。当满足即时,1 和3(或2 和3)的联盟收益大于联盟前的收益。
当满足这一条件时,任何联盟都能使整体收益增加。
两个国家1,2 的边界上有一个庞大的油田,但油田的拥有权并没有清楚界定,所以两国之间发生了冲突。在冲突中,两国的策略组合及收益如下二阶矩阵:
当满足这一条件时,联盟能使厂商1 和2 以及零售商3 的平均收益都增加了。
命题三:在传统的“古诺双寡头模型”中加入共同代理人(共同的零售商)之后,在一定的条件下,博弈的整体收益增加,但个体平均收益不都会增加,也就是说,可能会出现共同代理的平均收益增加,但两个厂商的收益不增加的情况。当整体收益增加而厂商的收益没有增加的原因是共同代理对联盟的贡献更大,因此分配了更多的收益。
证明:借鉴命题二的证明过程,当满足这一条件时,任何联盟都能使整体收益增加;当不满足这一条件时,总联盟的整体收益也增加了。当不满足这一条件时,厂商1 和2 的平均收益不会增加。
总联盟下当不满足时,虽然整体收益增加了,但厂商的平均收益没有增加。这是因为,共同代理分配了更多的收益,表现在共同代理的沙普利值变大。沙普利值代表每个参与人在各种可能联盟情况下分得的收益的加权平均数,它衡量了每个参与人对各个联盟的边际贡献,贡献越大,沙普利值越高。当总联盟下当不满足时,共同代理对联盟的贡献要更大,因此沙普利值变大,共同代理也就分配了更多的收益。证毕。
三、存在共同代理的一般化模型
(一)基本假设
经济中有三个主体,N ={1,2,3},其中1,2 是委托人(非合作博弈的参与者),3 是共同代理人。假设1,2 同时且独立的与3 签订委托代理合同,也就是说,1 和2 都不知道3 是他们的共同代理人① 这里的假设与扩展的“古诺双寡头模型”的假设不同。 。为了简化问题,假设委托人分配给3 的任务是破坏对方使其遭受损失,委托人1,2 分别给3制定了任务量,记为,其中是1 给3 的任务(使2 遭受的损失)是2 给3 的任务(使1 遭受的损失)。1 和2 给3 的报酬结构是对方实际损失的函数,记为,其中表示主体j 遭受的实际损失。
假设委托人1 和2 竞争的项目的最大收益为1个单位,但如果1 和2 之间存在竞争,即互相使对方遭受损失的话,项目的收益会下降,用表示项目的收益,满足。为了分析的方便,把收益函数具体化为。
委托人1 从项目收益中分得的收益记为W1 ,委托人2 从项目收益中分得的收益记为W2 ,满足W1 +W2 =。为了分析的方便,把W1 和W2 具体化为:
当时,W1和W2 的分配要依据委托人1 和2 的客观条件,假设1 和2 能保证的最低的收益为和,此时,,是一个随机变量,满足。记为不影响委托人收益分配的最大损失,即损失小于时,委托人可以不受其影响,但是当损失大于时,委托人的收益分配受到影响。
当时,、。
共同代理人3 可以选择与委托人1(或2)组成联盟,当联盟成立后,3 会完全完成委托人1(或2)的任务,即(或),但只会完成2(或1)交给任务的一定比例δ ,,即(或)。如果代理人3 选择同时与1 和2 组成联盟,那么3 不会完成任何任务,即,实现的联盟收益为项目的最大收益1。
(二)均衡结果分析
1.非合作博弈的均衡结果
根据沙普利定理(Shaoley,1953),沙普利值的计算公式如下:
在非合作博弈下,委托人1 和2 虽然选择同一个代理人3,但此时3 仅仅是两个独立的委托代理关系中的代理人,3 不参与该非合作博弈,即3 完全的完成委托人的任务,并获得按报酬结构支付的报酬。
吕盛华指出,除了消费动机、产品属性和渠道选择方面的变化,品类的扩张、产品结构的升级以及高端家电品牌的变化也是过去十年间家电市场发展的重要内容。
委托人1 和2 同时决定最优的选择和,满足:
根据博弈的对称性,得到:,满足。整体收益为,委托人的收益为、益为。
2.选择与某一个委托人(1 或2)联盟的结果
以3 与1 联盟为例。因为2 不知道3 的共同代理身份,因此,2 的最优选择仍然是非合作博弈下的均衡结果,即。1 和3 的联盟在2 的最优选择下选择和最大化联盟的收益。
当时,满足:
在河道深基础开挖施工中,对基坑的降水及防止流沙造成的基坑坍塌是方案中的关键部分,对于一般工程,采取必要的人工降水(如轻型井点降水、深井降水)或抗渗围护等措施均能满足施工要求。但是当遇到地下水文地质情况较为复杂时(如遇流沙时),会为施工过程带来很大的不便。在进行陕西榆横铁路白城河特大桥41#桥墩基础施工时,因地下水、流沙及基坑垮塌而拖延工期几个月。本文对该工程实施过程进行全程跟踪,收集了一些现场资料,现针对沙漠地区河道深基础开挖施工时预防地下水及流沙的处理方法进行简单总结。
根据一阶条件,解得。整体收益为,1 和3 联盟的收益,委托人2 的收益为。
同样地,可以得到3 选择与2 联盟的结果,即。整体收益为,2 和3 联盟的收益为,委托人1 的收益为。
3.选择与两个委托人1 和2 联盟的结果
当3 同时与两个委托人联盟时,根据假设,,联盟的收益为。
利用沙普利定理计算所有可能联盟情况下厂商1、2 和零售商3 能够分配得的收益的加权平均数,结果为:
命题四:在一般化的共同代理框架下,共同代理作为委托人非合作博弈之外的主体,它可以选择不参与该非合作博弈(不与委托人组成联盟),也可以选择与委托人组成联盟参与到非合作博弈中。当满足一定条件时,共同代理与委托人组成联盟能实现整体收益和个体收益都会增加。
证明:当共同代理不参与委托人的非合作博弈时,整体收益为,委托人均衡的收益分别为、,共同代理的收益为:;当共同代理与1 组成联盟时,整体收益为,联盟的收益为;当共同代理与2 组成联盟时,整体收益为,联盟的收益为。
因为,所以一定成立。可以得到结论:任何联盟都能使整体收益增加。
当满足并且这一条件时时,即满足,1 和3 的联盟以及2 和3 的联盟具有协同效应,符合联盟理性。
当满足和条件时,即满足,联盟使得委托人1 和2、共同代理3 的个体收益增加,证毕。
将标准化数据带入上面公式后,根据三个主成分的线性方程可计算出土壤样本在3个主成分上的得分,再根据综合得分公式,F=∑bjZj=b1Z1+b2Z2+…+bjZj,其中b为各主成分的贡献率,求得49个土壤样本的综合得分F值列于表4。
命题五:在一般化的共同代理框架下,委托人的异质性(模型中的)会影响委托人在所有可能联盟情况下分配的平均收益,即沙普利值。这是因为这些异质性影响委托人对组成每个可能联盟的贡献。
证明:在一般性共同代理框下,委托人以及共同代理人的沙普利值的结果为:
比较和可以发现,和的不同、和的不同决定了和的不同。在其他变量相等的情况下,如果,那么,此时委托人1 分得的收益比2 分得的收益大。说明委托人1 能保证的最低收益比委托人2 能保证的最低收益高,共同代理人3 更愿意与1 组成联盟,因此1 的个体理性要求从联盟中分得的收益要更高。在其他变量相等的情况下,如果,那么,此时委托人1 分得的收益比2 分得的收益小。表示委托人1 愿意支付给代理人的报酬比2 愿意支付的要高,这种情况下3 更愿意与2 组成联盟来分配联盟的收益,因此委托人2 分得的平均收益要比1分得的收益更高。证毕。
结论
在非合作博弈中加入共同代理的机制具有两个特点:第一,无“共同代理”参与的非合作博弈是一种“囚徒困境”,即均衡结果所实现的整体收益最小,个体收益不会最大,即均衡是低效率的;第二,“共同代理”以与委托人组成联盟的方式参与非合作博弈,联盟具有协同效应,即联盟的收益大于无联盟时共同代理和委托人收益的和,而且联盟会对联盟外的委托人造成损害,即委托人的收益低于无联盟时的收益。当满足一定条件时,在非合作博弈中加入共同代理能够实现一定程度的合作,整体收益和个体收益都会增加。
参考文献:
[1]B.Douglas Bernheim & Michael D.Whinston (1985),“Common Marketing Agency as a Device for Facilitating Collusion”,The RAND Journal of Economics 16(2):269-281.
[2]B.Douglas Bernheim & Michael D.Whinston(1986a),“Common Agency”,Econometrica 54(4):923-942.
[3]B.Douglas Bernheim & Michael D.Whinston (1986b),“Menu Auctions,Resource Allocation,and Economic Influence”,The Quarterly Journal of Economics 101(1):1-32.
[4]Crowley P.H (2000),“Hawks, Doves, and Mixed-symmetry Games”,Journal of Theoretical Biology204:543-563.
[5]AA Cournot (1838),“Recherches sur les principes mathématiques de la théorie des richesses par Augustin Cournot”[M].
[6]D Gale& LS Shapley(1962),“College admissions and the stability of marriage”,The American Mathematical Monthly.
中图分类号: F016;F062.5
文献标识码: A
文章编号: 1671-4288(2019)01-0030-06
收稿日期: 2018-09-16
作者简介: 张 帅(1988-),女,山东临朐人,潍坊学院经济管理学院讲师,金融学博士。研究方向:博弈论、共同代理理论。
责任编辑:王玲玲