供应链企业博弈模型的构建及其分析研究,本文主要内容关键词为:分析研究论文,供应链论文,模型论文,企业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]F273.7 [文献标识码]A [文章编号]1000-5072(2004)04-0022-04
一、引言
二十一世纪的竞争不再是企业和企业之间的竞争,而是供应链与供应链之间的竞争。[1]供应链是一个不断吸纳能实现战略目标的新成员和舍弃危害供应链整体利益的旧成员的复杂的组织系统。为了简化,我们假设供应链从吸纳目标企业开始直至形成稳定的供应链是一个相对静态的短期过程,这些无数的短期过程造就了供应链动态的长远发展,并且使供应链企业间逐渐形成了长期合作伙伴关系。在不特别声明的情况下,问题中涉及的相关决策行为被假定行为决策者为“经济理性人”。
为了简化,我们假设供应链从吸纳目标企业开始直至形成稳定的供应链是一个相对静态的短期过程,这些无数的短期过程造就了供应链动态的长远发展,并且使供应链企业间逐渐形成了长期合作伙伴关系。假设核心企业拟构建或重构供应链,需要吸纳新成员加盟,现将此过程划分为三个阶段:(1)寻找和吸纳目标企业阶段;(2)与新加盟企业的整合阶段;(3)供应链的正常运行阶段。一旦出现新的战略目标,又将执行阶段(1)~(3)这一过程,因而仅对阶段(1)~(3)这一过程进行分析不会影响我们所研究对象的本质。
二、供应链吸纳目标企业博弈模型的构建及其分析
由于长远发展的需要,核心企业拟寻找符合其战略目标方向的目标企业建立供应链,首要任务是圈定目标企业的范围,然后对其进行可行性研究,最后做出择优决策,使其成为供应链节点企业,节点企业在合作中逐渐形成合作伙伴关系。
(一)目标企业的圈定
假设有n个备选企业成为核心企业决策者的考虑对象,核心企业与备选企业i的行动集合分别为a[,g]和a[,i](i=1,2,…,n),a[,g]=a[,i]∈A={同意加盟,拒绝加盟},简写为A={Y,N}。假定在备选企业i加盟供应链之前,核心企业与备选企业i所拥有资产的价值分别为V[,g]、V[,i];而备选企业加盟后,相应的期望价值分别假定为EV[,g]=V[,g]+△V[,g]和EV[,i]=V[,i]+△V[,i],这里,△V[,g]、△V[,i]表示合作后的价值增量,符号不限。出于战略管理的视角,短期利益的关注必然会损害企业及供应链长远发展的战略规划,我们选取代表未来收益贴现的价值变量而不是当前利润变量作为决策主体选择行动的关键因素,这既充分体现了企业利益最大化的决策层目标,又注重了基于战略目的的长远发展。
核心企业与备选企业i的行动组合分别为(Y,Y)、(Y,N)、(N,Y)和(N,N),如果以期望价值表示支付值,可得支付矩阵(见表1)
表1 不同行动组合的支付矩阵
显然,假定(Y,Y)是核心企业与备选企业进行双向选择博弈的均衡战略组合,在不存在转移支付的前提下,须满足必要条件:
暂不考虑备选企业的择优问题,我们首先考虑备选企业i被吸纳加入供应链的首要条件,设不等式EVgN≥Vg和EViN≥Vi始终成立,故有
式(3)表明核心企业与备选企业的决策者均同意实施加盟策略的前提是合作后博弈双方增加的价值预期大于零,该博弈为一双赢博弈。只有双方优化了资源,个人理性与团体理性相符,才可能合作。
假使存在转移支付(即博弈一方对另一方进行补偿)的情况,(Y,Y)均衡战略组合成立的条件为:
与式(3)相比,不等式(5)显然更容易满足,在不存在转移支付条件下,社会资源的优化配置不一定能实现;但如果双方相互谅解,允许转移支付,(Y,Y)均衡战略组合存在的可能性会大大增加。
令t代表转移支付额,则
t[,min]=max[0,(V[,i]-EV[,iY])]
这里,t表示满足企业i个体理性的最小转移支付。
仅满足核心企业与备选企业的增值要求而忽视供应链中其它成员企业的个体理性约束是不可行的,即备选企业i的加盟不应损害其它成员企业的利益(不存在转移支付情形下)或能足够大地提高整个供应链效益以保证转移支付措施的执行,才能保证团体理性和个人理性相一致。
(二)择优决策博弈
假定有m个备选企业满足(Y,Y)均衡战略组合成立的必要条件,其中,1≤m≤n。这些备选企业就属于核心企业拟与之合作的目标集,谁将成为供应链中的新成员取决于决策双方的择优结果。
令核心企业与目标企业j(j=1,2,…,m)合作后双方的期望值分别为EV[,gj]和EV[,j],而目标企业j不加盟该供应链的时所具有的外部机会价值(即可选择与别的核心企业合作的最大期望价值)EV[,jN]>V[,j]。
在不存在转移支付的条件下,使(Y,Y)均衡战略组合成立的最优目标企业j*需满足:
这里,△V[,gj*]、V[,j*]表示j*加盟后,核心企业与j*的期望价值增量,△V[,N]则为j*加盟其它供应链后的期望价值增量。我们称满足(6)条件的(Y,Y)为核心企业与目标企业j*的弱占优策略均衡,若该不等式为严格不等式,(Y,Y)则为严格占优策略均衡。
式(6)表明最优目标企业j*必须最大化双方的期望价值增量。实际上,满足△V[,gj*]≥△V[,gj]单方面最优的目标企业j*存在许多外部机会(如多个核心企业对j*的竞价),导致△V[,j*]≥△V[,N]不满足。因此,为了满足j*的个体理性,核心企业不得不采用转移支付手段。
在存在转移支付条件下,(Y,Y)均衡战略组合成立的最优目标企业j*满足:
EV[,gj*]+EV[,j*]≥EV[,gj]+EV[,j*N] (j≠j*)
即△V[,gj*]+△Vj*≥△V[,gj]+V[,N] (7)
式(7)意味着目标企业j*与核心企业的期望价值增量之和不低于核心企业和目标企业j*选择其他任何行动所获得的期望价值增量和,达到帕雷托(Pareto)最优。允许转移支付发生,需要双方达成一致的分配协议,所以,企业合作的最优状态不是自发形成的,而是合作主体之间互选和有意识的协调努力的结果。当然,转移支付的存在并不意味着最优合作状态就能形成,因为合作主体决策者的有限理性和环境的复杂性、不确定性影响着合作期望价值增量(或外部机会成本)的精确测定,最终互选结果极可能偏离理想均衡策略。
三、供应链整合阶段博弈模型的构建及其分析
目标企业加入供应链后,如何改善经营管理,解决供应链节点企业间的协同与整合问题,不断提高供应链的集成化程度,创造最大整体利益,是摆在决策层面前的艰巨任务。由于供应链成员企业均具有独立的法人资格,有着相对独立的自主经营权限,并且企业间的信息不完全对称,各成员企业最大化其自身利益的追求目标并不必然与供应链的利益最大化相一致,这就容易导致隐藏信息或隐藏行动的败德行为。在合作过程中少数合作者不顾整体利益,见利忘义,将损害供应链的发展,因此,有效地防止和杜绝新加盟成员破坏供应链的败德行为是供应链整合期的当务之急。
为了理解供应链企业间的博弈机制,首先构造一个简单的博弈模型。假定有两个供应链企业A和B,博弈分两阶段进行。在博弈的第一阶段,企业A可以选择与企业B合作,也可以不与企业B合作。如果企业A选择不合作,则交易过程结束,双方各得0单位的收益;如果企业A选择合作,则博弈进入第二阶段,企业B决策。企业B可以选择履约守信,也可以选择不遵守合同。如果企业B选择履约,双方各得5个单位的收入;如果B不履约,则企业A得-2个单位的收入,企业B得8个单位的收入。博弈树如图1所示,图中第一个数字代表企业A的收入,第二数字代表企业B的收入。
假定交易只进行一次,可以用逆向推理求解这个博弈的纳什均衡。企业A选择合作的时候,企业B该如何选择呢?选择守信,得到5个单位的收入,选择不守信,得到8个单位的收入,所以理性的企业B的最优选择是不守信。回到博弈的第一阶段,如果企业A有理性预期,知道企业B会选择不守信,企业A选择不合作得0个单位的收入,选择合作得-2个单位的收入。所以企业A的最优选择是不合作。纳什均衡是:A选择不合作,B选择不守信。这是一个令人沮丧的结果,陷入了囚徒困境。个体理性导致了集体的非理性。
图1 博弈树
解决问题的一个办法是双方签订一个合同,规定:如果B不守信,将赔偿A企业5个单位的收入。如果合同是完备的,且企业B的不守合同的行为能在法庭上被证明,则企业B的最优选择是遵守合同,企业A的预期合同能被执行,A将选择与B合作。但这样的合同可能是不可行的,或事前不可能签订一个完备的合同,如果企业A预期合同得不到执行,其最优选择仍然是不合作。
但是,即使正式的合同不可行,如果双方有机会长期博弈,合作仍然可以通过信誉机制实现。假定在每次博弈结束前,双方都预期有δ的可能性进行下一次交易,并且每次博弈的结构相同。考虑企业A采取“触发战略”:首先选择与B合作,如果B守信,将与B继续合作;一旦B不守信,将永远不与B合作。给定企业A的上述战略,企业B应该如何采取行动?如果B选择不守信,得8个单位的收入,以后的预期收益为0,总期望收入为8个单位。如果选择守信,将得到5个单位的收入,有δ的机会在下一期得到5个单位,如此下去,总的期望收入为:5+5δ+5δ[2]+5δ[3]+…=5/(1-δ)。只要5/(1-δ)≥8,即δ≥0.375,守信就是企业B的最优选择,企业A的“触发战略”也是最优的,合作关系可以长期建立。这是重复博弈创造的信誉机制。
通过以上博弈模型的分析,可以得到,限制新加盟企业的机会主义行为的解决措施是实施负激励,即在所订立的合同中规定违约的惩罚措施,使得该合作成员的违约成本大大高于从违约行为中所得收益。假定n个成员企业合作的最优策略集X[*]={x[,1][*],x[,2][*],…,x[,n][*]},即成员企业i选择策略x[,i][*]是最有利合作的;但是,最大化自身利益的成员企业i可能会选择策略x[,i]≠x[,i][*]而违约;为了使成员企业i所选择的策略符合整个合作团体的利益(x[,i]=x[,i][*]即遵守合作协定),我们给出防范道德风险的一般负激励模型(假定违约的事后发现概率为100%):
式(9)为团体理性约束条件,它要求协作生产的供应链总效用水平不能低于最优策略集下的相应值;式(10)为激励相容约束条件,它表示的是,对成员企业i而言,选择策略x[,i][*]是所有x[,i]中收益最大的行动,称之为成员企业i的帕雷托(Pareto)占优策略。[2]
该模型的执行较为简便,主要通过在合作协议条款中明文规定违约的罚金来实施负激励,然而,由于成员企业的行动不易觉察和难以证实,这就导致了本模型的精确度较低P(x[,i])值不好确定)的问题,在实践中表现为违约行为性质认定方面的事后法律纠纷繁杂。
对于上述负激励模型的缺陷,可从非合作博弈论的角度出发,运用可信承诺、触发策略、联合制裁等方法来弥补。如果成员企业之间的博弈重复多次,且每个成员企业有足够的耐心(贴现因子足够大),那么违约企业任何短期的机会主义行为所得的利益,相对于长远利益的损失是微不足道的。供应链成员企业为了保证长期利益的存在;在当前阶段的博弈中,要考虑到不能引起其他博弈方在后续阶段的对抗、报复和恶性竞争,即不能损害其他博弈方的利益。一旦偷懒或不合作被发现,其余所有企业会一致决定将该企业开除出供应链,这是一个可置信的威胁。因为任何企业退出,供应链都能找到可替换的同类型企业,而不会造成供应链的瓦解;另外,企业被开除会影响其声誉,可能遭致行业的封杀。偶尔的违约所得却冒着失去与其伙伴进行长期有利可图的合作关系和良好的声誉,机会主义行为被压制。在供应链管理中,相对不正式的、没有法律强制力的合作安排统治着商业关系,当企业处理长期关系时更是如此。这说明:供应链企业长期合作关系很大程度上是由企业的声誉机制来维持的。
四、小结
供应链是一个复杂的系统,它的构建和运行涉及多个企业、多个阶段的决策行为。我们运用博弈论分析供应链从吸纳新成员直至稳定这一全过程,获得了可帮助决策者进行有效决策的重要结论,主要包括:(1)在供应链吸纳新成员的博弈分析中,建立了一个支付博弈矩阵,根据纳什均衡的必要条件,确定目标企业的范围,并从中选择最优企业。帕雷托最优的企业联合是企业间互选的结果,允许转移支付比不允许转移支付更有利于最优联合状态的形成,但在目标企业择优过程中,决策者的有限理性可能会导致供应链效率不高。(2)在供应链整合期,应用负激励模型约束成员企业的违约行为,同时指出,供应链企业在重复博弈中,运用可信承诺、触发策略可限制企业的机会主义行为,从而供应链企业可以形成长期的合作关系。
标签:合同管理论文; 合作合同论文; 供应链系统论文; 合作博弈论文; 战略分析论文; 违约概率论文; 供应链论文; 博弈论论文; 转移支付论文;