供应链合作关系稳定性的博弈分析_纳什均衡论文

供应链合作关系稳定性的博弈分析,本文主要内容关键词为:供应链论文,合作关系论文,稳定性论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       近年来,随着顾客需求的快速变化和市场竞争的加剧,企业依靠自身的力量满足市场需求的压力越来越大,供应链与供应链之间整体实力的较量成为当今市场竞争的主流趋势[1](唐纳德·J.鲍尔索克斯,2007)。信息技术的发展和全球化市场的形成促使企业开始从战略高度考虑企业之间的合作问题[2],世界上包括欧美、日本等在内的许多大企业已意识到供应链中合作的巨大作用及其战略价值,逐渐从原来的单纯竞争关系走向既合作又竞争的关系,纷纷与供应链中的其它节点企业建立互利合作的供应链合作伙伴关系,供应链管理方法因而应运而生,企业与企业之间不再是传统的买卖关系,而是通过契约等方式形成的更为稳定的、合作更为密切的战略联盟关系。

       供应链合作伙伴关系一般是指在供应链内部两个或两个以上独立的成员之间形成的一种协调关系,以保证实现某个特定的目标或效益[3]。供应链合作伙伴关系的建立意义重大,在国外的研究中,Kogut(1988)研究发现企业选择合作伙伴的动机,是通过一定的策略行为,构建稳定的合作伙伴关系,从而创造并维持企业的竞争优势地位,谋取利润最大化[4]。Devlin & Bleackley(1988)则认为合作伙伴关系及策略联盟是基于企业策略的,用以确保、维持或增进企业的竞争优势所产生的行为[5]。Baranson(1990)认为企业间的合作伙伴关系及策略联盟可以整合资源并保持企业个体之间弹性,是一种优于并购或直接投资的策略选择。Kanter(1990)认为企业之间的合作关系,尤其是供应商与顾客之间的联盟,本身就属于竞争优势的来源[6]。Bleeke和Ernst(1991)指出,企业之间构建合作伙伴关系是一种策略性关系,其主要的动机是为了获取竞争优势[7]。Partnership Sourcing Ltd(1993)说明了构建供应链合作关系的目标是建立一种基于信任和明确的共同目标的长期关系,借此努力创造企业的全球能力和竞争力[8]。Malonia和Benton(1997)认为,在供应链内部的成员企业之间构建合作伙伴关系,协调成员企业之间的关系,可以用来保证实现企业的目标或效益[9]。Pankaj Ghemawat(2002)探讨了供应链合作伙伴内在机制的构建,主要应用了博弈论和行为科学理论从竞争和合作的关系出发对供应链合作关系的稳定性进行了研究[10]。Lambert,Knemeyer & Gardner(2004)研究认为企业发展自身竞争优势的一个重要源泉是构建和维护企业间合作伙伴关系的稳定性[11]。在国外众多学者研究的基础上,国内的许多学者也纷纷对供应链合作关系的稳定性作进一步深入研究,大量的研究关注了供应链合作伙伴关系运行机制、供应链合作伙伴的选择问题,如许淑君和马士华(2001),李洪波等人(2001),宋华(2002)等探讨了供应链的合作条件和内在机制[12-14],曹文彬和何建敏(2002)重点研究了供应链企业的合作策略[15],王冰和张子刚(2003)的研究则偏重于供应链企业间合作效果的分析[16],陈志祥和马士华(2001)、柳键和马士华(2002)则侧重于供应链合作关系的建立和维持以及冲突的解决[17,18],但斌和张旭梅(2000)、张钦和王冬冬(2003)等从供应链的局部着手,分析具体的供应链合作问题[19-21]。但如何建立与保持稳定的合作关系是企业供应链战略的重要问题,目前,许多供应链中的合作关系尚未形成风险共担、利益共享的战略联盟关系,且其稳定性和长久性较差,而在合作关系建立过程中,由于存在个体理性等问题,容易产生“囚徒困境”,而无法实现供应链的最优。曾荣浩、杜跃平(2006)考虑了未来收益的问题,提出了基于现值法对供应链合作伙伴关系的稳定性进行分析[22]。刘昌贵、但斌(2008)在建立供应链的合作博弈模型的基础上,分析了不同收益结构供应链的合作博弈问题及合作的可能性,最后总结了供应链企业冲破合作困境,步入合作双赢之路的若干策略[23]。单莹洁(2009)指出供应链企业在合作创新中也存在“囚徒困境”,并分析了其具体表现形式,提出了相应的防范措施[24]。供应链成员企业之间稳定的合作关系可以为企业提供更强的核心竞争力,同时创造更大的价值,但由于企业间个体理性、竞争关系等因素,企业之间无法进行有效合作,供应链合作伙伴关系的稳定性受到了影响。本文通过构建供应链合作关系博弈模型,在考虑贴现情况的基础上,通过扩展的博弈模型分析,指出如何有效的解决供应链合作伙伴面临的合作困境,并给出建立有效而稳定的合作关系的一些策略。

       1 供应链联盟合作关系博弈模型及博弈分析

       1.1 供应链联盟合作关系博弈模型的建立

       假设存在上下游企业的两级供应链,供应链中的上下游企业即为合作双方,双方为获取更多的利益或效用可以通过建立联盟或不建立联盟来实现,因而,对于供应链中上下游双方,分别有两种策略:“自利”和“互利”。假设“自利”策略只对自身有利,而“互利”的策略意味着采取对合作的另一方增加利益或效用的行动。假定供应链中一方采用“互利”策略的行动结果是要对另一方转移某些正的效用值的利益,而本身就损失同样的效用值,该效用值用τ表示。令δ为供应链中一方采用“互利”策略所引起的获得或损失的额外的效用值,即δ>0或δ<0,因而,可知供应链中的双方都采用“互利”策略时,双方可获取的额外效用值均为δ,而当一方采用“互利”策略而另一方采用“自利”策略时,采用“互利”策略的一方在获取额外效用值δ时,要转移支付给另一方τ的效用值,因而采用“互利”策略的一方的实际效用增加值为-τ+δ,而采用“互利”策略的一方的实际效用增加值为τ,当供应链中双方均采用“自利”策略时,双方额外增加的效用值均为0,博弈的效用矩阵如图1所示:

      

       图1 供应链联盟中合作企业策略选择收益矩阵

       如图1所示,如果供应链中上下游企业均采用“互利”策略时,双方给对方的转移支付效用值τ就互相抵消了,对供应链中每一方额外增加的效用值均为δ,在这里,效用值δ可以从两方面来理解:首先,供应链中双方采用“互利”策略对每一方均有好处,从供应链合作的角度来说,相当于建立良好的供应链合作伙伴关系,这种合作伙伴关系的建立可以保证双方实现“双赢”,这实际也是合作博弈的结果,可以避免零和博弈,因此,双方获得额外的效用值δ是双方都采用“互利”策略行为的直接结果。从另外一个角度来说,效用值δ也可以被看做是供应链上下游企业由于建立良好合作关系而导致双方心理满足程度的提高,如双方合作程度的加深、互相信任度的提升以及双方在合作水平的提高等方面,因而,在这种情况下,δ>0。此外,当供应链中的上下游企业为实现良好合作都采用“互利”策略而导致投入成本过高或者其他消极负面行为的发生时,此时对双方来说,不但效用没有增加反而减少,因为,双方所增加的效用值δ<0。

       1.2 供应链联盟合作关系博弈模型分析

       从博弈矩阵可以看出,参数δ和τ具有表示博弈的性质特征,实际上可以产生如下3个方面的结果:

       当δ>τ>0,供应链上下游企业双方的占优策略都是“互利”策略,博弈的结果(互利,互利)策略是具有帕累托效率的纳什均衡。

       如果τ>0>δ,那么供应链上下游企业双方的占优策略均为(自利,自利),这也是一个纳什均衡,同时,像前一种情况一样,这个均衡结果也是具有帕累托效率的。

       再则,当τ>δ>0时,这时就出现了令人感兴趣的参数值,因为此时会导致博弈中的囚徒困境,即在这种情况下如果供应链中上下游企业双方均采用“互利”策略时,双方均可以获取更多的利益或更大的效用值,但实际上,供应链中的每一方的占优策略却是采用“自利”的策略,因而,这将陷入传统博弈论中的“囚徒困境”中。

       此外,在供应链中合作的双方如果一方通过承诺承担自身的损失或减少获利来换取双方共同利益的增加,这在静态的博弈中将很难换回对方付出同等的承诺或行动,因为空头的承诺是难以换取对方的信任的,即事前不花成本的廉价磋商在实现供应链中双方的合作早已被证明是毫无效率的。所以,供应链合作中的静态博弈或者只进行一次的博弈在这种情况下最后的结果只能是众所周知的“囚徒困境”。正是这种现象的出现,过去我们碰到的各种博弈中这种性质最终使得博弈的各方的占优策略未能出现对各方有利的结果。

       但是,在这里有必要说明的是,供应链合作关系的构建并非易事,尤其是建立良好的供应链合作伙伴关系更是符合供应链合作各方的利益,因而,不管从任何意义上来讲,供应链上下游企业的合作都不是只有一次的博弈,双方在博弈过程中反反复复地采用有利于自身的占优策略,并且当然都能预料并认识到自己现在的行动必然会影响以后策略的选择。作为供应链中的上下游企业,双方作为理性人,基本假设是都想建立较为长久且稳定的合作关系,因而双方的博弈可以等同于重复博弈,那么,现在有个有趣的问题就是即使当各个参数出现τ>δ>0的关系时,也就是当供应链双方出现了“囚徒困境”时,双方所采用的理性策略是否会转化为“互利”策略,这个问题的答案取决于供应链双方的博弈是有限次还是无限次的重复博弈。

       通常情况下,众所周知的是:在有限次重复博弈中,如果阶段博弈只有一个纳什均衡,最终结果必然是不断地出现“囚徒困境”,但如果局中的参与人并不知道双方的博弈会何时结束,也就是供应链中双方的合作并未明确何时结束时,每一次合作过后都有可能再进行下一次的合作,此时供应链中的双方实际上认为这种合作的博弈是可能进行无限次的。因而,这种博弈的结果导致出现唯一的非合作子博弈完美策略即完美纳什均衡,否则,与之相反的情况下,如果在有限次的合作中,此时供应链合作双方的重复博弈并不能带来合作的完美结果,所以才会出现双方都采用“自利”策略的行为结果,并最终陷入“囚徒困境”。供应链中上下游企业的合作本身就存在着很大的不确定性,谁也不能预料这种合作是否能够长期延续下去,当然,谁也不知道什么时候就中断合作,而当双方合作的终止就意味着双方的博弈也并非是无限次可重复的,所以,对供应链中的双方来说,一个较好的方法是可以把双方的合作博弈看做是正在持续进行的在若干次合作之后以一定概率终止合作的博弈,但对方双方来说并没有一个明确已知的结束时间点,因为双方谁也不知道这种合作究竟会持续多久。当双方在任何一次博弈中选择合作之后,只要双方意识到这次合作之后终止合作的可能性足够小,而保持这种合作可以使未来的收益保持足够大时,原来这种类型的重复博弈中出现的“囚徒困境”就可能转换为双方进行合作的较好结果。

       1.3 考虑贴现情况的模型分析

       实际上,在供应链合作的过程中,上下游的企业合作最终会结束,即双方的博弈必定会结束。考虑到这种情况,需要对模型进行修正,通过贴现的方式反映这种情况。因而,令β为现在普遍认为的供应链合作双方未来收益和成本的折现系数,θ表示供应链中双方在每一轮博弈之后能够继续合作的概率,π表示供应链合作双方中每一方的收益,其中,

表示每一方在采用“互利”策略下的收益值,

表示每一方在采用“自利”策略下的收益值。供应链中合作双方在某一次合作之后以一定的概率仍旧继续保持合作。根据上述分析,供应链合作双方博弈的结果是在每一次合作博弈中均采用“互利”策略,因而对于合作双方的每一方来说,其预期的收益如下式表示:

      

       在供应链的合作中,如果对在合作中双方任何一方出现偏离的惩罚就是回复到永久执行阶段博弈的纳什均衡,这种类型的战略即为双方都采用“冷酷战略”或者一些类似的触发战略,这些战略主要包括供应链合作的每一方在每一次合作中都采用“互利”战略行动直到有某一方采用了违背合作行为的策略“自利”,这种行为的偏离会触发来自供应链中的另一方的惩罚并且绝不饶恕,行为的结果就导致对方在此后不断地而且长久地也采用“自利”策略进行报复,因而这样博弈的结果又回到了之前的“囚徒困境”,所以,在供应链中每一方都对合作偏离采用“冷酷”策略的情况下,当

时,对于供应链中合作双方所采用的“冷酷”策略实际上就构成了一个子博弈完美纳什均衡,所以,可得:

      

       在(3)式中,参数θ的含义可以根据供应链中上下游企业特有的关系来进行解释,具体可以分为两种情况:(1)在供应链中上下游企业双方都有长久合作的真诚愿望,双方都非常信任对方,建立良好的战略合作伙伴关系,这种关系在一般情况下不会轻易破裂,即具有进行长久合作的基础和保证,此时可以把θ看做是供应链中一方倒闭或退出市场的概率;(2)θ也可以看做是供应链合作关系破裂或终止的概率,即双方在合作中对对方不满意而终止了合作关系。在实际的供应链合作关系中,第二种情况比比皆是。因而,供应链中的双方的效用值必须大于某一个进行合作所得到收益的临界值,这样的合作关系才是可持续的,否则,双方在博弈过程中必然采用最有利于自身的“自利”策略,这样双方所采用的策略行为必然导致合作关系的失败。当参数θ的值很低时,也就是在供应链中双方都采用“互利”的合作策略无法构成纳什均衡,那么这样双方的合作策略是无法成为现实的,同样的,如果对于未来的收益值预期较低,在本文中主要反映于β的值较小,在这种情况下,可能也无法满足供应链合作双方达到纳什均衡的条件。

       2 扩展的“囚徒困境”模型分析

       2.1 信息不对称条件下的纳什均衡分析

       在上述的模型中,如果供应链中上下游企业在进行合作之前双方信息的是完全的情况下,那么上述模型中所有参数均是可预测的,因而供应链中双方在进行合作时均能有效地估计他们的合作是否能够进行,然而,在实际的合作中,一旦出现某些参数的信息不完全或是未知的,而这在实际的合作中是很常见的,所有上述的分析对供应链合作的形成及稳定性就会发生较大的影响。

       为探讨这个问题,令M表示现在到未来合作期间供应链双方合作的机会成本,即它表示从现在到未来终止合作关系之间的效用的现值,假设M>0,供应链中双方进行合作的必要条件可以表示如下:

      

       当满足式(4)条件时,供应链上下游企业的这种合作关系就是可持续的,双方就可以保持长久的合作关系。换句话说,当M>0时,根据上述所构建的模型,如果供应链中上下游企业双方均采用“自利”的策略,供应链中双方的合作关系将无法继续,甚至供应链中双方均采用冷酷的报复策略来迫使每一方各自采用“互利”策略行为也不能使得这种合作行为长久地保持下去,除非双方各自采用的“互利”策略行为的期望值超过了上述的机会成本M。

       2.2 考虑终止成本的纳什均衡分析

       现在假设供应链中双方终止合作的代价比较高,与供应链双方终止合作的成本相联系的效用损失者为C,因而供应链中双方终止合作的机会成本就变为M-C,所以供应链中双方进行合作的必要条件可表示如下:

      

       该机会成本可能包括由于双方业务合作关系的中断所引起的利润损失、双方销售额的减少、生产过程的中断、存货的增加以及税收方面的损失等等。此外,由于θ表示包含供应链中双方终止合作的先验信念,因而,有理由假定θ是C的函数,即可表示为θ(C),并且

,也就是说,从供应链中上下游企业的合作来看,不但双方终止合作所带来的高额成本降低了双方维持合作关系所必须的期望效用临界值,而且它能够使得双方达到彼此的合作策略更为长久的目的。因而,供应链合作双方如果所具有的θ值越大,双方所采用的“互利”策略所获得的期望效用值就越大,从而使得供应链合作关系破裂甚至终止的可能性就越小。所以,通常通过来之不易建立的供应链合作伙伴关系,尤其这种关系类似战略联盟性质时,出现解体实际上双方都是要付出昂贵的代价的,因而要保持相对稳定的战略合作伙伴关系,实现双方合作关系的一体化,就应尽量避免各种投机行为,共同增加合作的期望效用,不断进行帕累托改善,提高帕累托效率解,解决在供应链合作中的“囚徒困境”难题。

       3 效用最大化的稳定性分析

       3.1 效用最大化模型的建立

       本文前面部分所构建的博弈模型假定了供应链合作关系中合作双方存在的博弈的“囚徒困境”的存在性,供应链合作关系的“囚徒困境”究竟存在的普遍性如何,虽然难以通过实证方法进行定量研究,但可以通过构建效用最大化标准微观经济模型来进行理论分析并验证,具体分析如下:

       假定供应链中上下游企业每一方各自拥有某种资源禀赋,比如供应链上下游企业各自所拥有的各种自然资源、能力水平,各自拥有的某种资源禀赋是有限的,它可以用于本身的自我发展用途,也可以与供应链中的另一方交换其资源禀赋以提高自身的效用,在供应链中,不妨假设上游企业拥有数量为

的某种资源

,它可以用于企业自身发展的需要,也可以通过交换换取下游企业的其他资源以达到双方效用的最大化,设上游企业留下数量为

的资源

供自身发展使用和支配,分配剩余的资源数量为

给下游企业,同样的,下游企业拥有数量为S的另一种资源

,作为交换和补偿,下游企业自身留下数量为

的资源

供自身使用外,其余的数量为

的资源

给上游企业,通过这样的资源交换利用,对于双方来说,就是为了达到其效用最大化,则对于上游企业来说,效用最大化问题可表示为:

      

       上述效用函数

关于

递增,而关于

递减,类似地,对于供应链中的下游企业,同样要达到其效用的最大化,因而,令下游企业的效用函数为

,效用函数V关于

递增,关于

递减,则对于下游企业来说,效用最大化问题可表示为:

      

       从供应链上下游企业的效用最大化问题可以看出,当

均为正数时,要求得双方达到最优水平的内部解,对于供应链中的上游企业来说,需满足以下条件,即:

      

       对于供应链中的下游企业来说,同样要满足以下条件,即:

      

       3.2 效用最大化模型边界点分析

       需要注意的是,在上述效用最大化模型中,效用最大化并不一定是内部解,也有可能在边界点上获得效用最大化值。因而,对于供应链中的上游企业或下游企业来说,在边界点取得最大值是一种特殊情况,必须考虑在内。如以上游企业为例,当

时,相当于供应链中上游企业要把自己所有的资源转移给下游企业,即要把自己所有资源与下游企业相交换,而自己一点也不留,这是一种极端的例子。

       现假设

为供应链中上游企业和下游企业分别达到效用最大化时的最优解,那么当供应链中上下游企业满足以下条件时,即:

      

      

       根据纳什均衡的定义,(16)式、(17)式同时成立时则存在供应链中上下游企业博弈的纳什均衡,同时由上述两式得到纳什均衡的一个基本特点是处于供应链合作中的“囚徒困境”问题。另外,当上述两式的参数发生变化时,即出现

这样一个新的参数组合时,同时

等参数均为正数,且满足

时,则以下两式成立,即:

      

       从满足(18)式、(19)式成立的条件可以看出,当供应链中上游企业将自身所拥有的资源Q对自己和下游企业进行重新分配后,可以在不改变自身效用函数的情况下提高下游企业的效用,即由于

,当参数

值向参数

值发生一些改变时,这个资源的重新分配并不会改变上游企业的效用函数f(·),但它却会增加下游企业的效用函数g(·)。同样的,下游企业对它所拥有资源的再分配也不会改变它本身的效用,但它对其资源总量S由

的变化会增加上游企业的效用值,因而,对于双方资源分配的调整均有益于双方总效用的增加。但同时,要看到供应链中上下游企业双方对各自资源数量的分配所产生的外部效应最终也导致了囚徒困境。

       上述供应链中上下游企业由于各自资源数量分配及交换所产生的效用变化可以用图2来表示,通过用曲线描述上述结果,为简化问题,在这里以当

这种特殊情况为例,在该条件下,对于供应链中上下游企业的每一方来说,其效用最大化的解是由最优反应函数来决定的,用SU表示供应链中上游企业一方,用SD表示供应链中下游企业一方,由图形中可以看出,纳什均衡点处于图形中的A点,在这个纳什均衡点中,分别各自对应着为上游企业和下游企业所带来的效用值

,在图形中分别表现于两条无差异曲线上,不过正如前面所分析的,这个纳什均衡是一个囚徒困境,通过供应链中双方对各自资源的重新分配和交换,供应链中上游企业和下游企业分别得到比原来更高的效用值U'和V',即通过双方资源的再分配和交换,得到帕累托改善并实现富有效率的结果,具体可有曲线中的C点表示。

      

       图2 供应链合作效用最大化模型边界点分析

       根据上述的分析,要实现供应链中上下游企业进行有效并且建立长久合作关系必须要假定双方都要拥有一个对于各自来说是最小的效用水平,本文假设供应链中上游企业和下游企业分别为

,分别如图2所示,从图中曲线可以看出,曲线

分别代表供应链中上下游企业能否实现持续长久合作的约束条件,即双方如果分别低于此效用水平,合作就被迫中断,因而,正如在曲线中A点所示的纳什均衡点双方所表示的效用水平均低于其最低的效用水平,因而是无法保证进行持续长久的合作的,因而,要保证双方能进行长久紧密的合作,就必须保证双方所得到的效用水平处于图中所示的虚线

之间从B点到D点呈透镜状的部分,效用水平位于该部分即可保证双方的合作处于可持续状态。当然,由

效用水平所强加的约束条件既不是要否定在A点处的纳什均衡,也不是非得要把像C点这样的帕累托有效率的纳什均衡点包括在内,对于前者来说,虽然处于“囚徒困境”的两难选择,但此时双方分别采用“自利”的策略也可保证双方保持长久的合作关系;相对于后者来说,此时供应链双方的所采用的任何一种“互利”的策略均不能满足双方效用最大化的要求,因而无法实现长久有效的合作。

       在供应链合作关系的构建过程中,如何长久地建立战略合作伙伴关系对于双方来说具有极其重要的作用,通过以上的分析可知,供应链中合作双方有效地对自己所拥有的资源进行分配和交换可以提高双方的效用水平,并不断巩固和发展相互之间的合作关系,从而使得双方在合作中不断获取更大的利益。

       4 结束语

       “囚徒困境”在各种博弈中普遍存在,有部分通过某种交易得到成功的解决,但这通常出现在市场交易过程中,往往通过某种具有强制性的契约来帮助达到双方最终获得最优解,并且能够体现在最终实现双方福利的改善和效用的提高上。但在供应链中,对于上下游企业这种交易合作关系与普通的市场交易还有一定的区别,他们的关系并非简单的交易关系,更重要的是,他们还要建立相对稳定的合作关系,而这种关系的建立有时就显得更为困难,这种长久的合作关系在静态的博弈中实际上是不可能产生的,因为会导致双方选择占优的策略而陷入囚徒困境,但通过构建长久的战略合作伙伴关系可以把双方进行合作的博弈由静态转化为动态,从而通过实现无限次重复博弈来解决这个问题。在供应链中合作的上下游企业所进行无限次重复博弈中,双方都可以通过采用冷酷触发策略来保证双方的合作使得每一方都能得到足够多的利益,并且高度重视未来合作的价值以及构建相互信任的合作关系。另外,供应链合作出现囚徒困境的一种情况是当供应链合作双方的每一方都控制着某些资源,而资源也同时有利于对方,在这种情况下,如何使得双方对各自所拥有的资源进行合理有效地再分配和交换并且实现帕累托有效率的就对双方是至关重要的,如果未能克服这种情况下的供应链合作中的“囚徒困境”,那可能就意味着这种合作关系的不可持续性。因而,对这种合作关系失败的预期就可能导致双方都不计后果地采用“自利”策略从而使合作关系事实上陷入破裂。不过,对解决这种“囚徒困境”的成功方式是通过增加双方进行合作成功的预期效用值以及提高双方合作破裂的成本。因而,利用提高合作关系破裂的成本不仅可以减少合作关系破裂的可能性,而且可以增强双方进行紧密合作构建战略合作伙伴关系的可能性,从而不难理解,双方就可以构建更强烈的合作机制并且更有积极性来克服“囚徒困境”问题。

标签:;  ;  ;  ;  ;  ;  ;  

供应链合作关系稳定性的博弈分析_纳什均衡论文
下载Doc文档

猜你喜欢