供应商与零售商的动态非对称进化博弈_促销组合论文

供应商与零售商的动态非对称演化博弈,本文主要内容关键词为:零售商论文,非对称论文,供应商论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

供应链问题是当今管理学界关注的热点,其研究方法包括排队论与随机过程理论、规划理论、网络图论等,但博弈理论已逐渐成为解决供应链管理问题的主要工具之一。Lippman(1997)[1] 把博弈论应用于多企业的存储问题。Cachon和Zipkin(1999)[2] 建立了一个供应商和一个零售商之间的库存博弈模型,之后Cachon(2001)[3] 进行了扩展。此外Gurdal(2002)[4]、Li Ling和Deng Fei-qi(2006)[5] 也用博弈理论研究了供应链的问题。

以上提到的文献都是应用传统博弈理论展开研究的。传统博弈理论要求参与人是完全理性的、知道世界的各种可能状态,并要求博弈的结构是共同知识等,但是在现实中供应商和零售商可能不知道对方的收益函数、有各自的习惯和理念等,这使得传统博弈论面临脱离现实的困境。而基于有限理性的演化博弈考虑了习惯、信仰、理念等规则,克服了传统博弈的缺陷。另外,演化博弈主要在比较稳定的环境下,对人们之间非固定对象经济关系长期稳定趋势的分析,这与供应链中的企业长期合作实现整体优化目标一致。国内外已有学者[6][7] 用演化博弈研究供应链管理的问题。因此,转向应用以有限理性和动态演化为基础的演化博弈具有非常重要的现实意义。

文献[7] 应用演化博弈理论建立了单供应商和单零售商的动态监察模型,再根据复制动态机制(RD)得出演化稳定策略(ESS)及其满足的条件。关于供应商和零售商行为研究除了可以类似文献[7] 建立推动式的监察模型之外,还可以从激励的角度构建拉动式的激励模型。文献[8][9] 研究了信息不对称情况下的销售的激励问题。黄祖庆和达庆利(2005)[10] 运用传统博弈理论设立了产品价格固定、随机需求情况下对零售商促销的激励机制。到目前为止,国内外文献没有运用更贴近现实的演化博弈理论研究激励模型。综上所述,笔者应用演化博弈理论从激励的角度考虑供应商与零售商之间博弈问题是具有意义的。

演化博弈理论有一个基本假设和两个主要概念,它们分别是“有限理性”假设、演化稳定策略及演化学习机制。所谓“有限理性”是首先意味着博弈方往往不能或不会采用完全理性条件下的最优策略,意味着博弈方之间的策略均衡往往是学习调整的结果而不是一次性选择的结果,而且即使达到了均衡也可能再次偏离[11]。

假设某个在位种群初始时采用了策略x,这个策略可以是纯策略也可是混合策略,而同时某一小部分“变异群体”ε,采用另一策略x′。那么演化稳定策略意味着当博弈参与人随机配对进行博弈时,在位种群成员的支付水平高于入侵者的支付水平[12]。也就是说演化稳定策略是整个种群不会被基因突变群体所入侵。数学表达式为u[x,(1-ε)x+εx′]>u[x′,(1-ε)x+εx′],其中ε为一个极小数(0<ε<)。

演化学习机制就是确定参与人策略调整的方式。而复制动态机制是主要的方式,它的基本思想是:如果一个策略的结果优于平均水平,那么选择该策略的那些群体在整个种群中的比重就会上升[12]。全球供应链作为现代供应链管理发展的重要趋势,具有大量参与企业和随机配对的特点,这些恰恰非常符合复制动态机制的假设条件,所以笔者选择了复制动态方式来分析供应链演化博弈模型。

笔者将研究问题假设系统化,从激励角度,建立了信息不对称下单个供应商与单个零售商的演化博弈模型,并且根据复制动态机制得出在一定条件下模型的演化稳定策略。

二、供应商与零售商动态演化博弈模型

(一)基本假设和符号

1.假设供应链是全球性的,包括供应商和零售商,他们都有独立决策权,单个供应商(记为S)和单个零售商(记为R)随机配对进行博弈。

2.R在一个随机市场上销售一种产品,产品只是由S提供,不考虑库存成本、时间延迟,并且S存储量大,能保证供应,那么R的订货量和市场需求量相等。

3.S的单位产品利润为A=(w-c),w为R的批发价格,c(0<c<w)为S的单位成本,R以单价p(p>w)向消费者出售产品。

4.S可能提供奖励值L给R的作为激励(L≥0,L=0表示S不提供奖励)。

5.R的订货量由市场需求的随机扰动与促销努力水平X及市场的随机变量ξ决定,则可设订货量Q=q+f(X)+ξ(q是没有采取促销时的平均订货量;f(X)是R的促销努力水平为X时的销售量,f(0)=0;ξ是区间[a,b]上均匀分布随机变量,且期望Eξ=0)。

6.R的促销努力水平X与奖励值L是有关的,假设为线性关系X=k(βL+l),k=0或1,k=0表示R不促销的情况,k=1表示R促销情况,β(β>0)表示促销努力水平X与S的奖励值L的相关系数,l(l>0)为S没有奖励而R自身促销时的努力水平。

7.博弈的信息是不对称的,R不知道S是否会奖励,奖励是多少;而S不清楚R是否会促销,努力程度是多少,但S知道最终的销售量。

8.供应商和零售商都是有限理性的,他们考虑以后还会继续合作,不会一次选择策略,而是通过学习,不断改变自身策略直到达到一个均衡为止。

(二)模型建立

笔者是从激励的角度考虑S和R的博弈问题。R可选的决策是:促销、不促销,他不知道S是否会对其奖励。S不知道R是否促销以及努力的程度,但知道R的销售量,他可以选择的策略有:奖励、不奖励。因为S和R是相互作用决策,并且决策的过程具有不对称性和有限理性,所以可以用演化博弈理论分析这个过程。

供应商群体与零售商群体发生演化博弈,每次博弈参与人是有供应商群体中的一个供应商与零售商群体中的一个零售商。每个群体成员都是用复制动态机制改变各自的策略的。

根据之前的假设,可以得出S和R的收益矩阵(如表1所示)。

表1 供应商与零售商的收益矩阵

(三)模型求解及分析

笔者采用复制动态机制来分析模型。因此可假设x为供应商群体里的选择奖策略的供应商的比例,那么(1-x)就是选不奖励的比例;设y为零售商群体里选择促销策略的零售商的比例,那么(1-y)表示选不促销的比例了。那么根据复制动态机制可得出以下结论(其中Eξ=0、L>0):

当S选择奖励策略时的期望收益:

对于一个由微分方程系统描述的群体动态,其平衡点的稳定性是可由该系统得到的雅可比矩阵(Jacobian Matrix)的局部稳定分析得到的。我们可以得到上述系统的雅可比矩阵:

当复制动态的平衡点是一个演化均衡① 时,它就是演化稳定策略[16]。根据文献[17][18] 用雅可比矩阵来判断平衡点是否处于局部渐进稳定状态的方法——当系统平衡点使得det(J)>0且tr(J)<0时,平衡点就处于局部渐进稳定状态,那么它也就是演化均衡。所以采用复制动态机制求系统演化稳定策略的条件也就是det(J)>0且tr(J)<0。具体的分析结果如表2所示。另外,最后一个平衡点使得tr(J)=0,所以它不是ESS。

从表2看出,在这个模型中,供应商和零售商的策略组合(不奖励,不促销)、(奖励,不促销)及混合策略

不是演化稳定策略。

当f(βL+l)-L<(w-c)f(l)时,模型的演化稳定策略是(不奖励,促销);而当f(βL+l)-L>(w-c)f(l)时,模型的演化稳定策略是(奖励,促销);f(βL+l)-L=(w-c)f(l)时,模型没有演化稳定策略。所以函数f(X)、R的促销努力水平X与S的奖励值L的相关系数β、S没有奖励而R自身促销时的努力水平l、S的单位产品利润A和S的奖励值L将决定模型最后的演化稳定策略,而其它因素不会对其产生影响。笔者用数值例子证实了上述结论。

三、数值例子

首先,我们验证供应商单位产品利润会影响模型的ESS,给定f(X)=,l=0.09,β=1,L=0.3。当A=w-c=1时,则f(βL+l)-L>(w-c)f(l),此时模型的ESS是(奖励,促销);当A=w-c=2时,则f(βL+l)-L<(w-c)f(l),此时模型的ESS是(不奖励,促销)。

给定A=w-c=1,β=1,L=0.3,l=0.09。当f(X)=时,模型的ESS是(奖励,促销);当f(X)=/2时,模型的ESS是(不奖励,促销),所以f(X)会影响模型的ESS。

给定A=w-c=1,f(X)=,l=0.09,L=0.3。当β=1时,模型的ESS是(奖励,促销);当β=0.8时,模型的ESS是(不奖励,促销),所以相关系数β也会影响ESS。

给定A=w-c=1,f(X)=,β=1,L-0.3。当l=0.09时,模型的ESS是(奖励,促销);当l=0.2时,模型的ESS是(不奖励,促销),可见没有奖励而R自身促销时的努力水平l也对ESS有影响。

给定A=w-c=1,f(X)=,β=1,l=0.09。当0<L<0.4时,模型的ESS是(奖励,促销);当L>0.4时,模型的ESS是(不奖励,促销);当L=0.4时,模型不存在ESS。

从以上数例中看出,函数f(X)、促销努力水平X与奖励值L的相关系数β、S没有奖励而R自身促销时的努力水平l、S的单位产品利润A和S的奖励值L会影响最后的ESS,它最终决定于f(βL+l)-L与(w-c)f(l)的关系。

四、总结

笔者应用演化博弈理论分析了随机市场需求、信息不对称情况下一类供应商与零售商的博弈模型。结论是函数f(X)、促销努力水平X与奖励值L的相关系数β、S没有奖励而R自身促销时的努力水平l、S的单位产品利润A和S的奖励值L会影响模型的演化稳定策略;f(βL+l)-L=(w-c)f(l)时,模型没有演化稳定策略;当f(βL+l)-L<(w-c)f(l)时,模型的演化稳定策略是(不奖励,促销);而当f(βL+l)-L>(w-c)f(l)时,模型的演化稳定策略是(奖励,促销)。

笔者的模型只考虑了两级供应链,今后可以应用多种群演化博弈研究多层级供应链的问题。除了复制动态,演化博弈还有更加先进的学习机制,比如强化学习、适应性学习的机制,可对它们做进一步的应用研究。

注释:

① 演化均衡是演化动态过程的任一局部渐进稳定(asymptotically stable)不动点。

标签:;  ;  ;  ;  ;  

供应商与零售商的动态非对称进化博弈_促销组合论文
下载Doc文档

猜你喜欢