国际贸易争端战略选择的演化博弈分析_博弈论论文

国际贸易争端策略选择的进化博弈分析，本文主要内容关键词为：争端论文,国际贸易论文,策略论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

伴随着全球经济一体化的发展，国际贸易额连年以较高的比例增长。但是，在国际贸易增长的同时，也伴随着双边和多边贸易争端的迅猛增加。贸易争端已成为世界经济领域中的突出问题。以我国为例，进入20世纪90年代后，对华贸易战屡见不鲜：纺织品贸易战、农产品贸易战、贸易技术壁垒战、对华反倾销战、对华反补贴战、对华知识产权战等。仅近些年来对我们影响较大的就有中韩贸易战、中美贸易战、中日贸易战。根据经济学原理我们知道，虽然贸易战的形式多样，但他们的实质都是扩大本国产品的竞争能力，保护己方利益，而全面的贸易战将给冲突方带来巨大的损失。

WTO的成立为成员国间贸易争端提供了公平的解决机制，然而每年提交到WTO解决的贸易争端却屈指可数。为什么绝大部分贸易争端不是在WTO机制内平息？贸易争端的解决有什么内在因素起作用？本文将用进化博弈论（evolutionary game theory）作为理论工具，提出作者的观点。

源于冯·诺依曼（Von Neumann）和摩根斯坦恩（Morgenstern）（1944）经纳什（Nash）（1950）发展而形成的经典博弈论以完全理性作为假定基础，把参与人之间的关系视为机械式的互动关系，假定其他博弈方选择一定的情况下找到个人最优解。经典博弈理论的理论基础是纳什均衡及其精炼，通过这两方面以求得合理的均衡结果。经典博弈论在获得巨大成功的同时，也逐渐暴露出它所隐含的一些问题，其中最为突出的是它的“理性”基础问题，也就是它对人们的理性和行为能力方面的基本假设问题。我们知道，当社会经济环境和决策问题较复杂时，人们的理性局限是非常明显的。大量事实表明，人们在作出决策时总是存在着系统的推理误差，而这些误差产生的原因大多来自于信息成本、思考成本、激动和经验等因素的影响。现实中的人往往不是有时也不可能严格按照利润或效用最大化的要求作出决策。这也是导致经典博弈理论对很多现实经济现象无法作出合理解释的根本原因。进化博弈理论的出现弥补了经典博弈理论在这方面的缺陷。进化博弈理论假定：人们的理性是有限的，知识是不完全的，对别人行为预期的判断很难正确无误；人们通常是通过在模仿、学习、不断的试验中，对外部世界的冲击作出反应。

一、进化博弈理论介绍

进化博弈论起源于博弈论在生物领域的应用。“进化”的观点靠的是“物竞天择，适者生存”，随着进化博弈论的发展，它被越来越多的经济学家、社会学家、人类学家广泛应用。“进化”已经不仅是生物学意义上的进化，它的含义越来越丰富。

进化博弈的思想是费希尔（Fisher）在《自然选择的基因理论》（The genetic theory of natural selection，1930）中试图解释在哺乳动物中性别比近似为1∶1时首先使用的。1961年利文廷Lewontin在《进化和博弈理论》（Evolution and the theory of games，1972）中明确使用博弈论用于解释生物进化。1972年梅纳德·斯密（Maynard Smith）在他的文章《博弈论和进化冲突》（Game theory and the evolution of fighting）中提出了进化博弈理论的基本均衡概念——“进化稳定策略”（Evolutionary stable strategy——ESS）。1973 年梅纳德·斯密和普赖斯（Price）在他们的文章《动物冲突逻辑》（The logic of animal conflict）中把ESS应用在更广的范围，从此进化博弈论真正受到重视。泰罗（Taylor）、炯克尔（Jonker）（1978）和兹曼（Zeeman）（1979）在对生态现象进行解释时首次提出的模拟者动态（Replicator Dynamics）成为在进化博弈理论中应用得最多的工具。在梅纳德·斯密的进化博弈的经典著作《进化和博弈理论》问世不久，罗伯特·艾克斯罗德（Robert Axelrod）的著作《合作进化》（The evolution of cooperation，1984）出版。从此进化博弈迎来了发展的高峰。进化博弈理论在经济学的应用虽然只有近几十年的历史，理论形式还比较粗糙，没有形成统一的理论体系，但目前已经被广泛地应用于经济学的各个方面，如杨（Young，P）（1993，1998）利用进化博弈论研究社会习俗的形成；费登伯格（Fudenberg）（1995）利用进化博弈论研究社会学习过程；青木昌彦（1996）利用进化博弈论研究社会制度变迁等等。我国学者在这些方面才刚刚起步，很少有这方面的研究文章，我们和国外同行还有较大差距。

1.进化稳定策略

进化稳定策略的基本意思是：假设存在一个全部采用某一个特定策略的群体（population）和一个采用不同策略的变异（Mutation）个体，如果这个变异个体能得到的得益（pay off）（进化博弈中的得益通常用适应度（fitness）来表示，这个词源自于生物进化论中的增值适应度（reproductive fitness）一词，它通常表示子女或后代数量或者期望数量）比群体中的其他个体得到的要高，那么就称这个变异战略能侵入这个群体。

假设群体最初选择了策略组合σ，然后，一个小的突变体ε开始采用策略组合σ，ESS要求现有群体在混合策略（1-ε）σ+εσ中能够得到比突变体更大的适应度。即：

f（σ，（1-ε）σ+εσ）＞f（σ（1-ε）σ+εσ）　（1-1）

对任何足够小的正数ε成立。也可以理解为：群体中企图采用可选择的策略的任何一个小突变体不比已经采用“固有”策略的那些个体所构成的团体收益好。同时，采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是，那些采用可选策略的小团体却受激励而具有转变固有策略的行为。

进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则，为各种各样的人类行为提供一种有关的稳健性准则。比如，经济体制形式、社会制度模式、行业规则及社会习俗等都可以看作是某种人类群体的规则，而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然，在这种背景下，如果那些极少数的人群或企业的收益比不变异的人群或企业高时，那么这些变异分子会生存得更好，反之，则被淘汰掉（Weibull，J.1998）。

2.模拟者动态模型

进化博弈中的博弈者具有学习进化能力，能够根据过去的经验，通过个体之间模仿、学习和突变等动态过程来调整自己的行动，博弈者的学习和进化是可以导向均衡的。模拟者动态是进化博弈理论的基本概念，它能较好地描绘出有限理性个体的群体行为变化趋势，由之得出的结论能够比较准确地预测个体的群体行为，因而倍受博弈论理论家们的重视。大多数关于进化博弈的研究都是站在同一群体中如何进行对称博弈的角度进行论述的，下面我们给出同类群体模拟者动态方程。

假定群体中个体在任何时候只选择一个纯策略，I=｛1，2，…，k｝表示群体中个体可供选择的纯策略集；N表示群体中个体总数；n[，i]（t）表示在时刻t选择纯策略i 的个体数；S=（s[，1]，s[，2]，…，s[，k]）表示群体在时刻t所处的状态，其中s[，i]表示在该时刻选择纯策略i的人数在群体中所占的比例，即s[，i]=n[，i]（t）/N；f（s[，i]，s）表示群体中个体进行随机配对匿名博弈时，群体中选择纯策略i的个体所得的适应度；f（s，s）=s[，i]f（s[，i]，s）表示群体平均适应度。

显然，选择纯策略i的个体数n[，i]（t）在学习、模仿的动态过程中是随时间而变化的，其变化速度与自身所在群体（即选择纯策略i的部分）的大小有关，因为这涉及到模拟过程的长短；另一方面还与自身所在群体的适应度有关，因为适应度的大小决定了学习、模仿的方向。因此有：

（dn[，i]（t）/dt）=n[，i]（t）·f（s[，i]，s）

（1-2）

又有n[，i]（t）=s[，i]·N，两边对t求导可以得到：

（dn[，i]（t）/dt）=N（ds[，i]/dt）+s[，i]（dn[，i]（t）/dt）

把（1—2）式代入（1—3）式中：

n[，i]（t）·f（s[，i]，s）=N（ds[，i]/dt）+s[，i]n[，i]（t）·f（s[，i]，s）

整理（1—4）式可得：

（ds[，i]/dt）=[f（s[，i]，s）-f（s，s）]·s[，i]

（1-5）

该式即为模拟者动态方程，它表明采用既定纯策略博弈方的比例的变化率与该类型博弈方在群体中所占的比例成正比，与群体中选择纯策略i 的个体所得的适应度大于群体平均适应度的程度成正比。

二、贸易争端的进化博弈分析

1.对称进化博弈分析

对称进化博弈的分析框架是同类型的个体组成的群体成员间的随机配对博弈。这意味着进行的博弈是博弈位置无差异的两人对称博弈，依此来确定整个系统的进化稳定性和进化稳定策略。

假设X，Y来自同一个群体中，群体成员随机配对博弈。如下图所示：

图1　X，Y对称博弈

附图

上述图中的意义是：v代表双方争夺的贸易利益，c代表争夺失败一方的损失，其中c＞v＞0。如果双方都采用对抗策略，那么双方获胜和失败的概率都是1/2，因此各自的得益都是（v-c）/2。如果双方都采用合作策略，那么双方能够分享利益或各有一半机会获得利益但没有损失，因此各有v/2单位得益。如果合作策略遇到对抗策略，那么对抗策略方获得利益v，合作策略方得不到任何利益。

在这个群体中，各个博弈方会试着选择策略。在经过反复的实践后，会选择一种适应度最大的策略。于是在经过一段时间后，策略s[，1]（合作）被选择的比例是p，策略s[，2]（对抗）被选择的比例是1-p。

对X来说选择策略s[，1]的适应度：

f（s[，1]，s）=（v/2）·p+0·（1-p）

（2-1）

对X来说选择策略s[，2]的适应度：

f（s[，2]，s）=v·p+（v-c/2）·（1-p）

（2-2）

对X来说平均适应度：

f（s，s）=p·f（s[，1]，s）+（1-p）·f（s[，2]，s）（2—3）

将（2—1）和（2—2）代入模拟者动态方程可以求得：

（dp/dt）=p（1-p）（p+（v/c）-1）

（2-4）

根据最优解条件（dp/dt）=0，有三个解：p[*]=1，p[*]=0，p[*]=1-（v/c）。

由模仿者动态方程可知，当p大于0时（稍稍偏离平衡点），p随着时间的推移而增加，即群体中选择策略的人数不断增加，因此系统会离开原平衡点p*=0而向点p[*]=1-（v/c）靠拢；同理，当p小于1时（稍稍偏离平衡点），系统会离开原平衡点p*=1而向点p[*]=1-（v/c）靠拢。只有平衡点p[*]=1-（v/c）是稳定的（ESS）。如下图所示：

图2　单一群体对称博弈进化稳定策略示意图

附图

经过上面的分析我们可以知道，如果两个国家对外贸易策略选择的博弈矩阵中收益和损失是对称的，他们的博弈进化均衡是点p[*]=1-（v/c）。即：如果贸易争端给两国带来的损失越大（c增加），则p*→1，群体中选择合作策略的个体越多，贸易争端容易以和平的方式解决。

现在来看世界贸易组织的争端解决机制。世界贸易组织最主要的目的是消除国际间的贸易障碍，并对国家之间的贸易冲突进行处理，所以世界贸易组织提供了一个中立和可靠的法律程序来保障国际贸易顺利进行。截至2002年，有140多个国家和地区已经参加了世界贸易组织。这些成员有的很富有，有的比较贫困；有的对外贸易依存度很高，有的较低。实际上贸易争端往往对两国的损失是不同的。但在WTO体制内，其争端解决机制被认为是体现了平等、迅速、有效和具有约束性的，其争端解决机制的赔偿和授权报复执行手段限制了大国任意采取“侵略性的单边主义”（如美国的301条款）。多边争端解决机制能够克服双边关系中存在的“势力不均衡”，因为两国贸易战中总是大国的损失要小，所以在双边框下约束它违约的力量较小。而在WTO多边框架下，违约将被要求赔偿损失并可能受到经济制裁，增加了大国违约成本，所以贸易弱国倾向于在WTO内解决争端。贸易争端给两国带来的损失越大，在WTO机制内争端就越容易以和平的方式解决。

2.非对称进化博弈分析

非对称进化博弈的分析框架是两种或两种以上类型的个体组成的不同群体成员间的随机配对博弈。分析方法是先分别讨论不同位置博弈方的模拟者动态，然后再把它们结合起来确定整个系统的进化稳定性和进化稳定策略。

设X，Y来自两个不同的群体，两群体成员随机配对博弈。如图3所示。

图3　X，Y非对称博弈

附图

上图的意义是：v代表双方争夺的贸易利益，c[，1]代表对X所在的群体来说失败将导致的损失，c[，2]代表对Y所在的群体来说失败将导致的损失，其中c[，1]＞c[，2]＞v＞0。如果双方都采用对抗策略，那么双方获胜和失败的概率都是1/2，因此各自的得益分别是（v-c[，1]）/2，（v-c[，2]）/2。如果双方都采用合作策略，那么双方能够分享利益或各有一半机会获得利益但没有损失，因此各有v/c单位得益。如果合作策略遇到对抗策略，那么对抗策略方获得利益，合作策略方得不到任何利益。

在X所处的群体中，策略s[，1]被选择的比例是p，s[，2]策略s[，2]被选择的比例是1-p。

在Y所处的群体中，策略s[，1]被选择的比例是q，策略被选择的比例是1-q。

对X来说选择策略s[，1]的适应度：

f（s[，1]，s）=（v/2）·q+0·（1-q）

（2-5）

选择策略s[，2]的适应度：

f（s[，2]，s）=v·q+（v-c[，1]/2）·（1-q）

（2-6）

平均适应度：

f（s，s）=p·f（s[，1]，s）+（1-p）·f（s[，2]，s）（2-7）

根据模拟者动态方程：（ds[，i]/dt）=[f（s[，i]，s）-f（s，s）]·s[，i]

我们可以求得：

（dp/dt）=p（1-p）（（c[，1]-v/2）-（c[，1]/2）q）

（2-8）

同理，对Y来说我们可以求得：

（dp/dt）=q（1-q）（（c[，2]-v/2）-（c[，2]/2）p）

（2-9）

（2—8）和（2—9）联立是一个非线性常系数的动态方程，该系统有五个平衡点，即为：

附图

上述五个平衡点中第一个平衡点处的两个特征值分别为0、（c[，1]-v/2）；第二个平衡点处的两个特征值分别为0、（v/2）；第三个平衡点处的两个特征值分别为0、（-v/2）；第四个平衡点处的两个特征值分别为0、（v-c[，1]/2）；第五个平衡点处的两个特征值分别为0、（vc[，2]（v-c[，1]）/2c[，1][2]）。由特征值可知：第一、二个平衡点（纯策略纳什均衡）是不稳定的；第三、四个平衡点（纯策略纳什均衡）是渐近稳定的；第五个平衡点因为是混合策略纳什均衡，需要针对不同情况予以讨论。我们考察第五个平衡点均衡策略选择，在该平衡点附近，由模拟者动态方程可知，当p＞1-（v/c[，2]），p＞1-（v/c[，1]）（稍稍偏离平衡点）时p、q随着时间的推移而减小，即两个群体中选择策略1的人数不断减少，也就是说群体向平衡点靠拢；当p＜1-（v/c[，2]），q＞1-（v/c[，1]），p随着时间的推移而变小，q随着时间的推移而变大，因此系统会离开平衡点而向点靠近；同理，p＜1-（v/c[，2]），q＜1-（v/c[，1]），p 、q随着时间的推移都变大，因此系统会向着平衡点靠近；p＞1-（v/c[，2]），q＜1-（v/c[，1]），p随着时间的推移而变大，q随着时间的推移而变小，因此系统会离开平衡点而向点靠近，也就是说，是不稳定的。如图4所示：

图4　两群体非对称进化博弈分析

附图

在这个模拟动态进化博弈中，当初始情况落在区域A中时会收敛到进化稳定策略p[*]=0，q[*]=1，即博弈方X位置群体都采取“斗争”的策略，博弈方Y位置群体都采取“合作”的策略；当初始情况落在区域D中时会收敛到进化稳定策略p[*]=1，q[*]=0，即博弈方X位置群体都采取“合作”的策略，博弈方Y位置群体都采取“斗争”的策略；当初始情况落在区域B，C中时会收敛到点p[*]=1-（v/c[，2]），q[*]=1-（v/c[，1]），但它不是进化稳定策略，最后会收敛到进化稳定策略p[*]=0，q[*]=1或p[*]=1，q[*]=0（取决与区域A和D的大小）。

根据我们的分析，如果贸易争端对X所处的群体而言，带来的损失越大（c[，1]增加），或对Y所处的群体而言带来的损失越小（c[，2]减少），则区域A的面积减少，区域D的面积增加。如图5所示：

图5　两国贸易政策非对称进化博弈分析

附图

初始情况落在区域D中的可能性将更大，会收敛到进化稳定策略p[*]=1，q[*]=0，即博弈方X位置群体都采取“合作”的策略，博弈方Y位置群体都采取“斗争”的策略。联系贸易争端亦即：贸易强国趋向于采取强硬策略，贸易弱国倾向于采取妥协策略。

从历史看，西方发达国家（贸易强国）有着强烈的保护主义传统。随着时代的发展，发达国家左右国际经济的力量相对减弱。20世纪70年代初期的石油危机使西方国家进一步认识到自己对外国资源的依赖。随着经济全球化的增强，发达国家经济对外贸易依存度加大，在这种情况下，发达国家与贸易伙伴的经济摩擦也在加剧。

以美国为例，美国的贸易政策到20世纪80年代进入一个新阶段，以1988年最终形成的《1988年贸易和竞争综合法案》为标志，确立了美国贸易政策在新的历史条件下的基本格调与基本战略，主要体现在两个方面：首先是从全球多边主义（WTO体制内）转向了双边互惠主义（WTO体制外），加强有针对性的双边贸易谈判，以解决争端贸易与冲突；其次是从倡导“自由贸易”转向所谓“公平贸易”，强调对等互惠条件，强化其贸易法的自我保护性和主动性。依据1988年《综合贸易法》对不符合美国要求的国家和地区实施单方面的贸易制裁。近几年来，美国频频运用该法律的“301”条款、“反倾销”、“反补贴”等，来迫使有关贸易国与之举行双边贸易谈判，美国从中获得了不少的实际利益。这也验证了我们根据双群体非对称进化博弈分析的结果：没有WTO的制衡机制，则贸易强国趋向于采取强硬策略，贸易弱国倾向于采取妥协策略。

三、贸易争端数据分析

据统计，在20世纪90年代，仅全世界涉及反倾销的贸易争端案，平均每年就发生232起，而2001年更是达到了348起。涉及到反补贴、贸易技术壁垒、知识产权保护等方面的贸易争端更是多得难以统计。WTO的成立可以说是世界经济发展史中最重要的事件，它促进国际贸易的发展，为参加组织的国家提供了国际交流场所，特别是为成员国间贸易争端提供了公平的解决机制。我们看到WTO在处理贸易争端中发挥了积极作用，但需要注意的是每年提交到WTO解决的贸易争端案件和同时期发生的贸易争端比较起来仍然屈指可数，而且即使提交到WTO的案件决大部分也迟迟不能得到解决。如表1所示。

表1　WTO 成立后贸易争端统计

　提交到WTO的贸易争端　正在处理　上诉机构和专家组报告已通过　已解决或暂停案件

时间

　1995.1.1～2001.6.30　 2001.6.30 1995.1.1～2001.6.30 1995.1.1～2001.6.30

　180

数量（起）（涉及234年国家和地区）16 51　51

世贸组织内部矛盾不断激化，贸易强国对世贸组织的贸易争端解决机制不满意，因为在和贸易弱国的博弈中，制衡机制使得他们不能取得更大的利益。所以，贸易强国的有些争端（特别是和贸易弱国间的）不愿意在WTO机制内解决。

四、结论

在前面模拟者动态方程的推导中我们假设：进化博弈的选择动态满足适应度单调性，即任意两个产生不同适应度的策略，产生更高适应度的策略有更高的增长率，而产生相同适应度的策略有相同的增长率。然而，进化博弈中的策略均衡往往是学习调整的结果，而不是一次性选择的结果。考虑到在学习策略中存在着学习障碍，学习和模仿机制导致了这样的可能性：在群体中同样盛行并且产生相同适应度的策略，可能在进化过程中以不同的速度被模拟，原因是，现在适应度低的个体在是否选择一个新的策略时，不仅依赖各种策略的相对成功性，而且依赖于这些策略是否容易被学习。如果一些策略本质上比另一些更难以学习，即使它们能取得更好的适应度，它们也将难以被模拟。在我们分析的贸易冲突中就是因为不同国家对WTO的规则认识程度不同，同样的策略在有些国家中就不能被模拟使用。从而，发达国家更倾向于采用双边谈判的形式解决贸易争端，而发展中国家则更倾向于采用WTO 的多边贸易机制解决贸易争端。

标签：博弈论论文; 合作博弈论文; 群体行为论文;

国际贸易争端战略选择的演化博弈分析_博弈论论文

猜你喜欢