博弈论下的冲突与合作
瑞典皇家科学院10月10日在斯德哥尔摩宣布,将2005年的诺贝尔经济学奖授予以色列希伯莱大学的罗伯特?奥曼(Robert J.Aumann)和美国马里兰大学的托马斯?谢林(Thomas C. Schelling),以表彰他们“通过博弈论分析,促进了人们对冲突和合作的理解”。 一、获奖理论及相关应用
为什么一些个人、组织和国家在成功合作的同时又有一些个人、组织和国家在承受着来自冲突的折磨?长期以来,社会学家和经济学家都在试图理解、阐释冲突和合作的最根本动因。20世纪中期博弈论的出现提供了一种非常新颖、非常独特的分析视角,使得研究人员能够运用精确的数学工具来分析这一问题。一般认为,博弈论始于1944年。数学家约翰?冯?诺伊曼(John von Neumann)和经济学家奥斯卡?摩根斯坦(Oskar Morgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了博弈论大厦的基石,也标志着经济博弈论的创立。1994年诺贝尔经济学奖获得者纳什(John Nash)、泽尔腾(Reinhard Selten)、海萨尼(John Harsanyi)在非合作博弈方面的贡献进一步增加了博弈论的适用范围和预测能力。 奥曼和谢林这两位学者的工作又进一步发展了非合作博弈
理论,并开始涉及社会学领域中的一些主要问题。他们分别从两个不同的角度――奥曼从数学的角度、谢林从经济学的角度,感到从博弈论入手有可能重新塑造关于人类交互作用的分析范式。最重要的是,谢林指出,许多人们所熟知的社会交互作用可以从非合作博弈的角度来加以理解;奥曼也发现,一些长期的社会交互作用可以利用正式的非合作博弈理论来进行深入分析。 在20世纪50年代后期核武器军备竞赛的背景下,谢林的著作《冲突的战略》(The Strategy of Conflict)将博弈论作为统一的分析框架应用于社会科学问题,他认为:一个政党可以通过公开恶化自身的选择权来巩固自己的地位;报复能力远比抵抗进攻能力来得有用;不确定性的报复比确定条件下的报复更有效率、而且更加可靠。这些已经被事实证明是解决冲突、避免战争的非常中肯的创见。奥曼发现,在很多现实情况中,长期合作关系的维系远比一次简单的际遇来得容易,因此短期博弈理论往往具有很多限制性。为此,他首先提出了完整详尽的无限期重复博弈理论,并严格论证了何种结果能够在长时期的关系中得到维持。无限期博弈理论阐明了众多机构存在的理由,比如商业协会、组织犯罪、工资谈判以及国际贸易协议等,并且奥曼所提出的一些真知灼见也有助于解释价格战或贸易战等经济冲突,以及为什么一些团体组织能够非常成功地管理公共资源。
尽管他们关于冲突和合作的作品在1950年末期出现后就得到了普遍承认,但奥曼和谢林的洞察力仍过了很长时间才得以充
分展示。这种延迟一方面反映了他们所做贡献的新奇创意,另一方面也反映了他们后来各项工作的困难与艰辛。最终(特别是在最近25年),博弈论发展成为经济学和其他许多社会科学领域中一种被普遍接受的分析工具和语言。奥曼和谢林所创建的博弈理论或者说交互决策理论为解决合作或冲突这一古老问题提供了最优路径。人们看到,当前关于冲突和合作的经济分析几乎无一例外地都是在奥曼和谢林研究成果的基础上开展的。 (一)讨价还价与冲突管理。
谢林最初也曾致力于传统经济学的研究,但自从他在1958年编写的教科书《国际经济学》中采纳了外国援助谈判、成本分摊协定这样的理论之后,就开始偏离传统经济学的研究范式。一般来说,主流的博弈论大都是以数学语言和公理性的方法来进行研究,而谢林则通过一条截然不同的途径对博弈论的建立和发展做出了巨大贡献。在把注意力从零和博弈上转移开来之后,他开始强调这样一个事实,即几乎所有的多人决策问题都是冲突和共同利益的混合体,并且两种利害关系之间的相互作用可以通过非合作博弈理论来进行分析。谢林指出,“混合动机博弈的决定因素与其说是数学的,不如说是经验的”,也就是说,当博弈当事人在选择战略时,不仅要从数学上进行考虑,而且还会考虑到许多非数学因素,比如声誉创造、传统的沿袭、建立自信、显示大度等等。正是基于这种更接近于现实的分析,谢林开创了关于博弈论分析的一片新天地。
1960年,谢林发表了其经典著作《冲突的战略》,在这本书中,他开始把关于博弈论的洞察力作为一个统一的分析框架来研究社会科学问题,并对讨价还价和冲突管理理论作了非常细致的分析。讨价还价理论是谢林早期的主要贡献所在,他的一篇名为《讨价还价漫话》(An essay on bargaining)的论文首先发表在1956年的《美国经济评论》上,之后又收编入《冲突的战略》的第二章。他所说的讨价还价是广义的,即除了明确协商之外的所有活动。从博弈论的角度来看,讨价还价是一个非零和博弈。在效率曲线上,博弈当事人的利益是对立的,不存在帕雷托改进的可能。也就是说,任何一个人效用的增加都会损害另外一个人的利益。但谢林指出,这种所谓的对立只是一种逻辑上的可能性,在效率曲线上必然存在一点,使得博弈当事人的利益是一致的。博弈者都希望避免两败俱伤,这种“双赢”的共同想法就体现为在效率曲线上找到一个合适的点来解决彼此之间的冲突。 讨价还价和冲突管理涉及一系列默契协调(tacit coordination)的问题,这种协调可能是由于双方彼此的共同利益,也可能是来源于一部分不一致的利益。从这一基本的问题出发,谢林开始探索在充分交流的条件下,公开的讨价还价是怎样达成协议的。他认为这种协定与“双方期望的协调”相类似,即如果双方都推测这个结果能够为对方所接受,那么协议就可以达成了。而要达成这种协定,需要通过许多因素来共同作用,比如法律的、道德的、文化的因素,当然这其中也少不了传统经济学
所强调的数学因素。通过对讨价还价现象进行分析,谢林得出一个惊人的结论:“在讨价还价的过程中,势弱的一方通常会成为强者。”对此也可以这样理解,即将自己固定在特殊的谈判地位是有利的,当任何一方认为对方不会做出进一步的让步时,协议就达成了。一方之所以会让步,是因为他知道对方不会让步了。因此可以认为,谈判的实力就在于让对方相信你不会再让步了。为此,谢林还进一步描述了能够把自己锁定在有利地位的三个战略,即不可逆转的约束、威胁和承诺。
上述理论的一个经典应用是在国际关系领域。在《冲突的战略》中,谢林运用博弈论分析了国家之间的讨价还价行为。他指出:“偶然事件不会引发战争,只有决定才会导致战争的爆发。”如果一国认为另一国会突然发动袭击,那么一场双方都不情愿的战争就有可能爆发。突然袭击的优势和动机在于对方缺乏反击的能力。因此,防止突然袭击的首要目标是军事安全而不是人员安全。进一步说,防止突然袭击需要可信的二次还击能力。正是由于这方面的贡献,谢林也被认为是对国防经济学的发展起了极大的促进作用。
(二)长期合作与重复博弈。
在奥曼的诸多贡献之中,关于长期合作(long-term cooperation)的研究对整个社会科学无疑具有最深刻的影响和冲击。如前所述,在社会和经济生活中,有许多交互作用从本质上来说都是长期的,甚至有一些是无限期的。因此,研究长期、