西方经济学第七章(4)

2020-02-21 18:11

博弈均衡又被称为占优策略均衡。一般地说，由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。

我们可以在支付矩阵图中用划横线的方法来寻找占优策略均衡。具体做法如下：先看甲的策略选择。当乙采取合作策略时，甲会选择不合作策略，得报酬12，则我们在报酬12下划一横线。当乙采取不合作策略时，甲仍会选择不合作策略，得报酬8，则我们在报酬8下划一横线。类似地，再看乙的策略选择。甲选择合作或不合作策略时，乙都会选择不合作策略，则我们分别在相应的乙的报酬12和报酬8下各划一条横线。最后，矩阵图中惟一的两个数字都被划上横线的那一格报酬组合(8、8)所对应的(不合作、不合作)的策略组合就是该博弈的占优策略均衡。

乙

L R

7 10 3 5 U 甲

6 8 8 9 图7—18 纳什均衡

2．纳什均衡

在一个博弈中，只要每一个参与者都具有占优策略，那么，该博弈就一定存在占优策略均衡。但是需要指出的是，在有的博弈中，并不存在占优策略，仍可以达到博弈均衡。以图7—18说明这一点。图中的支付矩阵表示甲有两个策略U和D，乙有两个策略L和R。对于甲的策略选择而言，当乙选择L时，甲会选择U(因为7>6)；当乙选择R时，甲会选择D(因为8>3)。显然，甲没有占优策略，甲的最优策略随乙的策略的变化而变化。类似地，对于乙的策略选择而言，当甲选择U时，乙会选择L(因为10>5)；当甲选择D时，乙会选择R(因为9>8)。同样，乙也没有占优策略，乙的最优策略也随甲的策略的变化而变化。尽管如此，我们仍可注意到，在以上的博弈过程中，对于(U，L)策略组合而言，只要甲选择了U，乙就不会改变对I的选择；同样，只要乙选择了L，甲也不会改变对U的选择。从这个意义上讲，策略组合(U，L)也达到了一种均衡状况。由此，我们给出纳什均衡的定义：在一个纳什均衡里，任何一个参与者都不会改变自己的最优策略，如果其他参与者均不改变各自的最优策略。

根据纳什均衡的定义，图7—18博弈中的(U，L)和(D，R)这两对策略组合都是纳什均衡。而另外两对策略组合(D，L)和(U，R)都不是纳什均衡。因为，以（D，L)的策略组合而言，当甲选择D，时，乙就会改变策略，选择R而不是L。所以，(D，L)策略组合不是均衡的。

由此可见，占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者的任何策略选择来说，其最优策略都是唯一的。而纳什均衡只要求任何一个参与者在其他参与者的最优策略选择给定的条件下，其选择也是最优的。所以，占优策略均衡一定是纳什均衡，而纳什均衡不一定是最优策略均衡。在我们前面分析的例子中，图7—17的博弈均衡既是占优策略均衡，同时又是纳什均衡。图7—18中两组均衡的策略组合都是纳什均衡，但都不是占优策略均衡。

三、寡头厂商的共谋及其特征

在寡头市场上只有为数很少的几家厂商，因此，每个厂商的行为对市场的影响都是举足轻重的。每个厂商为了获得更大的市场份额，往往会采取降低价格的竞争手段。但是，某一个厂商首先采取降价的竞争手段后，其他厂商也会采取相应的降价手段回应或报复，以保

住甚至扩大自己原有的市场份额。于是，在经过寡头厂商相互之间的这种轮番降价的竞争过程后，市场的价格会降到一个很低的水平，而每个寡头厂商都会受到惨重的损失，或者说，最终形成一种类似“两败俱伤”的局面。面对这种由于竞相削价的恶性竞争造成损失的结局，寡头厂商们意识到与其相互激烈的进行价格竞争而招致惨重的损失，还不如相互之间达成协议使价格维持在一个较高的价格水平上，这样，每个厂商都可以在一个稳定的高价格水平上得到各自的经济利益，而避免了由于价格竞争所带来的损失。这便是寡头市场上共谋现象普遍存在的原因。事实上，在西方经济社会中，寡头市场上大量的卡特尔组织和其他的一些共谋(或合作)组织的存在，很好的说明了这一点。

同时，必须清醒地认识到，尽管寡头市场上的共谋现象是很普遍的，但是，寡头厂商们之间的共谋却是很脆弱的。当寡头厂商们之间为了各自的利益达成共谋协议之后，这种合作协议随时都有可能被破坏。于是，由此产生的问题是：为什么合作协议会被破坏?这种合作不稳定的现象是否应该避免?以及如何避免?这些问题引起了西方经济学家的广泛关注。

为了解释寡头市场上合作的不稳定性特征，我们将先介绍博弈论中的一个经典模型“囚犯困境”，然后，我们再把囚犯困境的博弈模型及其体现的思想扩展运用到寡头市场的共谋问题中去，以解释共谋的不稳定性，并进一步提出解决这一问题的策略。

1．囚犯困境

囚犯困境的博弈模型的假设条件是：甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方捉获，但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁，并单独进行审讯，即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是：如果一方坦白，另一方不坦白，则坦白者从宽处理，判刑1年；不坦白者从重处理，判刑7年。如果两人都坦白，则每人都各判刑5年。如果两个都不坦白，则警方由于证据不足，只能对每个人各判刑2年。图7—19的支付矩阵描述了这‘博弈。图中的报酬均为负数，以表示判刑的年数。

在警方交待了量刑原则以后，如图7—19所示，甲、乙各自都有两个策略：坦白和不坦白。他们需要做出的决策是：为了自己的利益，·每个人应该选择坦白策略，还是选择不坦白策略。于是，两个囚犯之间的博弈便开始了。

这两个囚犯之间的博弈过程如下：先考虑囚犯甲的策略选择。囚犯甲要决定自己的选择，他必须要先考虑囚犯乙的选择，即囚犯甲是在考虑了囚犯乙的策略选择的前提下来决定自己的策略选择。那么，囚犯甲一定是这样思考的：根据已知的支付矩阵(即图7—19)，如果囚犯乙选择坦白，则囚犯甲选择坦白，会判5年；选择不坦白，会判7年。于是，在囚犯乙坦白的前提下，囚犯甲会选择坦白(因为5<7)。如果囚犯乙选择不坦白，则囚犯甲选择坦白，会判1年；选择不坦白，会判2年。于是，在囚犯乙不坦白的前提下，囚犯甲仍会选择坦白(因为1<2)。很清楚，无论囚犯乙选择的策略是坦白还是不坦白，囚犯甲都会选择坦白这一策略。也就是说，囚犯甲有一个占优策略即坦白。

按照以上相类似的思路，当我们分析囚犯乙的策略选择时，我们也会得到类似的结论(具体分析从略)：无论囚犯甲选择的策略是坦白还是不坦白，囚犯乙都会选择坦白这一策略。也就是说，囚犯乙也有一个占优策略，这个占优策略也是，我们得到的结论是：博弈双方都有一个占优策略，它们都是坦白。这就是说，囚犯困境的博弈有一个占优策略均衡(坦白、坦白)。当我们得到这一个占优策略均衡之后，再回过头来仔细分析一下图7—19的支付矩阵，我们会发现：如果两人都是选择不坦白(即合作)，则都可以获得最好的结局(—2，-2)。但由于他们之间不能互通信息，所以每一方都担心由于对方坦白而自己不坦白时自己所遭受的重判(即对方坦白判1年，自己不坦白判7年)。在这种情况下，每个囚犯从自己的利益考虑，最后的选择都是坦白。显然，(坦白、坦白)是囚犯困境博弈模型的一个必然的均衡结果，而且是一个很强的占优策略均衡。

最后，需要特别指出的是，囚犯困境的均衡反映了一个深刻的问题：从个人理性角度

出发所选择的占优策略的结局(—5， —5)，却不如合作策略的结果（-2，-2)。或者说，从个人理性角度出发所选择的占优策略的结局，从整体来看，却是最差的结局。很清楚，囚犯困境的占优策略均衡反映了一个矛盾：即个人理性和团体理性的冲突。

囚犯困境的博弈模型所体现的合作不稳定的特征及其后果，可以扩展运用到寡头市场上，以解释寡头市场上的共谋不稳定性及其相关的问题。

2.囚犯困境模型的扩展应用：寡头厂商合作的不稳定性

让我们再回到图7—17中的两个寡头之间的博弈的例子。从对该博弈中的四个可能的策略组合及其相应的报酬组合的分析，我们可以得到以下的启发。首先，很清楚(合作、合作)的策略组合，要优于(不合作、不合作)的策略组合。这表明甲、乙两个寡头勾结起来，达成合作协议，共同谋求总报酬最大化{总报酬为20，每人得10)，就可以避免由于双方都采取不合作策略和相互竞争所造成的两败俱伤的局面(总报酬仅为16，每人仅得8)。正因为如此，实际上，在寡头市场上，厂商之间经常会达成协议，成立合作性质的卡特尔组织，共谋卡特尔组织的整体利益最大化，且每个成员也均得到一定的好处。然而，另一方面，我们又会进一步地发现，在(合作、合作)策略组合的前提下，如果有一方坚持合作策略，而另一方偷偷地采取不合作策略，则对于偷偷采取不合作策略的方来说，(合作、不合作)或(不合作、合作)的策略组合，要优于(合作、合作）的策略组合(因为12>10)。这意味着在寡头市场上厂商们在达成合作协议以后，每一个寡头都有强烈的利己动机去偷偷地背离协议，以获得自身的更大的利益，由于每一个达成协议的参与者都会这样想和这样行动，最后的结局将是

合作、合作)的策略组合让位于(不合作、不合作)的策略组合，即(不合作、不合作）的策略组合是均衡的，而且是占优策略均衡。也正因为如此，寡头们之间所达成的卡特尔协定往往是不稳定的。而且，在不少地方，卡特尔组织是非法的，它不可能利用法律手段来制约和惩罚违约成员，这就更加深了卡特尔组织的不稳定性。

更重要的是，从每个厂商的个人理性出发所达到的占优策略均衡(不合作、不合作)的结果(8，8)，要差于他们团体共谋即策略组合(合作、合作)的结果(10，10)。也就是说，在这里体现了个人理性和团体理性的冲突。这一冲突，形成了对传统的微观经济学的“看不见的手”原理的挑战。因为，根据“看不见的手”原理，在市场机制的作用下，理性的个人在追求自己利益的过程中，会同时增进社会的整体利益。或者说，“看不见的手”原理揭示的经济思想是：在市场机制的作用下，个人理性和团体理性是一致的。而在寡头市场上，寡头们却陷入了类似“囚犯困境”的结局，即个人理性和团体理性往往是冲突的。为了解决这一问题，西方经济学家引入了重复博弈的概念，以走出“囚犯困境”，解决个人理性和团体理性的冲突。

3．重复博弈：走出囚犯困境

前面所分析的博弈都是一次性的，即每个参与者只有一次策略选择，而且，在每一个参与者选择自己的策略时，他并不知道其他竞争对手的选择。也可以理解为，每个参与者都是同时做出自己的一次性的策略选择的。在这种一次性的博弈中，一旦每个参与者的策略选定，整个博弈的均衡结局也就确定了，每个参与者不可能再对博弈的过程和结果施加什么影响。这类博弈被称为静态博弈。与静态博弈相对应的是动态博弈。动态博弈是一种反复进行的博弈。重复博弈是动态博弈的一种特殊情况。在重复博弈中，一个结构相同的博弈被重复多次。

在一次性静态博弈的情况下，寡头市场上结成共谋的每个寡头都面临着囚犯困境：每个寡头出自个人理性的占优策略选择却导致了从整体而言的最坏的结局，即在占优策略均衡中不仅总体利益下降，而且个人利益也是下降的。造成这一结局的原因很清楚：一方面，在达成合作协议以后，每个寡头厂商出于对自己利益的考虑，都有一种采取机会主义行为的冲动，即单方面偷偷独自采取不合作的策略，以期获得更大的利益。例如，当合作协议规定

各寡头厂商共同维持一个较高的市场价格水平时，每个厂商都会有一种利己的冲动去单方面偷偷降低自己产品的销售价格，以期获得更大的市场份额和销售收入。当每个寡头厂商都这样想并且这样做之后，整个市场的价格水平就会下降，寡头们的合作协议便被撕毁，最后，每个寡头都落到了最差的结局。另一方面，需要指出的是，在一次性博弈中，任何厂商的违约和欺骗行为都不会受到惩罚。因为，当每个厂商完成一次性的策略选择(包括违约和欺骗的策略选择)以后，整个博弈也就永远地结束了，即没有后续的博弈来对已经发生的违约和欺骗行为进行惩罚。正因为如此，寡头厂商之间的共谋不稳定性是不可避免的，或者说，一次性博弈的囚犯困境的不合作解是必然的。

在重复博弈中，以上的情况就会得到改变。在分析重复博弈时，我们首先要增加一个假定条件，该假定条件是：在结成合作同盟的寡头厂商之间都采取一种“以牙丕牙”的策略。该策略的内容是：所有的成员一开始是合作的。对于每一个成员来说，只要其他成员是合作的，则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略，则其他成员便会采取“以牙还牙”的惩罚和报复策略，即其他成员都采取相同的不合作策略，并将这种不合作的策略在重复博弈中一直进行下去，以示对首先破坏协议者的惩罚和报复。这就是“以牙还牙“的策略。

下面我们具体分析在施加了“以牙还牙”策略假设条件下的寡头厂商们之间的重复博弈过程及其结果。首先我们来分析无限期(次)重复博弈。所谓无限期重复是指相同结构的博弈可以无限次地重复进行下去。在无限期的重复博只要任何一个参与者在某一轮的博弈中采取了不合作的违约和欺骗行为，他便会在下一轮的博弈中受到其他参与者的“以牙还牙”策略的惩罚与报复，即其他所有的参与者都采取相同的不合作策略，并将不合作策略在以后的无限次重重复博弈中永远进行下去。这样一来，首先采取违约和欺骗行为的一方就会永远丧失与他人合作的机会，并由此遭受长期的惨重损失。由于在无限期重复博弈中，对违约和欺骗方采取“以牙还牙”的惩罚和报复机会总是存在的，所以，每一个参与者为了避免“以牙还牙”策略给自己带来的长期损失，就都会放弃首先采取不合作策略的做法，这样一来，寡头厂商们之间的合作解就得以维持，或者说，寡头厂商们就可以走出类似的“囚犯困境”。

我们可以继续使用图7—17来进一步说明无限次重复博弈的具体情况。对甲厂商而言，在“以牙还牙”策略的前提下，如果他始终采取遵守协议的合作策略，那么，他所得到的长期支付是10+10+10+?。如果他采取机会主义的行为，先破坏协议采取不合作策略，那么，他可以得到一次性的好处即支付为12，然后，在以后的所有重复博弈中，由于受到对方采取不合作的策略的报复，他以后每轮的支付均只有8。也就是说，他为了获得一次性的好处即支付12，而使得以后的长期支付由原来合作策略时的10+10+10+?，下降为不合作策略时的8+8+8+?。这样一来，通过短期和长期所得支付的比较，任何一个寡头厂商都不会因为短期的一次性的好处而丧失长期的经济利益。于是，在具有“以牙还牙”策略的无限次重复博弈中，所有的寡头厂商都会遵守协议，采取合作的策略。

下面，再来分析有限次重复博弈的情况。在有限次重复博弈中，我们得不到以上无限次重复博弈的结论。假设博弈只重复有限的5次。我们用逆推法来分析5次重复博弈的全过程，并仍然保持“以牙还牙”的策略假定。由于第5轮博弈是最后一轮博弈，以后不会再有重复博弈，因此第5轮博弈和一次性的静态博弈并没有什么两样。在第5轮采取的违约和欺骗行为是不可能被报复或受到惩罚的。于是，在第5轮博弈中单个寡头厂商出于理性的占优策略就是选择不合作的违约行为或欺骗。逆推到第4轮，在第4轮每个参与者都知道第5轮大家肯定都是不合作的，于是，每个参与者在第4轮都会采取不合作的策略，因为反正第5轮肯定大家都是不合作。如此等等，一直逆推到第1轮。也就是说，在有限期重复博弈一开始的第1轮，每个参与者就有可能会采取不合作的策略。所以，在有限次重复博弈中，寡头厂商们的共谋是不稳定的，博弈的占优策略均衡解就是(不合作，不合作)。

此外，我们还可以换一个角度再来理解有限期重复博弈及其结果。仍然使用逆推法来分析。先考虑最后一轮即第5轮博弈。如果甲寡头厂商考虑到在第5轮采取不合作策略不会遭到报复而采取了不合作策略，于是，按照图7—17的支付矩阵，甲厂商得支付12，l而乙厂商只能得支付6。倒推到第4轮，在第4轮乙厂商一定会考虑到：即使乙厂商自己在第5轮坚持合作，甲厂商也总是会在第5轮采取不合作策略。所以，乙厂商就会认识到：与其等着甲厂商在第5轮采取不合作的欺骗行为而使自己遭受损失，还不如乙厂商自己抢先在第4轮采取不合作策略。如此等等，一直逆推到第1轮。也就是说，在有限次重复博弈一开始的第1轮，每个寡头厂商都会抢先采取不合作的策略。

分析到此，我们的结论是：在“以牙还牙”策略的前提下，对于无限期重复博弈而言，博弈的均衡解是(合作、合作)；而对于有限期重复博弈而言，博弈的均衡解是(不合作，不合作)。而在现实生活中，参与者之间的博弈总是有期限的，那么，这是否意味着寡头之间的长期合作总是不可能的呢?这一结论显然与现实生活中的现象相悖。其实，无限期重复的主要特征是每一个参与者都不知道哪一期是最后一期，所以，欺骗或违约行为总会被报复的这一威胁使得每一个参与者都会把合作策略维持下去。换言之，在有限期重复博弈中，如果任何一个参与者都不能准确地知道哪一期是最末一期，那么，每一个参与者在每一期就一定认为在下一期还要继续相互打交道，这就和无限期重复博弈没有什么差别。所以，在不能确定终止期的有限期重复博弈的寡头厂商共谋模型或者囚犯困境模型中，纳什均衡的合作解是可以存在的。

四、威胁和承诺的可信性

在寡头市场上，寡头厂商为了实现自己的经济目标，有时需要对竞争对手采取威胁或承诺的策略。需要强调的是，无论厂商采取的是威胁策略，还是承诺策略，他的威胁或承诺策略必须是可信的，否则，他的威胁或承诺策略就会失败，他所期望的经济目标就无法实现。

在此，我们以“在位者和进入者”博弈为例，说明厂商采取威胁或承诺策略的可信性的重要性。“在位者和进入者”博弈的主要内容是：假定寡头市场上的厂商面临着潜在进入者的竞争压力。在位者厂商为了阻止潜在进入者的进入，他所采取的威胁策略是扩大生产规模，并向外宣称：新扩大的生产规模目前是闲置的，在位者愿意花费相当的资金来维护闲置的生产设备。但是，只要潜在进入者敢于进入此行业，则在位者就立即动用那部分扩大的闲置的生产能力来进行生产，并将大量的产品抛向市场，以压低市场价格。在被压低了的市场价格水平下，实力雄厚的在位者能承受这一价格压力，而新进入者显然无法承受如此低的市场价格的压力。所以，潜在进入者受到在位者的这种扩大生产规模和压低价格的威胁，便有可能放弃进人该行业，这样在位者的威胁策略便有可能获得成功。由此可见，此博弈的关键问题是：潜在进入者是否真的相信在位者的威胁或者说，在位者的威胁是否真的可信呢?只有在威胁策略可信的条件下，在位者才能阻止潜在进入者的进入。

下面，我们给出关于“在位者和进入者”博弈的两个不同的支付矩阵，通过分析和比较这两个支付矩阵来理解威胁的可信性对威胁策略取胜的重要性。在图7一20的支付矩阵中，我们通过分析可以发现在位者的威胁是不可信的。因为，在潜在进入者进入的前提下，如果在位者采取威胁策略抵制进入，则在位者可获支付800；如果在位者不采取威胁策略抵制进入，则在位者可获支付900.。所以，在位者的抵制这一威胁是不可信的(因为800<900)。换句话说，在位者扩大生产规模的威胁只是一种摆设，它不会被真正实施。在这种情况下，潜在进入者根本不相信在位者的威胁，潜在进入者采取的行动就是进入。

进入者

进入不进入

800 600 1300 900

共5页:

西方经济学第七章(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档