发生在我们身边的博弈(3)

2019-06-17 15:26

1．“囚徒困境”的深刻哲理

在前面的章节，笔者讨论一个“囚徒困境”(Prisoner’s dilemma)变形博弈，很明显，该警察局长所采取的策略必然不能够使得两名囚犯坦白罪行。其实，只有改变游戏规则，利用“囚徒困境”模型策略才可以达到目的。“坦白从宽，抗拒从严”的道理人人都懂，从博弈论的角度来看，其实就是一个囚徒困境模型的应用。我们前面所讨论的爱情博弈其实也是囚徒困境的一种形式。

这里我们继续前面的讨论，这个警察局局长C如果足够明智的话，必然不要求两名囚犯都招供，而是让两名囚犯中的任何一名坦白，招出另外一个人。这样警察局局长C就要确定，对不坦白的人施以最严厉的刑罚。

这种情况下，警察局局长C对囚犯A和B作成如下许诺：如果他们之中有一人坦白，而另一人不坦白，则坦白者无罪释放，而不坦白者要被判无期徒刑，囚禁终生；如果两人都坦白，则两人都被判有期徒刑5年；如果两人都不坦白，则两人都被判2年监禁。

囚徒困境仍然需要2个前提预设：囚徒A和B两人都是自利理性的个人，即只要给出两种可选的策略，每一方将总是选择其中对他更有利的那种策略；两人无法沟通，要在不知道对方所选结果的情况下，独自进行策略选择。在这种条件下，从囚犯A的立场来看，共有2种可能情况：第一种可能是B采取坦白的策略，这时如果囚犯A也坦白，则要入狱5年，如果不坦白，则要囚禁终生，两相比较，结论是应该坦白。第二种可能是囚犯B采取沉默的态度，这时若甲也沉默，要入狱2年，如果囚犯A坦白，则可获得自由，两相比较结论是应该坦白。因此，无论囚犯B是坦白还是沉默，囚犯A采取坦白的策略对自己更为有利。同样以上推理对于囚犯B也适用。结果两个囚徒都坦白了，都被判刑5年。囚徒困境的“困境”在于如果甲乙二人都保持沉默，则都只被判刑一年，显然比两人都坦白的结果要好。

两名囚犯都作出招供的选择，这对他们个人来说都是最佳的，即最符合他们个体理性的选择。照博弈论的说法，这是惟一的纳什均衡点。除了这个均衡点，A与B的任何一人单方面改变选择，他只会得到更加不经济的结果。而在其它的结果中，比如两人都不坦白的情况下，都有一人可以通过单方面改变选择，来减少自己的刑期。可是两人经过一番理性计算后，却选择了一个使自己陷入不利的结局。

其实“囚徒困境”不允许囚犯A和B进行沟通的假设，与实际生活中大部分情况的现实是有差异的。比如，在爱情博弈中，很多恋人会经常花前月下、彻夜厮守；在企业的价格战中，企业之间也会多有沟通，价格；即使是二十世纪下半世纪的美苏军备竞赛中，两个超级大国也会经常进行外交交谈，及时交换信息。

笔者不妨将条件放宽，允许囚犯A和B在审讯室李一起单独呆上10分钟，然后再决定是否坦白。很明显，双方交流的主旨就是建立攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都不去坦白。然后，双方再单独被提审。我们不妨设想，囚犯A的心理，他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；如果囚犯B告密的话，若不坦白就会被终生囚禁。事实上，囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。

恋人们在恋爱中的海誓山盟，最终还是分手；企业之间相互沟通信誓旦旦，价格战仍然会爆发；美苏两国经常会晤，甚至签订核不扩散条约，但军费一年高过一年。这些现象都反映了上面所说明的问题。

在本节所举的囚徒困境的游戏规则，能够让狡猾的罪犯招供，得到应有的惩罚，固然不是坏事。然而，我们不妨假设囚徒A和B都是完全清白的大大的具有理性的良民，这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中，加上对身体的残害，完全会造成屈打成招的冤假错案。在中国历史上，这种事情并不是多么稀有的个案。在更深刻的意义上，囚徒困境模型动摇了传统社会学、经济学理论基础，这是经济学的重大革命。传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制：“当个人在追求他自己的私利时，市场的看不见的手会导致最佳经济后果。” 这就是说，每个人的自利行为在“看不见的手”的指引下，追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。

传统经济学秉承了亚当·斯密的思想。传统经济学认为：人的经济行为的根本动机是自利，自私是个好东西，每个人都有权追求自己的利益，没有私社会就不会进步，现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力，只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正，自然会增进社会福利。

但是囚徒困境的结果，恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件，但无法确信其他参与者是否能与自己一样遵守市场规则。佛家讲因果律，儒家讲究“财自道生，利缘义取”。从囚徒困境看来，如果一味地想算计别人，算来算去，最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑，那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。 2．经济自由与效率

关于经济自由主义，笔者不得不在这里着重笔墨写这么额外的一小节。在目前中国的经济、管理领域，经济自由主义者的观点已是喧嚣尘上、风靡一时，如江河之泛滥，一发不可收拾。他们恨不能将中国所有的大型国有企业全部分解成原始资本主义的小商小贩，妄图在一夜之间造就出梦幻般的完全自由竞争的市场经济体系。按照经济学家左大培的观点，中国经济自

由主义者的思想是 “有中国特色的经济自由主义”。

在资本主义早期，成千上万的小私有者投资工商业作为谋生手段，亚当·斯密正是在这种背景下才假设经济个体行为不会影响其他个体行为，并推断出个体利益最大化也就是社会利益的最大化。后来资本的高度集中使其日益脱离生产，变为纯粹攫取利润的工具，理论模型开始注意经济生活中各利益主体之间的相互影响和相互作用。一种研究经济个体如何在复杂的竞争关系中使自身利益最大化的理论“经济博弈论”应运而生。正如上一节所述，“囚徒困境”本身就已经推翻了自由经济主义存在的理论基础。囚徒困境揭示了：个体理性的选择与群体理性选择之间的矛盾，从个体利益出发的行为往往不能实现团体的最大利益；同时也揭示了市场理性本身的内在矛盾，从个体理性出发的行为最终也不一定能真正实现个体的最大利益，甚至会得到相当差的结果。从“囚徒困境”与“囚徒困境”变形模型中，我们可以证明：人们的相互交往过程中，每个行为主体的利己主义决策结果，可能是有效率的，也可能是无效率的，但多次重复这种决策肯定是低效率的。它实际上证明了亚当·斯密200年前提出的每个人自私自利就可以实现社会最大福利的假设的不可实现性。在现代市场经济中，人们在多次交往或者重复博弈后发现，遵循平等合作规则要比通过欺诈获得少数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下去，人类将面临“一切人坑害一切人”的社会。笔者这里再举一个实例证实，自由竞争并不是最优效的经济体系，而政府管制也不是最无效的手段。

1971年，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，财大气粗的各大烟草公司反应相当平静，并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。实际上，政府禁令不仅没有打击烟草公司，反而是把陷入白热化广告战的各大烟草集团从“囚徒困境”中解放了出来。

在20世纪60年代，美国烟草行业竞争激烈，为了争夺市场，各大烟草公司都必须耗费巨额费用大做广告，这无疑降低了它们的利润水平。也就是说，如果烟草公司都不做广告，它们的利润要更高。可是，如果其中一家公司不做广告，它的市场份额就会被其他公司抢走。这正是一个囚徒困境：某公司放弃做，而其它公司仍然大作广告抢占市场，放弃做广告的公司必然利益受损。在这种情况下，做广告就是每一个广告公司的优势策略。即使烟草公司能够达成都不做广告的协议，但是这个协议的约束力太低，这在上一节已经解释过，这并不能将烟草行业从广告战的泥潭中解救出来。

这个时候国家出台法令对于烟草行业来说反而是个好事，烟草公司靠自己做不到的事情，政府做到了。因为国家法律具有强制性的作用，相当于是烟草集团之间签订了极具约束力的协议，同时政府承担了监督烟草公司是否违反协议的成本。

除了自由竞争之外，中国的经济自由主义者还强调，经济只应关注效率，不要强求公平，更加谬误的是他们又把效率只片面地看成是个人或家庭的发财致富。我们可以发现，这种思想在社会上引起了很恶劣糟糕的一种思想潮流。在书店里充斥着如何发财致富的书籍，而所谓的一些成功人士则是人们顶礼膜拜的新偶像。

他们甚至还认为，经济体系可以不要任何秩序的竞争，一切都应放任自流，反对靠政府的干预来建立秩序。所谓秩序，就是游戏规则，就是一个博弈对局的规则。比如很多知名的所谓经济学家竟然公开颂扬“全民炒股”、全国性的房地产投机之类的对经济具有极强破坏力的现象。更有甚者是，某经济学居然从理论上推出这样的结论：“腐败适度存在，能使改革进一步推进”。还有经济学家公开宣称“腐败和贿赂成为改革过程得以顺利进行的润滑剂”。关于这个问题，笔者会在后面的章节用博弈论的方法与观点来说明其荒谬性与无耻性。 3．“囚徒困境”的破解：无限次重复博弈与有限次重复博弈 “不识庐山真面目,只缘身在此山中。”我们继续囚徒困境的讨论，从上几节的解释中，我们可以看出，严格囚徒困境的前提条件是博弈各方不可以进行合作，也就是不能够制订有约束力的协议。但在实际上，合作是文明的基础，比如兴修水利、组织国防、创建企业等都是合作而产生的，无怪乎哲学家卢梭写了本书《社会契约论》，认为契约是整个人类社会存在的前提条件之一。

前面已经分析过，如果囚徒困境只是一次性的博弈，那么签订协议是毫无意义的，其纳什均衡点并不会改变。可以签订协议的一个最基本的条件，就是博弈需要重复若干次，当然至少大于一次。就恋爱博弈来看，男女双方在交往的过程，随时都在博弈，因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说，这是一种囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。当然那种素不相识一对男女，偶尔在酒吧中相遇，于是宾馆订房、春梦一场，拂晓之后就各自分道扬镳的一夜情是理所当然的一次性囚徒困境博弈。

我们在这里要注意的是，重复博弈与我们前面所提及一般性的动态博弈是不同的。多轮动态博弈中，参与者能够了解到博弈中的每一步其它参与者的在自己选择某种策略下的行动，而重复博弈的参与者无法了解到在任何一个步中，其它参与者的策略选择。

囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大的变化，博弈的结局也就是纳什均衡点可能会完全不同。举个最简单的例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国，而是意大利，囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意出狱之后被同伙干掉。

实际上，在重复型的囚徒困境中，并不是签订合作协议很困难，困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后，博弈参与者都有作弊的动机，因为至少在作弊的这一局博弈中，作弊者可以得到更大的收益。还是用爱情来打比方，常言道：“婚姻是走向爱情的坟墓”，但从博弈论的角度来看，婚姻恰恰是男女双方签订的一种协议，具有一定约束力的协议，因为一旦对方背叛婚姻，就会受到家庭的压力与社会舆论的谴责。

在博弈理论中，博弈专家已经用数学证明出，在无限次重复博弈的情况下，合作可能是稳固的。如果博弈无穷次，双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复；而双方都取合作态度会带来合作收益。但是在现实社会生活中又不完全这样，人总是要死的，因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时，他就可能不再害怕此后别人对他的报复，从而可以在博弈结束前做损害他人的事情，这就回复到有限次重复博弈的境况。对于有限次囚徒困境博弈，美国密西根大学的罗伯特·爱克斯罗德教授（Robert Axelrod）曾经做过一个著名的博弈论试验。这个试验的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序，然后这些程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。试验参与者连续玩上200次，于是这就更逼真地反映了日常人际关系。

试验的结果表明，囚徒困境在同样重复数十次或一百次的情况下，只要两个参与者仍然还是理性人（这可以在该试验的参加者所编程序中反映出），博弈的结果仍然是囚徒A和B相互把对方招供出来。为了解释这个问题，我们不妨讨论一个博弈两次的模型。

我们首先考虑第二次博弈的情况，由于这是最后一次博弈，自然没有后面的博弈对这次博弈的影响，因此也不就不必为将来打算，个人都只追求这次博弈的最大利益，于是第二次博弈的结果应该和一次囚徒困境博弈完全一样，自然是囚徒A和B都坦白，达到纳什均衡。现在再来考虑第一次博弈的情况，博弈参与者A已经很清楚最后一次博弈，B一定会招供，那么即使囚徒A不坦白，在下一次博弈时，B也一定会招供，这次博弈A不坦白对下一次博弈没有任何好的影响，那么作为理性人的A一定仍然选择坦白。对于B，也是一样的道理。由此可见，第一次博弈自然也和一次性囚徒困境博弈完全一样。

其实不论是两次博弈，还是3次，4次，甚至是上百次，只要是有限次数的重复囚徒困境博弈，其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法（Backward induction），这在博弈论中，对于重复博弈与动态博弈是一种重要的分析方法，当然这对我们在日常生活中分析问题也不无裨益。比如，汽车企业之间的价格战往往不是一次性降价，而是一轮一轮地降价，这种类似的问题都可以用有限次囚徒困境模型来分析，事实情况和我们前面的分析完全相同，汽车企业之间每一次的价格博弈的纳什均衡只有一个，那就是全体降价。

笔者在这一节最后还要补充一个问题，就是多人重复囚徒困境的博弈。实际上，生活中的两人博弈毕竟是特例，绝大部分的情况还是多人博弈，比如上面提到的汽车价格战。在多人博弈中，只有其它所有参与者在第k－1次博弈中都是合作的，某个参与者才会在的k次博弈中采取合作策略。然而，这一策略会带来一个协调问题，任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈，最终导致所有人的背叛。更糟糕的是，一旦出现这种情况，没有任何人会主动开始合作。因此，我们可以这么说，多人重复囚徒困境（无论有限或无限）中稳定的合作几乎是不可能的。

比如1992年英镑事件前后，可以明显感觉到有关游戏各方的思路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体；而它们在考虑统一货币的利益时，均在强调自己的利益；德国在其中的地位很特殊，它具有双重身份，既是欧洲汇率机制的基础，也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。索罗斯的量子基金发起攻击的主要原因在于：德国联邦银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本国利益受到损害时，也必然倾向于自保。而在这种分歧加剧的背景下，无疑会加重有关各方拒绝承认错误的立场，这又进一步加重了分歧，索罗斯正是利用这套机制获利的。

这个结论似乎是一个令人绝望的，绝望之处必有希望，欧元已经成功地在欧洲大陆通行，成为可以与美圆相抗衡的硬通货。这其中的道理，笔者在下一节将告诉读者，什么样的游戏规则可以保证博弈各方稳定合作。 4．威胁、承诺、作弊与惩罚西方哲学家卢梭说过，“究竟是什么不可思议的艺术，使人类找到一种法，通过强迫人们服从，从而使他们获得自由？” 其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国君主立宪政体的理论奠基人，其代表作是政治学名著《利维坦》（Leviathan）。所谓“利维坦”，是《圣经》中的一种力大无穷的巨兽名字的音译，在书中意指一个强大的国家。霍布斯说：“人的自然本性是自私自利、恐惧、贪婪、残暴无情，人对人互相防范、敌对、争战不已，像狼和狼一样处于可怕的自然状态中。于是出于人的理性，人们相互间同意订立契约，放弃各人的自然权利，把它托付给某一个人或一个由多人组成的集体（如议会、董事会、法院等），这个人或集体能把大家的意志化为一个意志，能把大家的人格统一为一个人格；大家都服从他的意志，服从他的判断。这个人或这个集体就是主权者，而像这样通过社会契约而统一在一个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生，用更尊敬的方式来说，这就是活的上帝的诞生。”按照他的观点，没有集权的合作是不可能产生的。因此，一个有力的政府是必要的。霍布斯对合作协议的观点是：“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说，没有权威的

协议并不是导致民主，而是导致无政府状态。最后，霍布斯总结道，“在一切政体中，最坏的政体并不是专制而是无政府状态。” 霍布斯的观点虽然有些偏激，但却不无道理。根据博弈论的观点，无论是一次性或有限次重复博弈，“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑，这最终导致合作协议无法稳定遵守。

实际上，决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个，即承诺与威胁。所谓承诺，在囚徒困境中就是囚徒向对方相互许诺，在下一次博弈时会采取让对方有利的行为，也就是不坦白与对方合作；所谓威胁，就是某个囚徒告知对方如果下一次博弈时其采取招供策略而不合作，在下下一次博弈时就会采取不利于对方的策略即招供。

其实，在社会生活中，承诺与威胁是非常常见的现象。比如女生告诉她男朋友，如果他敢结交其他的女生，只要被发现一次，就立刻分手，这是威胁；而她男朋友向她发誓绝对自己是个专一的情圣，决不会背叛爱情，这就是承诺。再比如，在外交中，美国经常向中国承诺只承认一个中国的原则，我国政府向国际社会承诺中国强大也决不会采用霸权政策。大家常见的很多耳熟目详的俗语都是承诺与威胁，比如“人不犯我，我不犯人”、“坦白从宽，抗拒从严”、“以眼还眼，以牙还牙”等。

合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择之前作出的，如果承诺与威胁对博弈者的约束力越小，那么合作的可能性就越小。假想一个可信度很小的承诺与威胁，比如参加考试的学生向监考老师承诺在没有老师监考的时候决不会作弊，不难想象考场中将会是什么样的一种景象，学生并不都是道德高尚、具有很强自制能力的人。即使在有老师监督考场，并威胁如果有学生敢于顶风作案，必然严惩不待，比如考卷直接判零分。设想一下，如果这种威胁仅仅是威胁，在学生作弊后并未真的采取什么严惩的行动，那么学生作弊的风险非常小，考场纪律依然与没有老师一样。由此可见，监考老师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。

从实际的整个社会生活说来，对于有限次重复博弈合作问题的解决主要有2个典型方法，那就是国家法律与社会道德。至于其他解决方法在本质上并不会超脱于它们。 5．国家法律

100多年以前，粱启超曾说过：“我国成文法之起原不可确指，然以数千年之思想往往视法律与命令同为一物。”直至今日，很多人在骨子里面往往还是视法律和命令同为一物。从命令的角度来理解法律，是指个人意志或某个集团的意志以上下级纵向关系的方式传达，具有直接的强制力，在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第三者裁判等中间环节或者客观化机制作为媒介。这样的法律往往是朝令夕改，其约束力并不能保持长久。更严重的是，这种法律经常演变成是权力的合法外衣，为个人私欲谋取利益，而法律不再成为凌驾于社会生活博弈的超然之物，而是让博弈又多了一个权力者的不公平参与。真正的法律是在顾及社会各方利益博弈均衡的结果，在社会博弈中具有独立性，不参与博弈。同时，合理的法律必须又要有强制性，不管是对社会大众还是掌握权力的人，都拥有至高无上的权威，所有的人都必须遵守法律的约定，包括制定与执行法律的人，否则必然要受到无法逃脱的惩罚。

在这样一种法治环境中，法律必然可以改善囚徒困境。我们来看这样一个例子。如所前述，我们假定执法人员独立于博弈之外，有公司A与公司B是商业上的合作伙伴，公司A经常向公司B购买原材料，由于两家公司在不同的城市，于是两个公司经过谈判之后签定买卖合同，一般在一周之后的那一天，公司A打现金打入公司B的银行帐户，公司B则发货到公司A，若违约则处于2~5倍罚款。实际上，如果公司A与公司B都是理性人，那么他们的合作就是一个有限次数重复博弈，在社会不存在法律的情况下，在两个公司任何一次交易中都有可能有某一家公司不遵守合同，逃款或逃货，即使公司A现金充裕，而公司B货源充足。所谓的熟人欺诈也是这个道理。然而，在我们理想的法律环境下，公司A和B最佳策略都是合作。不妨假设公司A与公司B每年的交易都有十几次，平均每笔生意为100万，若违约则罚款200万。见下图，公司A与公司B合作时，双方收益均为20万（指公司A与公司B的利润）；公司A付款，而公司B不发货，A损失100万，B收益100万；公司A不付款，公司B发货，公司A收益120万（其中包含20万的利润），公司B损失80万（指公司B货物的成本，也就是收入减去利润）；公司A不付款，公司B不发货，双方收益为零。当然，这里还要说明的是这个博弈中没有考虑商业信誉的问题，商誉是社会道德中的问题，后面笔者会详细讨论。

20 20

120 -80

-100 100

0 0

很显然这是一个有限次重复博弈的囚徒困境，注意到前文所介绍的模型都是对称的，这个博弈则是非对称博弈，这更加贴切于日常生活的真相。在没有法律背景的条件下，双方选择不合作是自然的纳什均衡点。然而引入强制性的法律则不同，这时他们所签合同具有法律效应，一旦有一方违约，另一方有权罚款其200万元，并且法院可以强制实行。在这种情况下，两个“囚徒”，也就是公司自然都会采取合作策略，完成合同对各方所要求的行动。简单说来，就是法律改变了两个公司博弈的均衡结果。霍布斯认为，国家以法律形式规定对某种行为如“违约”采取惩罚措施，但是如果惩罚措施不力，即使扣除惩罚的成本，行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处，那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则：效率原则。效率原则是从对社会的整体考虑分析得出的，从这个意义上讲，法律越严格越好，越严格越有效率。强制性有效率的法律之重要性还可从冷战时期美苏两个超级大国40多年的军备竞赛中得出反证。尽管他们双方签定一些制止军备竞赛的协议，但是由于缺乏一个世界性的公平合理又具有强制性的法律环境，其结果仍然是陷入无法解脱的囚徒困境。类似的还有各国的贸易保护主义的永恒倾向也很能说明这个问题，除非某一天出现全世界的国家都得到统一，建立一个全球性政府才可以彻底解决这些国与国之间的囚徒困境问题。

法律制定的第二条原则是，法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则，这就是公平原则。用简单的一句话说，法律惩罚太重对犯法者不公平，惩罚太轻则对社会或他人不公平。

因此在不同的国家以及在同一个国家的不同时期，对这两个原则的是不同的。法律制定的这两条原则要根据不同时代，不同社会的具体状况而各有侧重。前面一小节提到目前一些国内的经济学家否认国家法律与立法执法的重要性，否认反腐败的重要性，导致目前经济混乱的观点是非常荒谬的。从法律制定的第一条原则来看，违反契约的惩罚越是严厉并可信，则博弈者违约的可能性越小，这是路人皆知的。从法律制定的第二条原则来看，权力对法律公平性的侵害有损法律的权威性与公正性，这也是众所周知的。笔者相信，这些学者的素养应该比绝大部分人要强很多，自然他们也应该能够理解甚至是精通这些基本常识。可见他们公开所宣称的观点只能说明其赤裸裸的掠夺社会财富、剥夺绝大部分人公平权利的无耻性。“乱世用重典”，通过博弈分析，笔者认为采用如同香港70年代严厉的反腐政策或新加坡一样的严刑峻法比较适宜目前的社会状况。 6．猴子的故事与道德约束

与当代某些无耻之尤的中国经济学家不同，亚当·斯密在写完《国富论》与市场这只“看不见的手”之后，转而又写了本《道德情操论》，专门论述个人道德与社会道德是维持市场经济的基本要素之一。亚当·斯密告诉我们：最商业化的社会，也是最讲究道德的社会，比如16世纪时荷兰人就比英国人值得信赖，当时荷兰的商业比英国发达，反之亦然。

人类道德的产生一般有两种解释：一种是纯文化因素起作用，有些国家道德程度高，有些国家则低。如北欧人之间的道德感高于意大利人的道德感。或者是宗教信仰的原因，怕上帝惩罚你，所以有宗教信仰的人道德感就要强于一般人。如在美国，教会的人道德感比较强，因为他们认为若不道德，将来会进地狱。这种解释中，道德是外界强加于人们的，使人们不违约。而笔者主要想给出的是第二种解释，即博弈论是如何解释道德的。

道德可以打破囚徒困境的难题，化解个人理性与社会群体理性的矛盾，维系整个社会经济体系的稳定与发展。关于这一点，我们来看一个猴群博弈的故事。这个故事这两年一直流传于中文网络各大论坛与社区。

有一群猴子被关在笼子里，在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，机关又与一个水源相连。猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了，这个过程重复着，猴子们发现，尽管有猴子吃到香蕉，但吃到香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。

在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是“不道德的”，它们也会自动地惩罚“不道德的”猴子。当然这只是一个故事，但这个博弈故事却反映了人类的道德的产生过程。

霍布斯认为人类在没有任何约束的自然状态中，就是“人与人之间像狼与狼一样”，是“每个人对每个人的战争”。在这种状态中，每个人都力图保护自己的利益，并企图占有别人的东西，此时，每个人是每个人的敌人。此时没有任何规则，没有财产，没有正义或不正义，只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状态下无法产生文明。

与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生了道德感。

道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作，从而使得不道德的人遭受损失。这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德，或者正义或非正义的观念，就自动地产生了调节作用。

当然，道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的，当不道德的行为带来的利益大于道德的满足时，

共8页:

发生在我们身边的博弈(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档