信息经济学讲义(4)

2019-08-31 18:09

Information Economics 钻井干 0.704 不钻 1000000 -50000 0.136 -400000 -209600 -50000 0.864 -50000 信息的价值为：0.296*280400+0.702*（-50000）-（-50000）=97798 【练习2.4.2-1】?假设你有机会打赌掷铜板（可能两面都有图案；可能两面都没有；也可能一面有，一面没有）。如果猜对你将得到30元，但猜错将失去50元。开始你想得到两次正面（假设有图案的一面为正，没有图案的一面为反）、两次反面和一样一次的机会均等（即你相信铜板可能有三种情况，这三种情况的可能性相等）。如果你是风险中性。为了观察一个容量为1的样本，你愿意付多少钱？

3.博弈论基础

3.1博弈论概述

3.1.1博弈的概念

博弈论是关于如何进行选择与决策的学问。我们每天都会处于各种各样的选择与决策之中，比如今天上午你选择跟女（男）朋友逛街还是呆在教室学习。有的时候仅仅是需要你自己作出决定，不需考虑其他人怎么做，比如用你的奖学金买一个复读机学英语还是买一个飞利浦剃须刀送给你的父亲作为生日礼物。

多数情况下我们还是要考虑其他人怎么做的，进而调整或决定自己怎么做。比如你决定要谈恋爱，这就不是一个单人决策问题，需要另一个人配合才行，不幸的是，碰巧你的意中人同时还遇到另一位优秀青年的追求，那你的麻烦就更大了。

另一类更为常见的多人决策问题是对抗性游戏，如中国/国际象棋、围棋、NBA比赛。当然，你可能会争辩到，我下象棋时就不考虑对手如何下，我只管自己下，那除非你不想赢，并且还要面临以后没人愿意跟你玩的风险。

在军事、政治、经济领域存在大量的多人决策问题。

家电零售商巨头国美是否决定降价，不仅要考虑成本问题，还要考虑临近的竞争对手－三联的反应。烟台万华是否要在宁波建厂，不仅要考虑市场需求问题，还要考虑国外MDI巨头在华投资策略的影响。

中国银联是否尽快推出新的小额支付手段，要受到外资银行2006年获允进入人民币业务的影响。中海油竞购优尼科，不仅受自身扩张需求影响，还要考虑对手雪佛龙的反应。一个决策问题只要满足下述条件即可称为一个博弈：（1）n(n>1)人参与；

（2）每个人必须作出选择；

（3）任何一个人的效用受所有人选择的影响。

博弈，在英文中为Game，是对战略形势的标准描述。博弈论是关于如何进行选择与决策的学问，是对冲突与合作的标准研究，只要多个代理人之间的行动是互相依赖的时候，博弈的理论观念就起作用。这些代理人可以是个人、组织、公司或它们的组合。博弈论的思想提供了一种表述、构造、分析和理解战略情景的语言。

近几十年博弈论在经济学中的应用取得了巨大的成功，以至于博弈论被作为经济学的一部分。博弈的基本要素包括：参与人，行动，信息、战略，战略空间、结果，支付函数，均衡。参与人：博弈中选择行动以最大化自己效用的决策主体（可能是个人，也可能是团体，如国家、企业）。行动：参与人的决策变量。

战略：参与人选择行动的规则，它指导参与人在什么时候选择什么行动。（如“人不犯我，我不犯人；人若犯我，我必犯人”是一种战略，这里，“犯”与“不犯”是两种不同的行动，战略规定了什么时候选择“犯”，什么时候选择“不犯”）。

战略空间：参与人所有可选战略的集合。

信息：参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。结果：可能出现的各种组合状况，如战略的组合、行动的组合、支付的组合等。

Information Economics 支付函数：参与人从博弈中获得的效用水平，它是所有参与人战略或行动的函数。均衡：所有参与人的最优战略或行动的组合。博弈论其它基本术语：

共同知识。如果一个事实被所有的参与人知道，并且每个参与人都知道所有的人都知道，并且每个参与人都知道每个参与人都知道所有的人都知道，如此等等，以致无穷，那么，这个事实就是共同知识。

理性。如果一个参与人总是寻求最大化自己的支付，那么他就是理性的。所有参与人都是理性的通常被作为一种共同知识来对待。

3.1.2博弈论的历史和影响

最早的关于博弈理论的正式分析的例子是古诺1838年对双寡头的研究。数学家波莱尔于1921年提出了一种博弈论的正式理论，在此基础上，1928年数学家冯·诺伊曼把其发展成“室内游戏理论”。1944年冯·诺伊曼和摩根斯坦恩出版了名作博弈论与经济行为，标志着博弈论正式建立了起来。这本书定义了博弈论的基本术语，为解决博弈问题而对数据进行了安排，直到今天它们仍在使用。

1950年，纳什论证了有限博弈必然具有均衡点，在这点上，所有的参与人在给定他们的对手的选择的情况下选择最有利于自身的行动。从那时开始，这个非合作博弈论的中心概念就成为了分析的焦点。在五六十年代，博弈论在理论上得以拓展并且被应用到军事和政治当中去。70年代以后，它推进了经济理论的革命。并且它在社会学和心理学方面也得到了应用，建立了与进化和生物学的联接。博弈论在1994年得到特别的关注，因为这一年的诺贝尔经济学奖授予了三个博弈论的专家－纳什、海萨尼和泽尔腾。

在90年代末，对于博弈论的大量应用是在拍卖的设计上。

一些卓越的博弈论专家从事于对电磁波频谱波段的拍卖设计，以便把对它们的使用权利分配到移动电信产业。大多数这样的拍卖的设计目标是比传统的政府行为更有效率的分配这些资源，结果是，美国和欧洲增加了数十亿美元的财富。

博弈论的内部一致性和数学基础使得它成为在交互式环境的自动决策过程领域建模和规划一个主要的工具。例如，一个人可能希望对一个拍卖网站建立更有效率的出价规则，或者希望在购买通信带宽时能够进行具有数据篡改验证功能的自动谈判。

作为一种决策者的数学工具，博弈论的力量在于它提供了构造和分析战略选择问题时所用到的方法论。把一种形式转换为博弈模型需要决策者明确的列举出参与者和他们的战略选项，并且考虑他们的偏好和反应。

3.1.3博弈论与不对称信息经济学

博弈论提供了对多人决策问题的一种数学工具，它在经济学中的应用就是不对称信息经济学。可以说，博弈论与不对称信息经济学是一个硬币的两个方面，前者研究的是：给定信息结构，什么是可能的均衡结果？后者研究的问题是：给定信息结构，什么是最优的契约安排？前者是后者的方法论基础。

3.1.4博弈的分类

在博弈中，参与人有时是同时决策的，或者虽非同时决策但每个人在决策时并不知道其他人的决策，这样的博弈，我们称其为静态博弈，否则，如果参与人决策有先有后，是按照一定的时间顺序先后来决策的，并且后决策者有可能观察到前人的决策，这样的博弈叫做动态博弈。当然，在博弈的时候还有可能你对对手一无所知，这样的博弈就叫做不完全信息博弈，否则叫做完全信息博弈。

这样，博弈的分类，如果按照时间先后顺序来分的话，为静态博弈和动态博弈；如果按照信息来分类的话，为完全信息博弈和不完全信息博弈。组合一下，即为四种类型的博弈，这四种类型的博弈各有一种形式的均衡概念，如表3.1.4-1所示。

表3.1.4-1 博弈的分类及其均衡

同时行动不同时行动完全信息完全信息静态博弈（纳什均衡）完全信息动态博弈（子博弈精炼纳什均衡） 14

不完全信息不完全信息静态博弈（贝叶斯均衡）不完全信息动态博弈（精炼贝叶斯均衡）

Information Economics 3.2完全信息静态博弈

在这里我们讨论这样一种情况：参与人同时行动或虽非同时行动但后行动者并不知道前行动具体采取了什么行动，而且，每个参与人的特征、战略空间、支付函数都是共同知识。在完全信息静态博弈中，战略等同于行动。

3.2.1博弈的标准式表述

对于完全信息静态博弈，可以用如下的标准形式来表示：

参与人2的战略参与人1的战略 R D L M c1R,c2L c1D,c2L c1R,c2M c1D,c2M R、D与L、M分别表示参与人1、2的战略（行动），左边的c表示参与人1的支付，右边的c表示参与人2的支付，而支付也反映了参与人对一种结果的希求程度，或这种结果给他带来的效用。如c1R,c2L表示结果（R，L）分别给参与人1、2带来的效用。

我们借用一个经典的例子来说明博弈的标准式——囚徒困境。两个犯罪嫌疑人被捕并受到指控，但除非至少一个人招认犯罪，警方并无充足证据将其按罪判刑。警方把他们关入不同的牢室，并对他们说明不同行动带来的后果。如果两个人都不坦白，将均被判为轻度犯罪，入狱一个月；如果双方都坦白招认，都将被判入狱6个月；最后，如果一人招认而另一人拒不招认，招认的一方将马上获释，而另一人将判入狱9个月——所犯罪行6个月，干扰司法加判3个月。

囚徒面临的问题，用博弈的标准式表示如下：

囚徒2的战略囚徒1的战略沉默招认

一般的，博弈的标准式表述包括：（1）博弈的参与人，（2）每一个参与人可供选择的战略集，（3）针对所有参与者可能选择的战略组合，每一个参与者获得的收益。

我们后面将讨论到n个参与人的博弈，其中参与人从1到n排序，设其中任一参与人的序号为i，令代表参与人i可以选择的战略集合（称为i的战略空间），其中任意一个特定的战略用成

沉默 -1，-1 0，－9 招认 -9，0 -6，-6 Sisi表示（有时我们写

(s,?,sn)表示每个参与人选定一个战略形成的战略组si?Si表示战略si是战略集Si中的要素）

。令1合，i表示第i个参与人的收益函数，i将上述内容综合起来，我们得到：

uu(s1,?,sn)即为参与人选择战略(s1,?,sn)时第i个参与人的收益。

【定义】在一个n人博弈的标准式表述中，参与人的战略空间为我们用

S1,?,Sn，收益函数为u1,?,un，

G?{S1,?,Sn;u1,?,un}表示此博弈。

Information Economics 3.2.2重复剔除严格劣战略

上节已讲过一个博弈的表述方法，下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始，因为它较为简单，只需用到这样一个原则来分析：理性的参与人不会选择严格劣战略。

在囚徒的困境中，如果一个嫌疑犯选择了招认，那么另一人也会选择招认，被判刑6个月，而不会选择沉默从而坐9个月的牢；相似的，如果一个嫌疑犯选择沉默，另一个人还是会选择招认，这样会马上获释，而不会选择沉默在牢里渡过一个月。这样，对第i个囚徒来讲，沉默相比招认来说是劣战略——对囚徒j可以选择的每一个战略，囚徒i选择沉默的收益都低于选择招认的收益；同样招认相比沉默来说是占优战略。更一般的：

'\'G?{S,?,S;u,?,u}sssi1n1niii【定义】在标准式的博弈中，令和代表参与人的两个可行战略（即\'\Ssssiiiii和是中的元素）。如果对于其它参与人每一个可能的战略组合，选择的收益都小于其选择的收'\ss益，则称战略i相对于战略i是严格劣战略：

'%u(s,?s,s,s,?,s)?u(s,?s,s,si?1,?,sn)对于其它参与人在其战略空间i1i?1ii?1ni1i?1i也即，

S1,?Si?1,Si?1,?Sn中每一组可能的战略(s1,?si?1,si?1,?,sn)都成立。相反，称战略si\相对于战略si'是

严格占优战略。

由于理性的参与人不会选择严格劣战略，所以在囚徒困境中，一个理性的囚徒总会选择招认，于是（招认，招认）就成为两个理性囚徒的结果，尽管（招认，招认）带给双方的福利都比（沉默，沉默）要低。下面，我们看一下理性参与人不选择严格劣战略这一原则是否能解决其它博弈问题。看下面的抽象的例子。

表3.2.2-1 一个抽象的博弈

上下

参与人2

左 1，0 0，3 中 1，2 0，1 右 0，1 2，0 参与人1

}，S2?{左，中，右}。对参参与人1有两个可选战略，参与人2有3个可选战略：S1?{上，下与人1来说，上和下都不是严格占优：如果2选择左，上优于下（因为1>0），但如果2选择右，下就会优

于上（因为2>0）。但对参与人2来说，右严格劣于中（因为2>1且1>0），因此理性的参与人2是不会选择右的。那么，如果参与人1知道参与人2是理性的，他就可以把右从参与人2的战略空间中剔除，即如果参与人1知道参与人2是理性的，他就可以把表3.2.2-1所示博弈视同为表3.2.2-2所示的博弈：

表3.2.2-2 第一步剔除劣战略后的博弈

上下

参与人2 左 1，0 0，3 中 1，2 0，1 参与人1

在表3.2.2-2中，对参与人1来说，下就成了上的严格劣战略，于是如果参与人1是理性的（并且参与人1知道参与人2是理性的，这样才能把原博弈简化为表3.2.2-3），参与人1就不会选择下。那么，如果参与人2知道参与人1是理性的，并且参与人2知道参与人1知道参与人2是理性的（从而参与人2知道原博弈将会简化为表3.2.2-3所示的博弈），参与人2就可以把下从参与人1的战略空间中剔除，余下表3.2.2-3所示博弈。但这时对参与人2，左又成为中的严格劣战略，仅剩的（上，中）就是此博弈的结果。

Information Economics 表3.2.2-3第二步剔除劣战略后的博弈

参与人1

下

参与人2 左 0，3 中 0，1 上面的过程可称为“重复剔除严格劣战略”。尽管此过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上，它仍有两个缺陷：

第一，每一步剔除都需要参与人之间相互了解的更进一步假定，如果我们要把这一过程应用到任意多步，就需要假定“参与人是理性人”是共同知识。这意味着，我们不仅需要假定所有参与人是理性的，还要假定所有参与人都知道所有参与人是理性的，还需要假定所有参与人都知道所有参与人都知道所有参与人是理性的，如此等等，以至无穷。

重复剔除严格劣战略的第二个缺陷在于这一方法对博弈结果的预测经常是不精确的。例如在下面的例子中——表3.2.2-4，就没有可以剔除的严格劣战略。既然所有战略都经得住对严格劣战略的重复剔除，该方法对分析博弈将出现什么结果毫无帮助。

表3.2.2-4 不能进行重复剔除的博弈

上中下左 0，4 4，0 3，5 中 4，0 0，4 3，5 右 5，3 5，3 6，6 下面我们给出纳什均衡的概念，这是一种博弈的解的概念，可以对非常广泛类型的博弈作出严格得多的预测。纳什均衡战略绝不会在重复剔除严格劣战略的过程中被剔除掉，而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件，通过这个我们来说明纳什均衡是一个比重复剔除严格劣战略更强的解的概念。

3.2.3纳什均衡

导出纳什均衡的途径之一，是证明如果博弈论还可以为博弈问题提供一个惟一解，此解一定是纳什均衡，原因如下。设想在博弈论预测的博弈结果中，给每个参与人选定各自的战略，为使该预测是正确的，必须使参与人自愿选择理论给他推导出的战略。这样，每一个参与人要选择的战略必须是针对其它参与人选择战略的最优反应，这种理论推测结果可以叫做“战略稳定”或“自动实施”的，因为没有参与人愿意独自离弃他所选定的战略，我们把这一状态称为纳什均衡。

换句话说，纳什均衡是这样一种战略组合，任何人都无法通过单方面改变自己的战略获得更好的支付在给定其它参与人战略不动的情况下。

G?{S1,?,Sn;u1,?,un}中，如果战略组合{s1,?,sn}满足对每

【定义】在n个参与人标准式博弈

**{s,?,si?1,si?1,?,sn}的最优反应s一参与人i，i是（至少不劣于）他针对其他n?1个参与人所选战略1**{s,?,s}是该博弈的一个纳什均衡解。即： 1n战略，则称战略组合

****ui(s1,?,si*?1,si*,si*?1,?,sn)?ui(s1,?,si*?1,si,si*?1,?,sn)对所有Si中的si都成立，亦即si*是以下

*****最优化问题的解：

**maxui{s1,?,si*?1,si,si*?1,?,sn}si?Si。

为把该定义和开始提到的指导思路联系起来，设想有一标准式博弈

G?{S1,?Sn;u1,?,un}，博弈论

''''{s,?,s}{s,?,sn，如果1n}不是G的纳什均衡，就意味着存在一些参与人i，为它提供的解为战略组合1 17

共10页:

信息经济学讲义(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档