一、支付矩阵
1、试给出下述战略式表述博弈的纳什均衡
B
A
U D
L 1,3 4,1 R 2,5 6,2 解:由划线解得知有一个纯战略均衡(D,R)
再看看它是否有混合战略均衡 设B以(?,1??)玩混合战略,则有 均衡条件:
VA(U)?1???2(1??)?2?? VA(D)?4???6(1??)?6?2? 2???6?2?
得??4?1,这是不可能的,故无混合战略均衡,只有这一个纯战
略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡
解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
B
A
U D
L 5,6 4,1 R 2,5 6,2 将博弈改成上述模型,则
5??2(1??)?4??6(1??) 2?3??6?2? 得 ??4 5同样,设A的混合战略为(?,1??),则
1
6??1?(1??)?5??2(1??)
1?5??2?3? ??1 2于是混合战略均衡为??,?,?,??。
二、逆向归纳法
1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡
1
2
1 2
(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1
L R
2 a b 1 1 2 L? R? L? R? c d
(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a的概率为P,
则1选L?的支付?5P?2(1?P)?2?3P
1选R?的支付?6P?3(1?P)?3?3P?2?3P
??11??41????22??55?? 2
故1必选R?。
? 给定1在第二个决策结上选R?,2在左边决策结上会选a,故子博弈精炼均衡
为
?L,R?,(a,d)?
四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为
c1?q1,其中q1为厂商1的产量。第2个厂商的成本函数为c2?cq2,其中q2为厂商
2的产量,c为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c是厂商2的“私人信息”,厂商1认为c在?,3?上呈均匀分布。设市场需求函数为
22?1???P?4?q1?q2,其中P为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均
衡为何?
解:给定q2,厂商1的问题是
max?1?(P?1)q1q1 ?(4?q1?q2?1)q13/2
因q2?q2(c)。厂商1不知道c,故目标函数为
max?1(4?q1?q2(c)?1)q1dcq12?2?max?3q?q?qq(c)dc11121??q1?2??3/2
一阶条件: 3?2q1??3/212q2(c)dc?0
313/2 得 q1???1q2(c)dc (1)
222厂商2的问题是:
max?2?(P?c)q2q2 ?(4?q1?q2?c)q2
2 ?(4?c)q2?q1q2?q2一阶条件:
(4?c)?q1?2q2?0
3
得 q2(c)?4?c?q1 (2) 2代入式(1):
313/24?c?q1??1dc2222313/24?q113/2 ???1??1cdc222242 22
34?q11??3??1?? ??????????248???2??2???q1? ?3?q14 得q1?1 代入式(2): q2(c)?3?c 2若c?1,则q1?q2?1
?1??2?1
若信息是完全的且c?1,则古诺博弈均衡为q1?q2?这说明信息不完全带来的高效率。
2、完美信息动态博弈。会用策略式表达、扩展式表达。用方框找纳什均衡,用树找子博弈精炼均衡。讲理由,看例题。
327?1,?1??2??1。 525
该博弈中有三个纳什均衡:
不进入,(进入,进入) 进入,(不进入,进入) 进入,(不进入,不进入)
4
前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入
如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。
①{不进入,(进入,进入)}
② {进入,(不进入,进入)}③{进入,(不进入,不进入)}
前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。因此,B的战略(进入,进入)是不可置信威胁。
①{不进入,(进入,进入)} ② {进入,(不进入,进入)} ③{进入,(不进入,不进入)}
均衡③意味着当A进入时,B选择不进入;而
5