第六章 不完全信息动态博弈
第一节 完美贝叶斯均衡
引入“完美贝叶斯均衡”的目的是进一步“精炼”贝叶斯纳什均衡。就像子博弈完美的条件是为了“精炼”动态博弈中的纳什均衡一样,其是为了剔除不可置信的威胁(或者承诺)。
子博弈完美不仅要求参与者的策略组合是一个纳什均衡,而且要求其在每一个子博弈中都是纳什均衡。和子博弈完美纳什均衡类似,当不完全信息博弈由静态发展到动态之后,我们也面临对原有“均衡”概念进一步精炼的要求。
当然,本章中,我们不是考虑“子博弈”,而是考虑更加广义的“后续博弈(continuation game)”,和子博弈相比,它可以不是始于单节的信息集。
(请联系后面“完美贝叶斯均衡”“序贯均衡”的定义,思考:不同的“均衡”定义是如何以何种方式考虑到前面提到的“后续博弈”的)
和上一章一样,本章中的博弈存在“不完全信息”,这涉及到参与者行动时所依据的“信念”。因此,对均衡解的“精炼”,就必须设计对“信念”的考察。而我们对不完全信息的处理,仍然沿用上章的“海塞尼转换”,假设有个0博弈方“自然”,决定各参与人的类型但是只将类型告诉本人。于是,“不完全信息”可以转变为“不完美信息”。
当然,处理“不完全信息动态”博弈中“均衡”的“精炼”问题时,子博弈完美并不能“胜任”。但是,既然“不完全信息”可以通过“海塞尼转换”转变为“不完美信息”,则对“不完全信息”的精炼方法,同样适用于“不完美信息动态博弈”。
(回忆前面的“完全但不完美信息动态博弈”,为什么没用考虑到进一步的“精炼”,或者说本章将要进行的对“信念”的精炼?因为前面的信息“不完美”是由于“同时选择”造成的,而且我们假定其“同时选择的子博弈”中有唯一的纳什均衡,因此,不需要对信念进行进一步的精炼)
首先,我们通过以下例子来说明进一步“精炼”的必要性:
1 R L 2 L’ (2, 1) L L’ R’ M R’ (1, 3)
R’ L’ (0, 0) (0, 2) (0, 1)
2, 1 0, 0 M 0, 2 0, 1 R 1, 3 1, 3
此博弈有两个NE:(L,L’)和(R,R’),而且本博弈没有子博弈,因此,子博弈完美的要求自然满足。然而,(R,R’)却依赖一个明显不可信的威胁。
为了“精炼”掉这样的NE,我们提出以下要求:
要求1:在每一个信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪一个节点有一个推断(信念belief)。
要求2:给定参与者的推断,参与者的策略必须满足序贯理性(sequentially rational)的要求。
比如上例中:
1 R L p L’ (2, 1) 2 (1, 3)
M 1-p R’ R’ L’ (0, 0) (0, 2) (0, 1)
给定推断(p,1-p),L’的期望得益=p1+(1-p)2=2-p>R’的期望得益=1-p。因此,就排除
了(R,R’)。
这是一种特殊情况,那么,参与者的信念是否有都是“理性”的呢?
定义:对于一个给定的扩展式博弈中给定的均衡,如果博弈根据均衡策略进行时,将以正的概率到达的信息集,我们称是处于均衡路径上的;反之,则称为是非均衡路径上的信息集。
要求3:在处于均衡路径上得信息集中,推断由贝叶斯法则及参与者的均衡策略给出。(信念要与策略相容)
以上三个要求包含了完美贝叶斯均衡的主要内容,Wilson and Kreps(1982)将推断(信念)提到了和策略同等重要的位置。在这里,一个均衡不再只是一个策略组合,还包括每一个行动集的推断。
In dynamic Bayesian games, an assessment consists of a strategy profile σ and a system of belief μ.
The belief μi of player i is strategically consistent with the strategy profileσ, if it is derived from the Bayesian rule when it’s along the equilibrium path.
The strategy σi of player i is sequentially rational if given μi and all other players’ strategy, σi maximizes i’s (expected) payoff starting from each of his information set.
An assessment [σ, μ] is said to be a weak perfect Bayesian equilibrium, if (1) every player’s belief is strategically consistent with σ, and (2) every player’s strategy is sequentially rational.
但是,这并不足够。如下例所示:
12, 0, 0 B2Upl 1, 2, 1 1 2 A 3 l r B 3 L r r 3l 0, 1, 2 D1-p r A3, 3, 3 0, 1, 1
U 2,0,0 2,0,0 1,2,1 3,3,3 D 2,0,0 2,0,0 0,1,2 0,1,1 NE: (A, U, l) (A, D, l) (A, D, r) (B, U, r)
除(A, D, r)中2的策略不满足“序贯理性要求”外,其他都是WPBNE
然而,只有(B, U, r)是子博弈完美的。
这是因为,WPBNE并没有考虑到“均衡路径”外的情况。 对于“均衡路径”外地信念的精炼,有两种思路: (1)序贯均衡sequential equilibrium
Let σ be an assessment. Let {σ(v)} be any sequence of completely mixed behavior strategy profile which converges to σ as v tends to infinitely. For each v, let μv be the beliefs computed by the Bayesian rule according toσv. Let μ be the limit of {μv }. Thenμ is said to be consistent with σ.
对于上例:
(2)要求4:处于均衡路径之外的信息集,推断有贝叶斯法则和可能情况下的参与者均衡策略决定。
定义 满足要求1到4的策略及其推断(信念)构成博弈的完美贝叶斯均衡。
对于上例:
但仍有缺陷:
完美贝叶斯均衡要求参与者不可威胁使用始于任何信息集的严格劣策略,即使是处于均衡路径之外的。
(思考子博弈完美为什么不足够?一是有可能没有子博弈,二是完美贝叶斯均衡要求给定信念,策略要最优,同时给定策略,信念要理性……如此循环,逆推归纳是很难满足的。) 上述例子事实上还隐含了要求5:在均衡路径之外的推断中,如果一个节点只有在另一参与者选择始于某些信息集的严格劣策略时才能到达,则到达该节点的概率为0.
第二节 信号博弈
信号发送者S;信号接受者R
1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,∑p(ti)=1 2、S观察到ti后从可行的信号集M中选择信号mj发送 3、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak 4、双方收益为us(ti,mj,ak),ur(ti,mj,ak)
简单情况T={t1,t2},M={m1,m2},A={a1,a2},pro{t1}=p
a1 a1 m1 t1 m2 a2 P 0 1-p a1 m1 t2 a2 m2 a2
a1 a2
接受者和发送者都有四个纯策略:
混同(pooling)策略,如果类型多于两种还可能存在部分混同(partially pooling)或者称为准分离(semi-separating)策略。
分离策略
“杂合策略”(hybrid strategies),比如t1选择m1,t2却随机地选择m1或m2.
如果最后的均衡中,若发送者的策略是混同的,则称为混同均衡,如果是分离的,则称分离均衡。
我们把前面完美贝叶斯均衡的要求替换为以下信号要求:
信号要求1:在观测到M中任何信号mj后,接受者对哪些类型会发送mj有个推断:
p(ti|mj),p(ti|mj)?0且?p(ti|mj)?1。
ti?T信号要求2R:对M中每一mj,在给定哪些类型可能发送mj的推断p(ti|mj)条件下,接受者的行动a(mj)必须使接受者的期望收益最大化。
信号要求2S:对于T中的每一ti,在给定接受者策略a(mj)的条件下,发送者选择信号m(ti)必须使发送者的收益最大化。
信号要求3:对于每一M中的mj,如果T中存在ti使得m(ti)?mj,则接受者在对应于mj的信息集中所持有的信念取决于贝叶斯法则和发送者策略:
????p(ti|mj)?ti?Tjp(ti)
?p(ti)其中,Tj是根据S的策略,所有可能选择mj的ti的集合。
?定义 信号博弈中一个纯策略完美贝叶斯均衡为一对策略m(ti)和a(mj)以及信念
?p(ti|mj),满足上述信号要求1,2S,2R,3.
(以上定义中Tj不是空集,说明其信息要求没有考虑“均衡路径”之外的信念,但是后面的例子中,我们在分析中仍然考虑了均衡路径之外的信息集,注意是怎么分析的)
例子:
1,3 u 2,1
L t1 R qu d p4,0 d 0,0
0.5 0 2,4 u 0,1 只考虑纯策略 1、混同于L 2、混同于R 3、分离t1选L 4、分离t1选R
1-p 0.5 1-q L t2 R d 1,0
u d 1,2