Information Economics 后面我们将说明“期望效用原则”怎样综合所有以上要素,以使个人能作出最优行动的决定。
2.3.2行动表
有两种主要类型的个人行动:最终行动和依信息的行动。
在不确定情况下的最终行动的一个事例就是在现有的样本数据基础上要做出决定的统计问题:例如,在实验检验的基础上,管理部门得决定是否批准一种新药物。
依信息的行动是关于在做出最终行动前是否并如何改进自己的知识状态的决策。在依信息的行动类型中将涉及到统计选择,诸如:在做出最终决策之前需要收集多少附加的证据,采用何种抽样技术等等。
2.3.3概率函数
我们假定,每个人都有能力把自己对现实世界出现不同状态的可能性(比如,自然将选择下雨或天晴的可能性)的信念表达成一个主观的概率分布。假定现实世界的状态是离散的,个人能够用一个0到1之间但不包括1的数πs来表示他对状态s出现的相信度,并且这些数字之和等于1:∑sπs=1。在极端的情形,如果个人能肯定某个特殊的状态s就要发生,那么1个单位的全部概率权重都赋予该状态,也就是πs=1,因此,集合1,?,s,?,S中的其它状态赋予0概率。更一般的,在可能状态范围上的一个相对“紧”的概率分布表示一种高度的主观肯定;而一个非常分散的概率分布则表示一种高度的不肯定。 有时我们会发现,将现实世界的状态变量假设成连续的变量是很方便的,此时不同状态的个数无穷大且不可数。这样任何一个单一状态发生的概率被认为是零(“无穷小量”),尽管该事件有可能发生。如果把状态变量s定义为连续的,其中s可以是0和S之间的任意实数,那么个人的主观概率信念可表示成一个满足∫s0π(s)ds=1的概率密度函数π(s)。
2.3.4概率信念的一致性
有个人相信有关降雨概率的可信信息不久将以新闻的形式出现。他相信新闻会报到“肯定下雨”的机会为50%,“不下雨”的机会为30%,而“降雨概率为0.5”的机会为20%。这是否与他现在所相信的下雨可能性为2:1相一致呢?
2.3.5信息和置信
奈特认为,一个人的行为在很大程度上依赖于“他对自己正确估计机会的估计”,或者说,依赖于他对自己信念的置信度。这需要我们区分“强的”和“弱的”概率估计。
假设在一次即时打赌中,你不得不估计下一次抛掷硬币时出现“正面”的概率。
A硬币:你以前抛过多次,并且发现出现正反面的频率正好相等。如果你有推理能力,你会对出现“正面”的相信度(主观概率)赋予0.5值,并且对这个值很有把握。
B硬币:你对它一无所知,你甚至无法核查该硬币是否是两个“正”面或两个“反”面的可能性。不管怎么说,如果你必须给出一个数字,那你会强迫自己给下一次抛掷硬币时出现“正面”的可能性赋予0.5的概率,因为作为一个有推理能力的人,你缺乏任何证据说明出现“正”面的相信度比出现“反”面的相信度更高或者更低。但是你对硬币B出现“正”面的概率为0.5的概率的置信度肯定很小。
如果0.5的同样概率是以上述刚提到的两种方式之一给出的,那么与该概率相关的行动在这两种情形之间会不一样吗?
答案是不会不一样,如果你作出的是最终行动; 答案却又是会不一样,如果你选择依信息的行动。 当要进行这样的选择时,你会投入更多的金钱和精力去获取有关硬币B的信息,而不是硬币A的信息。 简言之,越是先验的怀疑(置信度越低),在最终行动之前获取额外信息的事越重要。所以,一个人依信息的行动,尽管不是最终行动,确实依赖于他对其信念的置信度——用奈特的话讲就是,依赖于他“对自己正确估计机会的估计”。
【例2.3-1】根据一枚硬币出现正面的机会,假设现实世界中三种状态的可能性:状态1:出现正面的机会为100%(硬币的两面都是正的);状态2:出现正面的机会为50%(硬币是正反两面);状态3:出现正面的机会为0%(硬币的两面都是反的)。
有一个人最初赋予三种状态相等的概率(π1, π 2, π 3)=(1/3,1/3,1/3)。 (A)对一种即时的打赌(最终行动),怎样估计下一次抛硬币时出现正面的概率P才是最好的? (B)假设新的信息使他把概率向量改变为(π1, π 2, π 3)=(0,1,0)。你现在能说他对P的
8
Information Economics 最好估计是多少吗?在估计中他的置信会发生怎样的变化。
(C)如果新的信息使他的概率向量改变为(π1, π 2, π 3)=(1/2,0,1/2),那么你怎样回答以上同样的问题。
2.3.6结果函数
在单人决策时,就如表2.3.1-1所示,每个结果都是一个经济代理人对行动的选择与自然对现实世界状态的“选择”组合而成的结局。从本质上说,结果是对这样一种互动所导致的个人处境的各个方面的全面描述。例如,某个人决定不带雨伞而自然选择下雨,结果可能包括:被雨淋湿、上班迟到以及各种其它的不愉快事件。效用就是某个人对一种结果的希求程度,反映了他对这种结果的偏好,我们用v(c)来表示。
效用直接与结果相连,而只衍生的与行动相连。前面,我们用v(c)表示在结果c之上的偏好量函数,这里,我们用U(x)表示他在行动x之上衍生出的偏好序数。核心的差别在于:
v(c)是一个定义在结果之上的偏好量函数; U(x)是定义在行动之上的效用函数。
要分析的问题就在于解释和说明这种衍生,也就是说明在给定结果之上的直接偏好时,个人怎样按愿望对他的可能行动进行排序。选择一个行动就是选择像表2.3.1-1的结果矩阵的一行。因为个人还被假设成要与发生的每种状态的一个概率(信念度)相联系,这样的一行可视为一个概率分布。因此,我们可以把一个人视为在概率分布中或“期望”中进行选择。行动x的不确定结果的状态概率为的表示成:
cx?(cx1,cx2,?,cxs)被分别接受
??(?1,?2,?,?s)——当然,概率和为1,这样与行动x相联系的“期望”可用符号方便
x?(cx1,?,cxs;?1,?,?s)
关键之处就在于连接结果函数v(c)和行动的效用次序U(x)。我们可以使用著名的冯·诺依曼和摩根斯坦恩“期望-效用法则”做这种连接:
U(x)??1v(cx1)????sv(cxs)???sv(cxs)s?1s
U(x)大,则说明行动x是值得的。
注意:在处理确定情形下的选择时,标准经济理论把效用(偏好的处理强度)处理成序数变量而非基数变量。这假设:个人可以说“我偏好组合商品A胜过组合商品B”。而不需要说出A胜过B的数量是多少。另外,如果对于任何给定的偏好量函数,如果该函数是向结果(消费组合)配置了一个正确描述确定情形选择的基数,那么该函数的任何序数(正单调)变换也将正确的描述确定情形的选择。当选择不涉及风险时,假设某种尺度的基数u表示结果的效用——当然其中u越高表明对结果越满意,那么对这些数的任何正单调变换都会得出同样的决策。例如,一个人总是偏好更多的消费收入c,这样我们可以说“他试图使函数u?c最大化”。可是,最大化u的收入水平也是最大化logu或e,此两者都是u的正单调变换。
uc因此u?e或u?logc同样好的表达了偏好量。更正式的,如果u是确定情形下选择的满意函数,那么
9
Information Economics u?F(u)只要满足一阶导数F'(u)?0。
2.3.7期望效用法则的使用
假设你是一家商场的经理,要决定秋季服装的订货量,如果你订购100套,每套的价格是180元;如果订购50套,每套的价格是200元。你标出的售价是300元,但你不知道衣服的销路如何。你可以将没有销出的衣服退给厂商,但只可以得到进价的一半。在没有足够信息的情况下,你只能判断售出100套的概率是0.5,售出50套的概率是0.5。下表给出了你可能的收益: 1.订50套 2.订100套 售出50套 50*300-50*200=5000 售出100套 50*300-50*200=5000 期望收益(据期望-效用法则) 5000*0.5+5000*0.5=5000 1500*0.5+12000*0.5=6750 50*300+50*90-100*180=1500 100*300-100*180=12000 如果是进行最终行动决策,最佳行动是订100套。
2.3.8风险与不确定性
就如奈特最初提出的那样,许多经济学家都曾试图区分风险和不确定性。
(1)奈特认为“风险”是指个人根据对事实的客观分类有能力计算出概率的情形。例如,在掷一个公正的骰子时,出现任何一面的概率都是六分之一。
(2)奈特还争辩到,“不确定性”是指不可能客观分类的情形。例如,估计下一个十年是否能发现治愈癌症的方法。
但也有不同的看法。赫什莱佛在《不确定性与信息分析》一书中不同意奈特的划分。他认为i,风险和不确定性是指同一件事。能否进行客观分类不是关键之所在。因为他将用“主观”概率的概念来处理这类事:概率只能简单的算作相信的程度。事实上,就是在抛骰子这样能对可能出现的面分配“客观”概率的情形中,以客观概率出现骰子的面也是一种虚幻的感觉。只有在骰子是均匀和公正时——这是一种没人能客观肯定的条件,骰子的任何一面出现的机会为六分之一的结论才是一个有效结论。因此,决策者绝不会处于奈特所定义的风险世界,相反却总是处于他所定义的不确定世界。
决策者对待风险的态度体现在决策者的效用函数之中。这一点很容易理解。不同的决策者面对的概率分布是相同的。他们的决策原则也都是使期望效用最大化。因此,他们做出不同选择的原因在于他们各自的效用函数是不同的。这里的效用函数的一个重要作用就是显示出他们对待风险的态度不同。
有三种对待风险的态度:风险喜好,风险中性,风险厌恶。先看一种情形:假设你有150元钱,你是否愿意拿出其中的50元跟我玩一次掷硬币游戏(赌正反面),假如你猜对,我支付你50元,假如你猜错,你给我50元。如果你愿意,说明你是风险喜好型,如果不愿意,你是风险厌恶型,如果觉得无所谓,则你是风险中性型。
风险喜好型的效用函数可用v(c)?e的曲线表示,如图2.3.8-1所示。在图中,A点所表示的效用为
c0.5v(100)?0.5v(200),B点所表示的效用为v(150),A点高于B点。
风险厌恶型的效用函数可用v(c)?lnc的曲线表示,如图2.3.8-2所示。在图中,A点所表示的效用为
0.5v(100)?0.5v(200),B点所表示的效用为v(150),B点高于A点。
风险厌恶型的效用函数可用v(c)?c的曲线表示,如图2.3.8-3所示。在图中,A点所表示的效用为
0.5v(100)?0.5v(200),B点所表示的效用为v(150),但A、B重合。
在保险市场中,可以运用统计方法计算并预测其发生概率的风险,称为可保风险;不能用预测方法计算并预测其发生概率的风险,称为不可保风险。可保风险可以通过一定的市场形式转移。
【例2.3.8-1】完全保险
10
Information Economics 投保前:5000元,损失1000元的概率为0.1。
保险合同:1元可保10元,花100元购买1000元的保险。
投保后:如果损失发生,得到4900?如果不损失,也得到4900?
2.4信息决策分析
这一节分析个人在以下两个选择之间如何作出最优选择(1)立即采取最终行动;或(2)先获取信息以做出更好的最终决策。
2.4.1用事实修改信念及贝叶斯定理
表2.4.1-1是表2.3.1-1的一般形式。对于一组可供选择的最终行动x=(1, …,X)和一组现实状态s=(1, …,S),个人的行为选择和自然的状态选择相互作用而决定了一个相关结果Cxs。表的底部显示了个人的当前概率信念的分布,其中ps是状态s出现的概率,且Ss ps=1。
表2.4.1-1
状态(s) 行动(x) 1 2 ? x 信念 1 c11 c21 ? ? p1 2 c12 c22 ? ? p2 ? ? ? ? ? ? s c1s c2s ? cxs ps 在采取最终行动时每个人都选择有最高期望效用的行动x。?接收到任何一个特定的消息m一般都会导致对概率信念的修正,进而导致选择不同的最终行动。利用贝叶斯定理根据新的信息来修改个人的概率估计,即决策者把先验概率转化为后验概率。
假定L=[lsm]表示在任一给定状态下任意消息的条件概率qms。
表2.4.1-2 矩阵L
状态(s) 消息(m) 1 2 ? m 1 q11 q21 ? ? 1.0 2 q12 q22 ? ? 1.0 ? ? ? ? ? 1.0 s q1s q2s ? qms 1.0 则,状态s和消息m的联合概率(例如,状态可能是“明天下雨”,消息是“气压表显示正在下降”)jsm
可通过jsm= ps·qms计算得出。即矩阵L的每一行各个元素分别与对应的pi相相乘。
表2.4.1-3 联合概率
状态(s) 消息(m) 1 2 ? m 1 J11 J21 ? ? 2 J12 J22 ? ? ? ? ? ? ? 表2.4.1-4 后验概率
s J1s J2s ? jms 消息的概率 q1 q2 ? qm 则jis/qi即为消息i发生后状态s的后验概率。如表2.4.1-4所示。
状态(s) 消息(m) 1
1 J11/ q1 2 J12/ q1 11
? ? s J1s/ q1 Information Economics 2 ? m J21/ q2 ? ? J22/ q2 ? ? ? ? ? J2s/ q2 ? jms/qm 2.4.2最优选择的修正及信息价值的计算 当接收到一个特定的消息m时,根据后验概率可以重新得出一个最佳的行动xm。
那么每一个消息所对应的最佳行动的期望乘以该消息的出现概率,然后求和就是包含该消息的消息服务所带来的期望收益。
具体而言,如果一个消息服务m的特征由特定的似然矩阵L和先验信念p决定,那么信息的期望价值(消息服务的价值)是?(?)????mssm**qmv(csm)???sv(cso)
s【例2.4.2-1】在你的土地下可能有石油,最终行动是要么投入巨资开采,要么不投入,而做出决策必
定要依赖于对地下有油的可能性的估计。假设有油的可能性为0.24,没油的可能性为0.76。如果采取行动x=1(钻井),有油则获利1000000,没油则亏损400000;如果采取行动x=2(不钻),搬移钻井设备要花费成本50000。
假定有一个消息服务,其形式为在钻井之前进行地质分析,该消息服务的特征由以下似然矩阵L描述。你愿意付多少钱购买这一消息服务?
表2.4.2-1 最终行动表
钻井 不钻 有油 1000000 -50000 0.24 消息 状态 有油 没油 0.6 0.2 湿 没油 -400000 -50000 0.76 表2.4.2-2 似然矩阵
期望 0.24*1000000-0.76*400000=-64000 -50000 干 0.4 0.8 1.0 1.0 计算过程为:
(1)首先计算联合概率。
状态 有油 没油 先验 概率 消息 湿 0.24 0.76 消息 湿 0.6 0.2 消息 湿 干 干 湿 消息 干 0.24*0.6=0.144 0.24*0.4=0.096 0.76*0.2=0.152 0.76*0.8=0.608 0.296 消息 湿 干 0.144/0.296=0.486 0.096/0.704=0.136 没油 -400000 -50000 0.514 期望 280400 -50000 0.704 先验概率 0.4 0.8 qm: (2)计算后验概率。
干 状有油 0.24 态 没油 0.76 (3)信息价值的计算 0.6 0.4 0.144 0.096 0.2 0.8 0.152 0.608 0.152/0.296=0.514 0.608/0.704=0.864 0.296 0.704 钻井 湿 0.296 不钻 12
消息 有油 1000000 -50000 0.486