C6.供应链博弈(价格决策)
考虑由一个供应商和一个零售商组成的供应链系统。假定供应商的生产能力没有限制,从订购货物开始到货物到达零售商手中的时间(提前期,Lead time)不计。供应商决定供应给零售商产品的批发价w。零售商面对的市场是确定的,市场需求为q?a?bp,a?0,b?0,其中p?w?m为市场价格,m为零售商获得的边际利润,零售商决定边际利润m。假定供应商生产单位产品的成本为c,不考虑固定成本,两个供应商对彼此的生产成本相互了解,对博弈的进程也相互了解。供应商的利润Js(w,m)?(w?c)[a?b(w?m)]
零售商的利润Jr(w,m)?m[a?b(w?m)]
问题:(i) 求供应链集中系统(三家企业视为一家企业)的解;(ii) 求在两个供应商同时决策下求两个供应商纳什均衡解(供应链分散系统的解);(iii) 试对供应链集中系统和分散系统的解进行比较;(iv) 求在两个供应商先后决策下求两个供应商Stackelberg均衡解(供应链分散系统的解)。
C7.不完全信息博弈模型
(i)有两个参与人,分别称为企业1和企业2,他们生产同一类产品用来满足同一市场上顾客的需求;(ii)两家企业生产相同质量的产品; (iii)用qi,i?1,2表示企业i的生产批量,P?a?(q1?q2)表示逆需求函数(P是价格),a?0;(iv)两家企业同时决策各自的生产批量;(v)两家企业的生产均无固定成本,企业1的生产成本函数为C1(q1)?c1?q1,其中c1称为企业1的边际成本,企业2采用m种技术对应的成本为: C2(q2)?c2k?q2k,k?1,2,?,m,企业2知道自己采用哪一种技术,而企业1不知道企业2采用哪种技术,但知道企业2采用第k种技术的概率为?k,k?1,2,?,m,其中?k满足??k?1(不完全信息)。
k?1m 6
问题:两企业如何决定各自的生产批量?
第IV部分
行为博弈论是将个人的社会偏好等行为因素引入博弈论,研究的核心是在考虑参与方的心理行为情况下决策主体的实际行为发生直接相互作用时的决策以及这种决策的均衡问题。传统博弈论与信息经济学一直以“理性人”为理论基础,通过一个个精美的数学模型搭建起公理化的完美的理论体系。 然而,心理学和行为科学的研究发现人们也有很多与此假设相背的行为,比如人们会有公平心理和平等倾向。行为博弈论与当代的行为经济学、实验经济学,乃至神经元经济学都密切相关。
下面列举三个经典行为博弈的例子: D1. 投资博弈
有两位博弈者,分别称之为投资人A和借款人B。他们互不相识,博弈者A得到一笔钱并被告知可以完全保留也可以将其中的任意比例借给B,他给出的任何金额都会以大于1 的某一倍数付给B,然后由B决定是否回报和回报多少给A。
实验模型:将招募来的博弈方安置在计算机实验室中,每人有10元的出场费,两人一组通过各自面前的计算机联系,相互不认识而且实验结束也不会知道对方是谁。每组中的一位(投资人A)可以完全保留手中的10元也可以将其中的任何部分借给对手(借款人B),不管A付出多少,B都会收到3倍的金额,如A借给对方4元,B总共会得到4?3?10?22元的支付,然后由B决定是否还钱给A和还多少,只要B 愿意借钱给A也同样会收到3倍的金额。
标准博弈论的预测结果:按照标准博弈论,理性的B应该最大化他自身的
7
利益,那么他的最优策略就是保有获得的所有收益,不会返还给参与者A。而理性的A当然会估计到B的策略,因此A不会借钱给B,这就是纳什均衡点。即在这样的一次性博弈中,纳什均衡是A和B各自都只能获得10元。
实验结果:经过成百上千次的实验,发现50%的博弈者A会向对方进行借钱,而75%会收到对方的还款,博弈者B亦然。而且,B从A处借钱越多,随后向A还钱就越多。
实验结果的解释:行为博弈学家认为,之所以产生这种现象的原因在于:现行的社会、制度、经济和生活环境都会影响人与人之间的信任。传统博弈论认为理性自利的人不会信任别人,即使得到别人的信任也不会变的值得信任,但它忽略了一点,人类不仅是自利的,同时也是高度社会化的动物,整个不断社会化的过程使得大脑已经形成了一种自动的社会化的反应机制,我们在意别人的看法,考虑别人的反应,即使是对陌生人,虽然这种情感发生作用时我们甚至没有意识到,但它还是在决策制定中发挥着重要的作用。
标准博弈论的结论是个人理性行为导致集体的非理性,而行为博弈论的结论是个人非理性行为导致集体理性。因为人类是高度社会化的一类生物, 人大脑作为一个内在的指南针引导我们做出“正确”的选择。只有在像与世隔绝环境的部落中才可能出现标准博弈论的结果。
D2. 可置信威胁议价博弈(ultimatum bargaining game)
实验模型:两个博弈方(出价者A和回应者B)就100元钱进行议价,100元代表双方交易的利润或者说赢余,A向对方分配x元,则自己剩下100?x元,B要么接受他的出价则获得x元,而A得到100?x,要么B拒绝则大家均一无所获。
8
标准博弈论的预测结果:按照标准博弈论,两个博弈方都是理性自利的,有收益总是比没收益好,因此只要A对B的分配额大于0,理性的B都会接受. 所以,A获得绝大部分利益,B只能分得一小部分, 该博弈有无穷多个纳什均衡。
实验结果:行为博弈论的实验表明,出价者的平均出价大致是40至50元左右, 50%的B都拒绝了20元以下的出价,B认为过分低于1/2的出价太不公平,因此以拒绝的方式惩罚对方的过分行为,结果双方的收益都为0元。
实验结果的解释:如果A出价过低,B的拒绝实质上是一种“报复性回报”。这就是说,回应者宁愿牺牲自身的利益去惩罚那些未公平对待他们的出价者。这种报复性回报在现实生活中很多,如人体炸弹、拒绝庭外调解等,都是回应人为了伤害对方不惜牺牲自己的非理性行为。一些博弈者将获得收益的一半视作公平交易点并且有要求被公平对待的偏好。这点很好理解,在我们的实际生活中,很多时候人们耗费大量的没有增加整体社会福利的成本所希望达到的境况, 这不过是为了求得人与人之间的公平、公正与合理。可置信威胁议价博弈(ultimatum bargaining game)最早由Guuth等(1982)提出[100]。
D3. “囚徒困境”博弈实验
实验模型:假设两个嫌疑犯A和B共同参与一个刑事案件被警察抓获并隔离审讯,如果两个嫌疑犯都坦白则他们被各判5年;如果一个坦白另一个抵赖则坦白者立即释放而抵赖者被判8年;如果两个嫌疑犯都抵赖则他们被各判1年。问题:两个嫌疑犯A和B选择坦白或抵赖?
标准博弈论的预测结果:按照标准博弈论,在这样的一次性博弈中,纳什均衡是嫌疑犯A和B都坦白。“囚徒困境”博弈中理性人的个人理性行为导致集体的非理性。
9
实验结果:两个嫌疑犯都不承认自己的罪行更不会揭发别人,他们的非理性行为使他们获得帕累托改善,也就是说两人的境况同时得到改善。博弈者的个人非理性反而导致集体的理性。
实验结果的解释:标准博弈论的结论是个人理性行为导致集体的非理性,而行为博弈论的结论是个人非理性行为导致集体理性。因为人类是高度社会化的一类生物, 人大脑作为一个内在的指南针引导我们做出“正确”的选择。只有在像与世隔绝环境的部落中才可能出现标准博弈论的结果。
D4.美女的硬币
第V部分
E1.“亚投行”事件用行为博弈论分析
E2.根据以下提供的材料用博弈论的有关理论和方法进行论述,要求观点明确,论据充分,语言符合逻辑,结论正确(内容包括:博弈方、策略、双方得益、存在问题、可能达到的均衡及合作对双方的意义六个方面分析)。(20分)
材料: 港报:大众通用争夺在华销售桂冠。参考消息网2012年12月28日报道,在进入中国市场的外国汽车厂商中,随着以丰田为首的日本企业因领土争端而处境艰难,大众汽车和通用汽车将为争夺2013年中国市场的销量冠军而展开激烈竞争,从而扩大他们所占据的市场份额。据香港《南华早报》2012年12月27日报道,大众汽车的高端品牌奥迪很受中国内地官员的欢迎,不过自2004年以来,大众汽车一直未能问鼎内地车市。据汽车行业研究机构捷实汽车咨询公司预测,凭借推出桑塔纳、高尔夫、斯柯达明锐和奥迪A3等8款新车型或者改良车型,大众汽车2013年在内地的销量很可能将达到270万辆,超过通用汽车
10