范里安-博弈论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《范里安-博弈论课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 范里安 博弈论 课件
- 资源描述:
-
1、第二十八章博弈论博弈论博弈是什么?n一个博弈博弈包含:n一些参与者参与者n每个参与者的策略策略n每个参与者选择不同决策行为的收益矩阵。收益矩阵。两人博弈的一个例子n参与者A 和 B。nA 可以采取两种行为:“上”和“下”。nB 可以采取两种行为:“左”和“右”。n包含了四种可能决策组合支付的表格称为博弈的收益矩阵收益矩阵。两人博弈的一个例子这是博弈的收益矩阵参与者 B参与者 A左边显示A的收益右边显示B的收益LRUD(3,9)(0,0)(1,8)(2,1)两人博弈的一个例子哪种策略组合结果会最终出现?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A纳什均衡n博弈论中的策略组
2、合中,每个参与者的决策都是对其它参与者决策的最佳反应决策时所达到的均衡称为 纳什均衡。纳什均衡。n我们的例子中有两个纳什均衡(U,L)和(D,R)。两人博弈的例子(U,L)和(D,R)为此博弈的纳什均衡。但是我们发现:对两个参与者来说,(U,L)比(D,R)更受偏好。我们是否一定仅会看到(U,L)的博弈均衡结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A囚徒困境n为了了解帕累托偏好结果是否一定就是一个博弈的结果。考虑一个很有名的囚徒困境囚徒困境博弈问题。囚徒困境这个博弈的可能结果是什么样子?克莱德邦妮(-5,-5)(-30,-1)(-1,-30)(-10,-10)SC
3、SC唯一的纳什均衡为(C,C),尽管(S,S)能使得邦妮和克莱德的处罚更轻。这个唯一的纳什均衡是无效率的。决策时机n在上面来两个例子中,参与者同时做出他们的决策。n这样的博弈称为同步博弈同步博弈。n但博弈过程也可能表现为参与者按一定顺序作出决策行动。首先行动的参与者称为领导者领导者,后行动的参与者称为追随者追随者。序贯博弈的例子n有时一个博弈可能含有几个纳什均衡,很难确定哪一种均衡结果更有可能发生。n当一个博弈为一个序贯博弈时,那么就有可能其中的一个纳什均衡比其它均衡更有可能发生。序贯博弈的例子假设这个博弈为序贯博弈,A为领导者而B为追随者。我们可以把这个博弈的拓展形式拓展形式写出来。LRUD
4、(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A序贯博弈的例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动(U,L)为一个纳什均衡。(D,R)也是一个纳什均衡。这两个均衡哪个更有可能发生?序贯博弈的例子假如A先选择决策U,B后选择策略L;A 所得收益为3。假如A先选择策略D,B后选择策略R;A 所得收益为2。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动因此(U,L)很可能为均衡结果。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A参与者A 已经被考虑了上或者下的决策,但没有把这两种
5、策略联合起来考虑。例如,仅做出单纯的上或下决策。上和下为参与者A的纯策略纯策略。类似地,左和右为参与者B的纯策略纯策略。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A因此,(U,L)和(D,R)为纯策略纳什均衡纯策略纳什均衡。是否每一个博弈都至少有一个纯策略纳什均衡?纯策略参与者 B参与者 A这是一个新的博弈。是否存在纯策略的纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略(D,R)是否为一个纳什均衡?参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)UDLR(U,L)是否为一个纳什均衡?(U,R)是否为一个纳什均衡?(D,L)是否
6、为一个纳什均衡?不是。不是。不是。不是。因此当采取纯策略时,该博弈没有纳什均衡。但是这个博弈在采取混混合策略合策略时有一个纳什均衡。混合策略n参与者A选择一个概率分布(pU,1-pU),表示参与者A有pU的概率选择策略上,有1-pU的概率选择策略下;而不是单纯的选择上或者下的策略。n参与者A混合混合了上和下的纯策略。n概率分布概率分布(pU,1-pU)为参与者为参与者A的混合策略。的混合策略。混合策略n类似地,参与者B选择概率分布(pL,1-pL),表示有pL的概率他会选择左,有1-pL的概率他会选择右。n参与者B混合混合了左和右的纯策略。n概率分布概率分布(pL,1-pL)为参与者为参与者B
7、的混合策略。的混合策略。混合策略参与者 B参与者 A这个博弈没有纯策略纳什均衡,当有混合策略纳什均衡。混合纳什均衡结果是如何计算的?(1,2)(0,4)(0,5)(3,2)UDLR混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLA选择上策略的预期收益为pL。A选择下策略的预期收益为3(1-pL)。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pL假如 pL 3(1-pL)那么A仅选择上的策略,但是当A采用上的纯策略时没有纳什均衡。假如 pL 4pU+2(1-pU)那么B仅选择左
8、的策略,但是当B仅采用左的策略时不存在纳什均衡。混合策略参与者B参与者 A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,3/4R,1/4B选择左的策略的预期收益为2pU+5(1-pU)。B选择右的策略的预期收益为4pU+2(1-pU)。假如2pU+5(1-pU)=参与者的最佳反应函数为什么?合作博弈;性别战1,28,44,82,1BMWBMW杰克杰克西斯西斯pSBpJB110013/西斯合作博弈;性别战pSBpJB110013/西斯pSBpJB110013/杰克合作博弈;性别战pSBpJB110013/西斯pSBpJB110013/杰克博弈的纳什均衡为什么?合作博弈;性别战p
9、SBpJB110013/西斯杰克博弈的纳什均衡为什么?13/合作博弈;性别战1/3例如,共同观看芭蕾的概率为1/9,共同观看泥土摔跤的概率为4/9,他们观看不同节目的概率为4/9。pSBpJB1100西斯杰克13/博弈的纳什均衡为:(pJB,pSB)=(0,0);例如,(MW,MW)(pJB,pSB)=(1,1);例如,(B,B)(pJB,pSB)=(1/3,1/3);合作博弈;性别战1,28,44,82,1BMWBMW杰克杰克西斯西斯因此,混合策略纳什均衡是否该博弈的一个焦点?焦点?达到纳什均衡 时西斯的预期收益为:4和 8。11(,),33JSBBpp101224812499993 达到纳
10、什均衡 时杰克的预期收益为:,4 8。11(,),33JSBBpp122414421899993 143合作博弈;囚徒困境n同时做出决策的参与者都有占优策略。n唯一的纳什均衡为每个参与者选择的占优策略。n然而每个参与者可以通过合作采取其它策略组合达到比在纳什均衡情况更多的收益。合作博弈;囚徒困境n提姆和汤姆在看守所。每个人可以选择供认罪行(C)或者保持沉默(S)。n两者都供认罪行每人将被判罚5年监禁。n两者都保持沉默每人将被判罚2年监禁。n假如提姆供认罪行而汤姆保持沉默,那么提姆不受处罚而汤姆将要判罚10监禁(反之亦然)。合作博弈;囚徒困境唯一的纳什均衡为:(供认,供认)。供认供认沉默沉默汤姆
11、汤姆提姆提姆沉默沉默供认供认-10,0-2,-2-5,-50,-10但是(沉默,沉默)对于提姆和汤姆来说更好。对于提姆来说供认为占优策略。对于汤姆来说供认为占优策略。合作博弈;囚徒困境可能的措施包括将来的惩罚或者强制实施的合同汤姆汤姆供认供认沉默沉默提姆提姆沉默沉默供认供认-10,0-2,-2-5,-50,-10为了使双方合作从而达到收益最大状态所需的是合理的确保承诺承诺。合作博弈;承诺博弈n同时做决策的博弈的两个合作纳什均衡,其中一个比另一个所得收益要严格地高。n问题是:每个参与者怎么给对方承诺从而使该博弈出现好的纳什均衡结果?合作博弈;承诺博弈n一个普遍的例子为军备竞赛博弈。n印度和巴基斯
12、坦都可以增加他们的核武器存量,这样的成本很高。n对另一个国家有核有时能够得到更高的收益,但是对手方国家的收益降低。n不增加核储备对两个国家最好。合作博弈;承诺博弈增加增加不增加不增加巴基斯坦巴基斯坦印度印度不增加不增加增加增加1,45,53,34,1博弈的纳什均衡为什么?合作博弈;承诺博弈增加增加不增加不增加巴基斯坦巴基斯坦印度印度不增加不增加增加增加1,45,53,34,1该博弈的纳什均衡为(不增加,不增加)和(增加,增加)。哪一个纳什均衡更有可能发生?合作博弈;承诺博弈增加增加不增加不增加巴基斯坦巴基斯坦印度印度不增加不增加增加增加1,45,53,34,1该博弈的纳什均衡为(不增加,不增加
13、)和(增加,增加)。哪一个纳什均衡更有可能发生?假如印度先行动,结果如何?它会采取哪种策略?不增加核储备是不是最好的?合作博弈;斗鸡博弈n同时做出决策的两个合作纳什均衡,在该均衡中每个参与者选择不被对手方选择的策略合作博弈;保证博弈n两个司机进行对向行驶赛车。谁转向谁就是懦夫,谁不转向谁就是男子汉。n假如二者都不转向,就会发生碰撞,两者的收益都很低。n假如二者都转向不会发生碰撞,二者会得到适度的收益。n假如其中一个转向而另一个没有转向,那么转向的人得到很低的收益而没有转向的人获得高收益。合作博弈;保证博弈不转向不转向转向转向DumberDumb转向转向不转向不转向-2,41,1-5,-54,-
14、2该博弈的纳什均衡为什么?合作博弈;保证博弈不转向不转向转向转向DumberDumb转向转向不转向不转向-2,41,1-5,-54,-2该博弈的纯策略纳什均衡为(转向,不转向)和(不转向,转向)。存在一个混合策略纳什均衡,该均衡中每个人选择转向的概率为。Dumb 能否保证他得到4的收益?仅当他能说服Dumber他将会选择不转向。他如何说服Dumber?博弈的几种重要类型n合作博弈n竞争博弈竞争博弈n共存博弈n承诺博弈n讨价还价博弈竞争博弈n同时做出决策的博弈,其中一个参与者的收益增加额正好是另一个参与者收益的减少额。n这些博弈通常称为零和博弈竞争博弈DL21UR2,-20,01,-1x,-x下
展开阅读全文