博弈动态博弈课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈动态博弈课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 动态 课件
- 资源描述:
-
1、3 完全但不完美信息博弈完全但不完美信息博弈:行动的参与者行动的参与者并不知道并不知道这一步之前博弈的整个过程这一步之前博弈的整个过程4 所有动态博弈的所有动态博弈的中心问题是中心问题是可信任性可信任性.在博弈的某些阶段在博弈的某些阶段,要选择要选择第一第一,参与者参与者1选择支付选择支付1000 美元给参与者美元给参与者2,是否是否引爆一颗手雷引爆一颗手雷.看下例,这是一个两步博弈看下例,这是一个两步博弈.或者一分或者一分不给不给;第二第二,参与者参与者2观察到参与者观察到参与者1的选择,然后决定的选择,然后决定 两个参与者如何选择呢?两个参与者如何选择呢?如果参与者如果参与者1相信这一威胁
2、,相信这一威胁,他的最优反应是支付他的最优反应是支付1000美元美元给参与者给参与者2,但参与者但参与者1却不会对这一威胁信以为真,却不会对这一威胁信以为真,它它不可置信不可置信.参与者参与者2 接受,博弈结束接受,博弈结束.完全且完美信息动态博弈完全且完美信息动态博弈 一、动态博弈的表述(初步描述)一、动态博弈的表述(初步描述)1、基本要求、基本要求(1)局中人)局中人 I=1,2,,n(2)局中人的行动次序(有先后之分),)局中人的行动次序(有先后之分),Ai 为为i 的行动集的行动集.(3)每次行动时局中人所进行的选择)每次行动时局中人所进行的选择(4)外生事件的概率分布)外生事件的概率
3、分布(5)局中人在选择行动时所了解的信息)局中人在选择行动时所了解的信息(6)支付函数)支付函数二、二、动态博弈的表示方法和特点动态博弈的表示方法和特点 1、动态博弈的阶段和扩展形表示、动态博弈的阶段和扩展形表示 动态博弈中一个博弈方的一次行动选择称为一个动态博弈中一个博弈方的一次行动选择称为一个“阶段阶段”(Stage).动态博弈也称为动态博弈也称为“序列博弈序列博弈”(Sequential Games)序和博弈的阶段,因此是表示(阶段数和博弈方可选序和博弈的阶段,因此是表示(阶段数和博弈方可选 由于扩展形可以反映动态博弈中博弈方的选择次由于扩展形可以反映动态博弈中博弈方的选择次 行为数量较
4、少的)动态博弈的最佳方法行为数量较少的)动态博弈的最佳方法.动态博弈有动态博弈有时也被称为时也被称为“扩展形博弈扩展形博弈”(Extensive FormGame).而且每个阶段的可能选择也很多,因此很难用扩展形而且每个阶段的可能选择也很多,因此很难用扩展形 注意注意:并不是所有动态博弈都可以用扩展形表示:并不是所有动态博弈都可以用扩展形表示.例如下象棋是动态博弈,但因为它不仅博弈阶段很多,例如下象棋是动态博弈,但因为它不仅博弈阶段很多,式加以表示式加以表示.三、动态博弈的基本特点三、动态博弈的基本特点 分,而且一个博弈方的选择很可能不是只有一次,而分,而且一个博弈方的选择很可能不是只有一次,
5、而在动态博弈中,各个博弈方的选择不仅有先后之在动态博弈中,各个博弈方的选择不仅有先后之 是有几次,并且在不同阶段的多次行为之间有内在联是有几次,并且在不同阶段的多次行为之间有内在联 系,是不能分割的整体系,是不能分割的整体.因此在动态博弈中,因此在动态博弈中,研究某研究某 个博弈方某个阶段的行为,个博弈方某个阶段的行为,裂开来研究是没有意义的裂开来研究是没有意义的.或者将各个阶段的行为割或者将各个阶段的行为割动态博弈中某博弈方的动态博弈中某博弈方的策略策略 是指轮到他选择时,是指轮到他选择时,针对前面阶段的各种情况,以及后续阶段可能的选择针对前面阶段的各种情况,以及后续阶段可能的选择 所作相应
6、选择的所作相应选择的完整计划完整计划.动态动态博弈的结果博弈的结果 包括双方(或多方)采用的策略包括双方(或多方)采用的策略 组合、实现的博路径和各博弈方的收益组合、实现的博路径和各博弈方的收益.四、动态博弈的非对称性四、动态博弈的非对称性 因为动态博弈中各个博弈方的行为选择有先后次因为动态博弈中各个博弈方的行为选择有先后次 序的,且后行为者能观察到此前博弈方的行为选择,序的,且后行为者能观察到此前博弈方的行为选择,因此动态博弈中各博弈方的地位是不对称的因此动态博弈中各博弈方的地位是不对称的.另外,在另外,在动态博弈中各博弈方的阶段选择动态博弈中各博弈方的阶段选择不一定是交替进行的不一定是交替
7、进行的.A AB BA AB B制止制止(-2-2,5 5)不仿冒不仿冒(0 0,1010)不仿冒不仿冒仿冒仿冒制止制止不制止不制止仿冒仿冒(2 2,2 2)(1010,4 4)(5 5,5)5)不制止不制止博弈树(扩展型示意)例:仿冒博弈博弈树(扩展型示意)例:仿冒博弈五、五、完全且完美信息动态博弈解法完全且完美信息动态博弈解法之之逆向归纳法逆向归纳法1、二人动态博弈的逆向归纳法二人动态博弈的逆向归纳法I=1,2,局中人,局中人1先行动,先行动,2根根据据1的行动选择行动的行动选择行动收益函数收益函数),(21aauuii局中人局中人2 的选择的选择)(),(max122221222aRRa
8、aauAa(2对对1的反应函数)的反应函数)局中人局中人1知道知道2 会根据会根据1的选择而做出选择的选择而做出选择 局中人局中人1的选择:的选择:111211)(,(max11aaaRauAa从而得到这一动态博弈的从而得到这一动态博弈的逆向递归解逆向递归解).(,(121aRa21 完全且完美信息动态博弈完全且完美信息动态博弈21 A 理论:逆向归纳法理论:逆向归纳法 手雷博弈属于下面简单类型的完全且完美信息手雷博弈属于下面简单类型的完全且完美信息动态博弈:动态博弈:1 参与者参与者1 从可行集从可行集A1中选择一个行动中选择一个行动a1,2 参与者参与者2 2观察到观察到a1后后,从可行集
9、从可行集A2中选择一个中选择一个 行动行动a1,3 两人的收益分别为两人的收益分别为 和和 ),(211aau).,(212aau逆向归纳法求解此博弈如下:逆向归纳法求解此博弈如下:在博弈的第二阶段在博弈的第二阶段参与者参与者2行动时,由于其前参行动时,由于其前参 与者与者1已选择行动已选择行动a1,他面临的决策问题可用下式表他面临的决策问题可用下式表 示为示为),(max21222aauAa),(max21222aauAa 假定对假定对A1中的每一个中的每一个a1,参与者参与者2的最优化问题的最优化问题 只有只有唯一解唯一解,用用R2(a1)表示表示.由于参与者由于参与者1能和参与能和参与
10、者者2 一样解出一样解出2 的问题的问题,参与者参与者1可以预可以预测到参与者测到参与者 2 对每一个可能行动对每一个可能行动a1所做出的反应,所做出的反应,这样这样1在第一阶在第一阶 段要解决的问题可归结为:段要解决的问题可归结为:)(,(max121111aRauAa 假定参与者假定参与者1的这一最优化问题也有的这一最优化问题也有唯一解唯一解,表示为表示为 1a,我们称我们称 是这一博弈的是这一博弈的逆向归纳解逆向归纳解.)(,(11aRa逆向归纳解不含有不可置信的威胁逆向归纳解不含有不可置信的威胁:因为参与者因为参与者1能够能够 预测到参与者预测到参与者2 对对1的可能选择的最优反应的可
11、能选择的最优反应,这一预测这一预测 排除了参与者排除了参与者2不可置信的威胁不可置信的威胁.逆向归纳法背后的理性假设逆向归纳法背后的理性假设.看下例三阶段两个参与者的动态博弈看下例三阶段两个参与者的动态博弈.三阶段两个参与者的动态博弈的三阶段两个参与者的动态博弈的博弈树博弈树表示表示.(2,0)(1,1)121LRL1R1R2L2(3,0)(0,2)博弈的解或博弈的结果:博弈的解或博弈的结果:参与者选择参与者选择L,博弈结束博弈结束.博弈的逆向归纳解表示为博弈的逆向归纳解表示为(L,X).戴威戴威(Richard H.Thaler)发表在发表在上的一个例子上的一个例子.教授组织同学进行这样的实
12、验教授组织同学进行这样的实验:让让A,B两同学就两同学就一美元进行讨价还价一美元进行讨价还价:首先由首先由A提出方案提出方案,若若B同意同意,就就按照按照A的方案分配这一美元的方案分配这一美元.如果如果B拒绝拒绝A的提议的提议,则双则双方一文不名方一文不名.请讨论实验分配的结果请讨论实验分配的结果.罗森多教授罗森多教授(Robert Rosenthal)1981年发表在年发表在Journal of Economic Theory上的论文中提出的上的论文中提出的:蜈蜈 蚣蚣 博博 弈弈最终最终A得到得到1 1美元钱美元钱,然后然后,自愿自愿地分给地分给B 一半一半.)0,1()2,0()0,3(
13、)4,0()0,5()9998,0()0,9999()10000,0(ABABAAB由逆向归纳法容易得出逆向归纳解为由逆向归纳法容易得出逆向归纳解为:在在A第一次第一次 选择时就结束博弈选择时就结束博弈.双方的收益为双方的收益为(0,1).但是但是,实验的实验的结果如何呢结果如何呢?最终最终B得到得到10000元钱元钱,然后然后自愿自愿地分给地分给A一半一半.动态博弈中可信性和纳什均衡的问题动态博弈中可信性和纳什均衡的问题 相机选择和策略中的可信性问题相机选择和策略中的可信性问题动态博弈中博弈方的策略是动态博弈中博弈方的策略是预先设定的预先设定的.这些策略在博弈过程中究竟哪个会实施,博弈方这些
14、策略在博弈过程中究竟哪个会实施,博弈方会从自身利益的角度出发,会从自身利益的角度出发,针对其他博弈方的策略选针对其他博弈方的策略选择来选择择来选择,我们称这种策略选择行为为动态博弈中的我们称这种策略选择行为为动态博弈中的相机选择相机选择:相机选择的存在使得博弈方的策略中所设相机选择的存在使得博弈方的策略中所设定的各个阶段、各种情况下所采取的行为的可信性有定的各个阶段、各种情况下所采取的行为的可信性有 了疑问了疑问.以以“开金矿博弈开金矿博弈”为例对分析为例对分析相机选择和可信性相机选择和可信性问问题题“开金矿博弈开金矿博弈”甲欲开发一个价值甲欲开发一个价值4万元的金矿万元的金矿,缺少缺少1万元
15、资金万元资金,乙有乙有1 1万元的资金可以投资万元的资金可以投资.甲想说服乙借给他甲想说服乙借给他,并答并答应分给乙应分给乙2万元万元,乙是否应该借给他?乙是否应该借给他?(不借,不借,X )可将此问题看作一个可将此问题看作一个两个阶段两个参与者的动态两个阶段两个参与者的动态博弈博弈.不借不借借借还还不还不还(1,0)P1 1P2 2(2,2)(0,4)版本版本1:无法律无法律保障保障的开金矿博弈的开金矿博弈博弈的逆向归纳解:博弈的逆向归纳解:易知此博弈的逆向归纳解为易知此博弈的逆向归纳解为:乙选择不借乙选择不借,博弈结束博弈结束.表示为表示为(不借,不借,X)直观解释为直观解释为:乙没有理由
16、相信甲的乙没有理由相信甲的“承诺承诺”.上面的博弈可以修正为以下博弈上面的博弈可以修正为以下博弈.(借,还借,还)博弈的结果:博弈的结果:不借不借借借还还不还不还起诉起诉放弃放弃(1 1,0)0)P1 1P2 2P1 1(2,2)(2,2)(1,0)(1,0)(0,4)(0,4)版本版本2:法律保障法律保障充足充足的开金矿博弈的开金矿博弈不借借还不还起诉放弃(1,0)P1P2P1(2,2)(-1,0)(0,4)案例:开金矿博弈案例:开金矿博弈 版本版本3:法律保障不足法律保障不足的开金矿博弈的开金矿博弈纳什均衡在动态博弈分析中的问题纳什均衡在动态博弈分析中的问题 我们通过开金矿博弈的几个不同版
17、本,说明了我们通过开金矿博弈的几个不同版本,说明了动态博弈问题的相机选择引出的可信性问题,以及动态博弈问题的相机选择引出的可信性问题,以及可信性在动态博弈分析中的关键意义可信性在动态博弈分析中的关键意义.但实际上可信性问题最重要的意义,还在于它但实际上可信性问题最重要的意义,还在于它对纳什均衡在动态博弈分析中的有效性提出了质疑!对纳什均衡在动态博弈分析中的有效性提出了质疑!我们用我们用法律保障不足法律保障不足的开金矿博弈的开金矿博弈的开金矿博弈的开金矿博弈来阐明这种质疑的内涵来阐明这种质疑的内涵.根据纳什均衡的定义不难判断,由乙的根据纳什均衡的定义不难判断,由乙的策略策略 “第一阶段第一阶段借
18、借,当甲第二阶段选择,当甲第二阶段选择不还不还时,第三阶时,第三阶段选择段选择起诉起诉”,甲的,甲的策略策略“第二阶段无条件第二阶段无条件还还”,构,构成的成的策略组合策略组合是一个是一个纳什均衡纳什均衡.因为给定对方的策略,因为给定对方的策略,双方的策略都是符合自己最大利益的最佳策略,单独双方的策略都是符合自己最大利益的最佳策略,单独偏离对自己都是不利的偏离对自己都是不利的.在双方上述策略下,乙在第在双方上述策略下,乙在第三阶段的三阶段的“打打”并不需要真正实施,但它是保证第并不需要真正实施,但它是保证第二阶段甲会分的关键,二阶段甲会分的关键,乙的策略中必须包含这个选乙的策略中必须包含这个选
19、择择.既然双方上述策略构成一个纳什均衡,它应该既然双方上述策略构成一个纳什均衡,它应该是具有稳定性的,但事实上乙根本就不会选择是具有稳定性的,但事实上乙根本就不会选择“借借”.为什么会出现这种矛盾呢?为什么会出现这种矛盾呢?主要在于乙第三阶段主要在于乙第三阶段的的“起诉起诉”是不可信的是不可信的.纳什均衡在动态博弈可能缺乏稳定性的根源纳什均衡在动态博弈可能缺乏稳定性的根源在于在于它不能排除博弈方策略中所包含的不可信的行为设定它不能排除博弈方策略中所包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题不能解决动态博弈的相机选择引起的可信性问题.动态博弈的有效分析概念,除了要符合纳什均
20、衡动态博弈的有效分析概念,除了要符合纳什均衡 的基本要求以外,还必须满足另一个关键的要求,那的基本要求以外,还必须满足另一个关键的要求,那就是它(或者它们)必须能够排除博弈方策略中不可就是它(或者它们)必须能够排除博弈方策略中不可 信的行为设定,也就是各种不可信的威胁和承诺信的行为设定,也就是各种不可信的威胁和承诺.只只 有满足这样要求的均衡概念在动态博弈分析中才有真有满足这样要求的均衡概念在动态博弈分析中才有真 正的稳定性,才能对动态博弈作出有效的分析和预测正的稳定性,才能对动态博弈作出有效的分析和预测.21B 斯塔克尔贝里双头垄断模型斯塔克尔贝里双头垄断模型 博弈的时间顺序如下博弈的时间顺
21、序如下;1q1q(2)企业企业2观察到观察到 以后以后,然后然后选择产量选择产量 ;2q)(),(21cQPqqqii21qqQ(市场上的总产量市场上的总产量)(市场出清价格市场出清价格)QaQP)(是生产的边际成本是生产的边际成本(固定成本为固定成本为0).0).c(1)企业企业1选择产量选择产量(3)企业企业i 的收益由下面的利润函数给出:的收益由下面的利润函数给出:为求解此博弈的逆向归纳解,首先计算企为求解此博弈的逆向归纳解,首先计算企2对企业对企业1任意产量的最优反应任意产量的最优反应 应满足:应满足:)(12qRmax),(max2122222cqqaqqqqq由上式可得由上式可得
22、2)(112cqaqR已知已知 ,这与同时行动的古诺模型中得出的这与同时行动的古诺模型中得出的caq1结果相同结果相同.但两者不同之处在于这里的但两者不同之处在于这里的 )(12qR2 2对企业对企业1 1已观测到的产量的真实反应已观测到的产量的真实反应,而在古诺模型而在古诺模型 )(12qR是企业是企业是企业是企业2对对假定的企业假定的企业1的产量的最优反应的产量的最优反应.且且 企业企业1 1的产量选择是和企业的产量选择是和企业2 2同时作出的同时作出的.由于企业由于企业1 1也和企业也和企业2 2一样解出企业一样解出企业2 2的最优反应的最优反应,企业企业1 1就可以预测到他如选择就可以
23、预测到他如选择 ,企业企业2 2将根据将根据 1q)(12qR选择产量选择产量.那么那么,在博弈的第一阶段在博弈的第一阶段,企业企业1 1的问题就可的问题就可表示为表示为)(max)(max1211012,11011cqRqaqqRqqq于是于是 4)(,21221caqRqcaq这就是这就是斯塔克尔贝里双头垄断博弈的斯塔克尔贝里双头垄断博弈的逆向归纳解逆向归纳解.2max1101cqaqq斯塔克尔贝里斯塔克尔贝里产量与古诺产量的比较产量与古诺产量的比较1)古诺产量)古诺产量)(43)(3233*2*1cacacacaqq从而从而在斯塔克尔贝里模型中在斯塔克尔贝里模型中,*CSPP*2*1qq
24、(2)在古诺模型中)在古诺模型中,*2*1在在 S 模型中模型中.*2*1先动优势先动优势:信息占优者往往不利信息占优者往往不利.例子(要挟诉讼,承诺行动与精炼均衡的关系)例子(要挟诉讼,承诺行动与精炼均衡的关系)这个博弈有两个参与者这个博弈有两个参与者:原告原告P和被告和被告D.行动顺序如下:行动顺序如下:(1)原告决定是否对被告提出指控,指控的成本原告决定是否对被告提出指控,指控的成本 为为C 0;(2)如果决定指控,原告要求被告支付如果决定指控,原告要求被告支付S 0以了以了 诉讼;诉讼;(3)被告决定接受还是拒绝原告的要求被告决定接受还是拒绝原告的要求;(4)如果被告拒绝如果被告拒绝,
25、原告决定是放弃指控原告决定是放弃指控还是向法还是向法庭起诉,原告的起诉成本庭起诉,原告的起诉成本(包括律师费用包括律师费用)为为p,被告的,被告的 辩护成为辩护成为d;(5)如果案子到了法庭原告以如果案子到了法庭原告以r 的概率赢的概率赢得得x单位单位诉讼成功可能性非常小诉讼成功可能性非常小,目的是希望和解得到补偿目的是希望和解得到补偿.的支付的支付.P不指控不指控指控指控要求要求S拒绝拒绝接受接受起诉起诉放弃放弃(0,0)PDP),(drxpcrx)0,(c),(scs 原告指控的目的本身意味着原告指控的目的本身意味着rx p,最后阶段最后阶段,因为因为被告知道如果自己拒绝,原告将放弃被告知
展开阅读全文