第二章:完全信息动态博弈课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第二章:完全信息动态博弈课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 完全 信息 动态 博弈 课件
- 资源描述:
-
1、第二章 完全信息动态博弈本章内容:博弈的扩展式表述子博弈精炼纳什均衡子博弈精炼纳什均衡举例重复博弈和无名氏定理o 考虑下列问题:考虑下列问题:一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?哪个更合理?纳什均衡纳什均衡假定每一个参与人在选择自己的最优战略时假假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的定所有其他参与人的战略是给定的,但是如果参与人的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后选
2、择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。行动者的影响。子博弈精练纳什均衡的一个重要改进是将子博弈精练纳什均衡的一个重要改进是将“合理纳什均合理纳什均衡衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。市场进入阻挠博弈树市场进入阻挠博弈树特点:剔除博弈中包含的不可置信威胁。特点:剔除博弈中包含的不可置信威胁。承诺行动承诺行动-破釜沉舟破釜沉舟-背水一战背水一战v给定进入者进入,剔除(进入,斗争),(进入,默许)给定进入者进入,剔除(进入,斗争),(进入,默许)是唯一的子博弈精练纳什均衡是唯一的子博弈精练纳什均衡-举例(结婚举例(结婚-反对)反对)进入者进入不进入(0,300
3、)在位者合作(40,50)斗争(-10,0)不可置信威胁支付函数行动第一节 博弈的扩展式表述o 在静态博弈中,所有参与人同时行动(或行动虽有先在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人到行动);后,但没有人在自己行动之前观测到别人到行动);在动态博弈中,参与人的行动有先后顺序,且后行动在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动。者在自己行动之前能观测到先行动者的行动。o 博弈论专家习惯用战略式表述来描述和分析静态博弈,博弈论专家习惯用战略式表述来描述和分析静态博弈,也习惯于用扩展式表述来描述和分析动态博弈。也习惯
4、于用扩展式表述来描述和分析动态博弈。o 扩展式表述所扩展式表述所“扩展扩展”的主要是参与人的战略空间的主要是参与人的战略空间o 战略式表述简单地给出参与人有些什么战略可以选择,战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动方案可供选时候行动,每次行动时有些什么具体行动方案可供选择,以及知道些什么择,以及知道些什么o 此时的战略:如果你这样,我将怎样此时的战略:如果你这样,我将怎样2.1-1扩展式表述包含的要素o 要素:要素:n 参与人集合参与人集合n 参与人的行动顺
5、序参与人的行动顺序n 参与人的行动空间参与人的行动空间n 参与人的信息集参与人的信息集n 参与人的支付函数参与人的支付函数n 外生事件外生事件(即即“自然自然”的选择的选择)的概率分布的概率分布战略式表述战略式表述(strategic form(strategic form representation)representation)多用矩阵多用矩阵2,1-1,-1-1,-11,2女足 巴足 巴男扩展式表述扩展式表述(extensive form(extensive form representation)representation)多用博弈树多用博弈树战略式与扩展式男足球芭蕾女女芭蕾足球芭
6、蕾(-1,-1)(2,1)(1,2)(-1,-1)xxo 男的策略:男的策略:足球,芭蕾足球,芭蕾,选择足球;还是选择芭蕾。,选择足球;还是选择芭蕾。o 女的策略:女的策略:(足球,芭蕾),(芭蕾,足球)(足球,芭蕾),(芭蕾,足球)(芭蕾,芭(芭蕾,芭蕾),(足球,足球)蕾),(足球,足球)o 1 1、追随策略:他选择什么,我就选择什么、追随策略:他选择什么,我就选择什么o 2 2、对抗策略:他选择什么,我就偏不选什么、对抗策略:他选择什么,我就偏不选什么o 3 3、芭蕾策略:不管他选什么,我都选芭蕾;、芭蕾策略:不管他选什么,我都选芭蕾;o 4 4、足球策略:不管他选什么,我都选足球。、足
7、球策略:不管他选什么,我都选足球。o 策略即:如果他选择什么,我就怎样行动的相机行动方案。策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即在扩展式博弈里,参与人是相机行事,即“等待等待”博弈到博弈到达一个自己的信息集(包含一个或多个决策结后,再采取达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。行动方案。需求大,开发需求大,开发者者利润利润8 8千万,千万,不开发者不开发者利润利润0 0。需求大,需求大,两者都开发两者都开发利润各为利润各为4 4千万。千万。需求小,开发需求小,开发者者利润利润1 1千万,千万,不开发者不开发者利润利润0 0。
8、需求小,需求小,两者都开发两者都开发利润各为利润各为-3-3千万千万两者都两者都不开发利润各为不开发利润各为0 0。博弈树:房地产开发博弈博弈树:房地产开发博弈IA 开发开发 不开发不开发 大大 小小 大大 小小开发开发 不开发不开发 开开 不开不开 开开 不开不开 开开 不开不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4博弈树:不允许的情形博弈树:不允许的情形-3,-3-3,-31,01,00,10,00,10,0AB(进入,进入)(进入,进入)进入进入不进入不进入(进入,不进入)(进入,不进入)(不进入,进入)(
9、不进入,进入)(不进入,不进入)(不进入,不进入)市场进入博弈的战略式市场进入博弈的战略式进入不进入ABB进入不进入不进入进入收益:收益:A B-3,-31,00,10,0市场进入的扩展式市场进入的扩展式o 在市场进入博弈中:在市场进入博弈中:A A有两个行动:有两个行动:“进入进入”、“不进不进入入”。由于是先行动者,只有两个战略:选择。由于是先行动者,只有两个战略:选择“进入进入”或或“不进入不进入”。o B B有两个行动:有两个行动:“进入进入”、“不进入不进入”。但是,有。但是,有4 4个战略:个战略:o(1)(1)若若A A选择选择“进入进入”,B B选择选择“进入进入”,若,若A
10、A选择选择“不进不进入入”,B B选择选择“进入进入”,即(进入,进入),即(进入,进入)o(2)(2)若若A A选择选择“进入进入”,B B选择选择“进入进入”,若,若A A选择选择“不进不进入入”,B B选择选择“不进入不进入”,即(进入,不进入),即(进入,不进入)o(3)(3)若若A A选择选择“进入进入”,B B选择选择“不进入不进入”,若,若A A选择选择“不进不进入入”,B B选择选择“不进入不进入”,即(不进入,进入),即(不进入,进入)o(4)(4)若若A A选择选择“进入进入”,B B选择选择“不进入不进入”,若,若A A选择选择“不进不进入入”,B B选择选择“不进入不进
11、入”,即(不进入,不进入),即(不进入,不进入)2.1-2博弈树的构成o 1 1结结(nodes)(nodes):结包括决策结:结包括决策结(decition nodes)(decition nodes)和终点结和终点结(terminal nodes)(terminal nodes)两类。决策结是参与人采取行动的时点,两类。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。在博弈树中,终点结是博弈行动路径的终点。在博弈树中,“谁在什么时谁在什么时候行动候行动”用在决策结旁边标注参与人的办法来表示。参与人用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。的支付标注在
12、博弈树终点结处。o 2 2枝枝(branches)(branches):在博弈树上,枝是从一个决策结到它的直:在博弈树上,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。接后续结的连线,每一个枝代表参与人的一个行动选择。o 3 3信息集信息集(information sets)(information sets):博弈树上的所有决策结分割:博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结:该子集包括所有满足下列条件的决策结:(1)(1)每一个决策结都每一个
13、决策结都是同一参与人的决策结;是同一参与人的决策结;(2)(2)该参与人知道博弈进入该集合的该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结。的某个决策结,但不知道自己究竟处于哪一个决策结。122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)结结nodesnodes信息集分单节信息集和多节信息集;如果用虚线匡起来表示2知道自己位于信息集内,但不知道是哪一点,因为他没能观察到对手的行动;如果博弈树的所有信息集都是单结的,称为完美信息博弈122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)完美信息(完美信息(perfect informatio
14、nperfect information)与)与不完美信息不完美信息(imperfect information)imperfect information)122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)不完美信息:2不能区分1是采用了L还是S完美信息:2能区分1是选择了L还是S完美信息博弈完美信息博弈&不完美信息博弈不完美信息博弈o 一个信息集可能包含多个决策结,也可能只包含一个决一个信息集可能包含多个决策结,也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集;如策结。只包含一个决策结的信息集称为单结信息集;如果博弈树的所有信息集都是单结的,该博弈称为完美信果
15、博弈树的所有信息集都是单结的,该博弈称为完美信息博弈息博弈(Game of perfect information)(Game of perfect information);否则就是不;否则就是不完美信息博弈。完美信息博弈。信息集:房地产博弈信息集:房地产博弈IIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IIIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(
16、-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4信息集:房地产博弈信息集:房地产博弈IVN 大 小 开 不开 开 不开开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1 B2 A1 A2 A3 A4几个符号的意义几个符号的意义o 第第i个人的信息集为个人的信息集为Hi,其中某特定信息集,其中某特定信息集为为hi,在,在hi的情况下会有的情况下会有A(hi)的行动。他的行动。他的所有信息集所对应的所有行动的所有信息集所对应的所有行动A(hi)的集的集合为合为Ai,表示
17、聚合表示聚合)(iHhihAAiiiiiAHS:第第i个人有信息个人有信息H,乃有行动,乃有行动A此时的战略是此时的战略是S(而且是纯战略,而且是纯战略,以后用其他字母表示以后用其他字母表示“不纯不纯”战略战略)maps into第二节 子博弈精炼纳什均衡主要内容主要内容子博弈子博弈子博弈精炼纳什均衡子博弈精炼纳什均衡求解方法:逆向归纳法求解方法:逆向归纳法承诺行动与子博弈精炼纳什均衡承诺行动与子博弈精炼纳什均衡2.2-1子博弈(sub-game)l子博弈由一个决策结子博弈由一个决策结x x和所有该决策结的后续结和所有该决策结的后续结T(x)(T(x)(包括终点结包括终点结)组成,它满足下列条
18、件:组成,它满足下列条件:l(1)x(1)x是一个单结信息集;是一个单结信息集;l(2)(2)子博弈不改变原博弈的信息集和支付向量子博弈不改变原博弈的信息集和支付向量条件条件1 1说的是一个子博弈必需从一个单结信息集开始。说的是一个子博弈必需从一个单结信息集开始。即:即:(1)(1)当且仅当决策者在原博弈中确切地知道当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的开始。为一个子博弈的开始。(2)(2)如果一个信息集包含如果一个信息集包含两个以上决策结,没有任何一个决策结可以作为两个以上决策结,没有任何一个决策结
19、可以作为子博弈的初始结。子博弈的初始结。A 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4A 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4o 条件条件2 2说的是,子博弈的信息集和支付向量都直接继说的是,子博弈的信息集和支付向量都直接继承自原博弈,并不会发生任何变化。承自原博弈,并不会发生任何变化。o 这意味
20、着子博弈不能分割原博弈的信息集。这意味着子博弈不能分割原博弈的信息集。A 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1 N2 B1 B2 B3 B4进入不进入ABB进入不进入不进入进入收益:收益:A B-3,-31,00,10,0抵赖坦白ABB抵赖坦白坦白抵赖-1,-1-9,00,-9-6,-6在市场进入博弈中,包含在市场进入博弈中,包含3 3个子博弈(包括原博个子博弈(包括原博弈)。而在囚徒博弈中,只有一个子博弈(?弈)。而在囚徒博弈中,只有一个子博弈(?)2.2-2子博弈精炼
21、纳什均衡o 扩展式博弈的战略组合扩展式博弈的战略组合s*=(s1*,si*,sn*)是是一个子博弈精炼纳什均衡,如果:一个子博弈精炼纳什均衡,如果:o(1)它是原博弈的纳什均衡;它是原博弈的纳什均衡;o(2)它在每一个子博弈上给出纳什均衡。它在每一个子博弈上给出纳什均衡。o 一个战略组合是一个战略组合是个子博弈精炼纳什均衡,当且仅当个子博弈精炼纳什均衡,当且仅当它在每一个子博弈上都构成一个纳什均衡它在每一个子博弈上都构成一个纳什均衡o 如果整个博弈是唯一的子博弈,纳什均衡与子博弈如果整个博弈是唯一的子博弈,纳什均衡与子博弈纳什均衡是相同的;如果有其它子博弈存在,有些纳什均衡是相同的;如果有其它
22、子博弈存在,有些纳什均衡可能不构成子博弈纳什均衡。纳什均衡可能不构成子博弈纳什均衡。子博弈精炼纳什均衡子博弈精炼纳什均衡o 均衡路径:如果一个博弈有几个子博弈,一个特定的纳均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称什均衡决定了原博弈树上唯一的一条路径,这条路径称为均衡路径。为均衡路径。o 构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。这是纳什均衡优的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别与子博弈精炼纳什均衡的实质区别o
23、只有当一个战略规定的行动规则在所有可能的情况下都只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略是最优的时,它才是一个合理的、可置信的战略o 序贯理性:不论过去发生了什么,参与人应该在博弈的序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策每一个时点上最优化自己的决策市场进入博弈的纳什均衡市场进入博弈的纳什均衡进入不进入ABB进入不进入不进入进入收益:收益:A B-3,-31,00,10,0-3,-3-3,-31,01,00,10,00,10,0AB(进入,进入)(进入,进入)进入不进入(进入,不进入)(进入,不进入)(不进入
24、,进入)(不进入,进入)(不进入,不进入)(不进入,不进入)该博弈中有三个纳什均衡:该博弈中有三个纳什均衡:不进入,(进入,进入);不进入,(进入,进入);进入,(不进入,进入);进入,(不进入,进入);进入,(不进入,不进入)进入,(不进入,不进入)如果理论得到这样的结果,无助于预测如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假博弈参与人的行为。此外,纳什均衡假定,每一个参与人选择的最优战略是在定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择优反应,即参与人并不考虑自己的选择对其他人
25、选择的影响,因而纳什均衡很对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。难说是动态博弈的合理解。市场进入博弈的纳什均衡市场进入博弈的纳什均衡必须在多个纳什均衡中剔除不合理的均衡解,即所谓必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威不可置信威胁胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的目的是把动态博弈中的“合理纳什均衡合理纳什均衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳正如纳什均衡是完全信息静态博弈解的基本慨
展开阅读全文