不完全信息动态博弈课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《不完全信息动态博弈课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不完全 信息 动态 博弈 课件
- 资源描述:
-
1、 第六章 不完全信息动态博弈 不完全信息动态博弈(或动态贝叶斯博弈)的基本特征是参与人的行动是序贯的,有先有后,与完全信息动态博弈相比,其中的私人信息可能表现在支付函数上,也可能表现在行动的选择上。前一个表现形成不完全信息,后个表现形成不完美信息。象不完全信息静态博弈被转化成完全但不完美信息动态博弈进行分析一样。所有的不完全信息动态博弈都可以被转换成完全但不完美信息的动态博弈进行分析。正因为这样,我们把“不完全信息动态博弈”与“不完美信息动态博弈”混同使用。第1页,共51页。一、精炼贝叶斯纳什均衡一、精炼贝叶斯纳什均衡(完美贝叶斯纳什均衡完美贝叶斯纳什均衡)用博弈树表示完全且完美信息的动态博弈
2、,其中博弈树上的每个节点就是一个独立的决策节,表示参与人在该时点对此前的博弈过程有完全的了解。而在不完全信息动态博弈中,“自然”首先选择参与人的类型,相应的参与人知道自己的类型,其他参与人不知道;在自然的选择之后,参与人开始序贯行动,后行为者能观测到先行为者的行动,但无法观测到先行为者的后行为者能观测到先行为者的行动,但无法观测到先行为者的类型类型,从而产生不完美信息,对此,我们在博弈树上用多节点的信息集来反映。(一)多节点信息集和不完美信息动态博弈的表示第2页,共51页。v 举例:二手车交易举例:二手车交易 卖 不卖 买 不买 买者 买者 卖者 卖者 好 坏 买 不买 卖 不卖 卖者 先是自
3、然(N)决定二手车的类型:好车或差车。卖主(参与人1)知道自己的类型后选择卖或不卖,若卖主选择不卖,则博弈结束;若选择卖,则轮到顾客(参与人2)决定买还是不买。顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好车还是差车)。(这是不完美信息)这个交易里有两个决策节点就形成一个多节点的信息集(用虚线连接)。多节点信息集特征:(1)在此信息集中的每一个节点都轮到该参与人行动;(2)当博弈的进行达到该信息集中的某个节点时,轮到行动的参与人并不知道实际到达了哪一个节点,而只知道到达了其中的某个节点的概率(先验概率或后验概率)。第3页,共51
4、页。在不完全信息动态博弈中,“自然”首先选择参与人的类型,参与人自己知道自己的类型,其他参与人不知道;在自然选择之后,参与人开始行动,参与人的行动有先有后,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型。但是,参与人的行动是类型依存的。每个参与人的行动都传递着有关自己类型的信息,后行动者可以通过观察先行动者所选择的行动来推断其类型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动;先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择传递对自己有利的信息,避免传递对自己不利的信息。v 不完全信息动态博弈过程 因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参
5、与人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精炼纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。第4页,共51页。参与者1在3个行动中进行选择L、M及R。如果参与者1选择R,则博弈结束。如果参与者1选择了L或M,则参与者2就会知道1没有选择R(但不清楚1是选择了L还是M),并在或L 或R 两个行动中进行选挥,博弈随之结束。考虑如下完全非完美信息动态博弈 纳什均衡(L,L)、和(R,R),也是子博弈精炼纳什均衡。然而,(R,R)却明显要依赖于一个不可信的威胁:如果博弈进入参与者2的信息集,L严格优于R,选择R不是序贯理性的;因此参与者1不会由于2威胁他将在其后的行动中选择R,
6、而去选择R。(二)精炼贝叶斯纳什均衡第5页,共51页。对于不完全信息动态博弈,由于子博弈精炼均衡同样未能排除不可信的威胁和许诺,我们需要对其进一步强化(即加强对条件的要求),并把强化后的子博弈精炼纳什均衡称为精炼贝叶斯纳什均衡,简称为精炼(完美)贝叶斯均衡。因此,用更为广义的后续博弈的概念来代替子博弈的概念。前面我们已经定义过的子博弈必须开始于单节点信息集,并且不能分割信息集,与之不同的是“后续博弈”是指从任何信息集(不论是单节点的还是包含多节点的)开始的动态博弈的后续部分。对动态博弈进行分析,可信性问题始终是一个中心问题,一个理想的均衡必须是排除了所有不可信的威胁和许诺的。第6页,共51页。
7、使均衡概念得到进一步强化,以排除上例中像(R,R)的子博弈纳什均衡的方法之一,是附加以下两个要求。要求1:在每一个信息集上,轮到行动的参与人必须对博弈进行到该信息集中各个决策节点的可能性大小有一个推断(belief)。对于非单节点信息集,推断就是在信息集中关于不同决策节点的一个概率分布;对于单节点的信息集,参与者的推断就是博弈到达此单一决策节点的概率等于1。(每一个参与人的信息集上有一个概率分布)要求2:给定参与人的推断,参与人的策略必须满足序贯理性(sequentially rationally)的。即在每一信息集中,给定轮到行动的参与人在此信息集中的推断,以及其他参与人的后续策略(指从给定
8、信息集开始的参与人在后续博弈中的完备的行动计划),该参与人的行动必须是最优的。(给定概率分布和其他参与人的选择,每个参与人的战略是最优的)v 精炼贝叶斯纳什均衡四条要求第7页,共51页。要求1意味着如果博弈的进行达到参与者2的非单节信息集,则参与者2必须对具体到达哪一个节(也就是参与者1选择了L还是R)有一个推断。这样的推断就表示为到达两个节的概率p和1-pv 用精炼贝叶斯均衡剔除不可置信威胁(R,R)要求1:每一个参与人的信息集上各节点有一个推断(概率分布);要求2:给定参与人的推断,参与人的策略必须满足序贯理性。ppp11)1(0因此,这个博弈的唯一的精炼贝叶斯均衡是(L,L;p=1)第8
9、页,共51页。v 精炼贝叶斯纳什均衡四条要求 要求3:在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与人的均衡战略给出。(概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的(在可能的情况下)第9页,共51页。v 贝叶斯法则贝叶斯法则:是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。第10页,共51页。现就市场进入一例进行分析,假设现就市场进入一例进行分析,假设在打算进入之前对在打算进入之前对A的类型及分布概率一无所知,但的类型及分布概率一无所知,但知道,如果是知道,如果是高成本高成本型则阻挠概率是型则阻挠概率是20,如果是低成本型则阻挠概率是如
10、果是低成本型则阻挠概率是100,那么他将采取怎样的战略呢,那么他将采取怎样的战略呢 高成本 A 低成 默许 B 阻挠20%默许 阻挠100%进入40,50-10,030,100-10,140不进入0,3000,3000,4000,400例:市场进入博弈 博弈开始时,认为属于高成本型的概率是70。因此,认为自己在进入市场时受到阻挠的概率是:0.70.20.310.44当进入市场时,A确实阻挠,根据贝叶斯法则,认为属于高成本型的概率变为:(0.70.2)/0.44=0.32 根据这一新概率,估计自己在进入市场是受到A阻挠的概率变为:0.320.20.6810.744如果再次试探,又进行了阻挠,根据
11、贝叶斯法则,认为属于高成本型的概率变为:(0.320.2)/0.744=0.086 这样,随着一次次试探及阻挠,对A的判断逐渐变化,越来越倾向将判断为低成本型企业。1)P(A/B20)P(.A/B70)P(.A)P(P()P(P()P(AA/BAA/BB)P(A)/P(P()/P(P(A)P(A/BA/BBBB第11页,共51页。v 贝叶斯法则khahak)(khap1)(hkhaphaKkkkhKKhhhpappappapaob111)()|()()|()()|(Prhaha)(kP)(khap第12页,共51页。hak hhkkkhkhaobaobpapaobPrPr)()(),(Prhk
12、aob PrhakKjjjhkkhhkkhhkpappapaobpapaob1)()|()()|(Pr)()|(|Pr代表这个后验概率,即给定 的 情况下,i 属于 类型 的概率|Prhkaobhak(贝叶斯法则)v 贝叶斯法则第13页,共51页。第14页,共51页。v 精炼贝叶斯纳什均衡四条要求 要求4:对处于均衡路径之外的信息集,推断由贝叶斯法则以及可能倩况下的参与者的均衡战略决定。(对精炼贝叶斯均衡再精炼)分析要求4的作用 这是一个由三个参与人各行动一次构成的三阶段不完美信息动态博弈。参与人1在第一阶段在A和B中作出选择,如果他选择A,则博弈结束,如果他选择B,则轮到参与人2在第二阶段在
13、C和D之间作出选择,在第三阶段由参与人3在E和F之间进行选择。其中参与人1的行动能被参与人2和3观测到,但参与人2的行动却不能被参与入3观测到。第15页,共51页。分别用分别用P和和(1一一P)表示参与人表示参与人3推断参与人推断参与人2选选择择C和和D的概率,那么的概率,那么参与人参与人3选选E的期望支付:的期望支付:P1十十(1一一P)22一一P 选选F的期望支付:的期望支付:P3十十(1一一P)11十十2P因因此,当此,当P1/3时,他会选择时,他会选择E,当,当P1/3时时,他会选择,他会选择F,当,当P1/3时,他可选择时,他可选择E或或F或混合策略。或混合策略。那么,他所推断的P究
14、竟是这三种情况中的哪一种情况呢?这取决于他对参与人2的最优选择的判断。对参与人2来说,D是相对于C的严格下策,所以参与人2的合理选择必定是C,因此P11/3,所以参与人3的选择是F。参与人1在第一阶段对第二阶段和第三阶段参与人2和3的决策思路是清楚的,所以他知道如果自己选择B的话,支付将是3,比选择A的支付2大,因此,他会选择B。第16页,共51页。这样,我们就得到一个策略组合(B,C,F)与参与人2的推断P1.从上面的分析可知,(B,C,F;P1)是完全符合要求1到要求3的,并且,由于该策略组合下不存在均衡路径之外的信息集,因此要求4也就自动满足,从而我们说(B,C,F;P1)是该博弈的完美
15、贝叶斯纳什均衡是该博弈的完美贝叶斯纳什均衡。下面考虑策略组合(A,C,E)及相应的推断P0.首先,(A,C,E;P0)是一个纳什均衡,因为任何一个参与人都不可能通过单独改变自己的策略使自己的支付得到改善;其次,用要求1到要求3来衡量它也是满足的。但是,它却不是子博弈完美的,因为该博弈只有惟一的子博弈,并且根据上面的分析,它的惟一的纳什均衡是(C,F),而不是(C,E)。第17页,共51页。产生这矛盾的原因就在于要求4没有满足。在(A,C,E;P0)下,均衡路径就是第一阶段参与人1选择A,博弈结束,参与人2和3的策略C和E及推断P0都不在均衡路径上,即存在均衡存在均衡路径之外的信息集路径之外的信
16、息集,对于参与人3在该信息集上的推断P0,要求1到要求3没有任何的限制,而根据要求4,参与人3的推断决定于参与人2的合理选择:如果参与人2选择C,则参与人3的推断必须是P1,如果参与人2选择D,则参与人3的推断必须是P0。纳什均衡(A,C,E;P0)中,恰恰就是参与人3的推断P0与参与人2的选择C不相符合。因此,以要求1来衡量,纳什均衡(A,C,E;P0)是不合理的均衡(主要是推断不合理),应该予以剔除。第18页,共51页。上述四个要求中,要求2要求参与人在一个特定信息集上的行动依赖于参与人在该信息集的推断,而要求3或要求4又要求参与人的推断依赖于博弈树更上端的参与人的行动,但要求2又要求这些
展开阅读全文