书签 分享 收藏 举报 版权申诉 / 57
上传文档赚钱

类型不完全信息博弈和贝叶斯均衡课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:3612375
  • 上传时间:2022-09-26
  • 格式:PPT
  • 页数:57
  • 大小:467.32KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《不完全信息博弈和贝叶斯均衡课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    不完全 信息 博弈 贝叶斯 均衡 课件
    资源描述:

    1、第三章:不完全信息静态博弈主要内容:一、不完全信息博弈和贝叶斯纳什均衡二、贝叶斯均衡的应用三、贝叶斯博弈与混合战略均衡四、机制设计理论与显示原理思考:一、选课的问题二、看电影的问题三、制度和习俗的作用第一节第一节 不完全信息博弈不完全信息博弈和贝叶斯均衡和贝叶斯均衡 一、贝叶斯博弈 二、海萨尼转换 三、贝叶斯博弈的战略式描述 四、贝叶斯纳什均衡一、贝叶斯博弈一、贝叶斯博弈 完全信息(complete information):不存在事前的不对称信息,每个参与人对其他参与人的支付函数有准确的了解支付函数有准确的了解;完美信息(perfect information):在博弈过程的任何时点,每个参

    2、与人都能观察到观察到并记忆之前各参与人所选择的行动并记忆之前各参与人所选择的行动。前面两章我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。例如:在企业的新产品开发过程中,企业对市场的需求可能并不清楚;在连锁店博弈中,潜在的进入者可能并不知道在位者在市场上的盈利情况。40,50-10,030,80-10,1000,300 0,3000,400 0,400 高成本高成本 低成本低成本 默许默许 斗争斗争 默许默许 斗争斗争进入进入不进入不进入进入者进入者 在位者在位者市场进入博弈:不完全信息市场进入博弈:不完全信息 在位者的成本有两种类型,而进入者并不知道在位者的

    3、成本类型。在这种情形下,进入者有关在位者的成本信息是不完全的。当在位者具有不同的成本时,所表现出来的博弈情形是不一样的,对应的均衡也是不一样的。高成本情形:(进入,默许)(不进入,斗争)低成本情形:(不进入,斗争)斗鸡博弈斗鸡博弈 两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利,退下来的丢了面子(至少心理上是这样的);若两人都退下来,两人都丢面子。存在两个纯战略Nash均衡(U,D)和(D,U),也就是一个人冲上去,另一个就必须退下来。当一个理性

    4、的参与人预测到对方将会冲上去时,明智的选择就是退下来;而当预测到对方将会选择退却时,就应该大胆地冲上去。-4,-42,-2-2,20,0UD21UD 现在考虑这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。“强硬”的参与人:争强好胜、不达目的誓不罢休的决斗者;“软弱”的参与人:胆小怕事、遇事希望息事宁人的决斗者。斗鸡博弈:不完全信息斗鸡博弈:不完全信息 强硬强硬 软弱软弱 U D U DU D U D1 2 1,1 0,0 1,0 0,2 0,0-4,-4 0,-2-4,-4 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-

    5、4 U D U U D D强硬强硬 软弱软弱 斗鸡博弈:不完全信息斗鸡博弈:不完全信息-4,-42,-2-2,20,0UD21UD-4,-42,0-2,00,1UD21UD-4,-40,-20,21,0UD21UD-4,-40,00,01,1UD21UD(1)参与人都为强硬者(2)参与人1为强硬者参与人2为软弱者(3)参与人1为软弱者参与人2为强硬者(4)参与人都为软弱者 在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都知道自己的性格特征,但对对手的性格特征往往不甚了解。这意味着,当博弈真正开始的时候,双方对到底体现为哪一种博弈情形并不清楚。在这种情况下,对每位决斗者而言,存在事先的不确定性,

    6、即博弈开始之前就不知道的信息。例如,对于“强硬”的参与人1来讲,虽然他知道自己的类型,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行,这意味着“强硬”的参与人1面临着事前无法确定的信息。同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。从这一例子来看,博弈的参与人均存在两种不同的类型,即强硬和软弱;由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时参与人1就好像在与两个决斗者进行决斗一样,一个是“强硬”的,另一个是“软弱”的;当一个参与人并不知道在与谁博弈时,博弈的规则是无法定义的,如何处

    7、理不完全信息导致的这一问题?为了解决该问题,海萨尼提出了Harsanyi转换。海萨尼提出的解决办法:引入虚拟参与人自然,由自然首先决定参与人的不同类型,从而将不完全信息博弈转换为不完美信息博弈。二、海萨尼(二、海萨尼(Harsanyi)转换)转换 为了解释Harsanyi转换的具体含义,我们对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道参与人2的类型,但参与人2知道自己的类型,而且这一假设为所有的参与人所知道。Harsanyi转换 对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”的参与人“自

    8、然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。Harsanyi转换-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1“自然”首先行动决定参与人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。参与人2的特征在“自然”选择后,参与人1和2再进行“斗鸡博弈”。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1-4,-42,-2-2,2UD0,0-4,-4

    9、2,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1;-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p软弱220 x1x2xDDDDDUUUUU1如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参

    10、与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2。海萨尼通过引入“虚拟”参与人,将博弈的起始点由x1或x2提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。这种通过引入“虚拟”参与人,来处理不完全信息博弈问题的方法称为 Harsanyi转换。在Harsanyi转换中规定:参与人关于“自然”选择的推断为共同知识。也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了而且同时一起看到了“自然自然”以一以一定的概率分布随机选择参与人定的概率分布随机选择参与人2的性格特的性格特征征。在应用Harsanyi转换时,需要注意以下问题:1)

    11、“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或对信息的了解程度)来划分参与人的类型。用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即 ,t=(t1,tn)表示所有参与人的类型组合,t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。iitT 用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概

    12、率),则()iiip tt(,)(,)()(,)iiiiiiiiiiiitTttttp tttttpppp2)参与人关于“自然”选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布概率函数。假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。其中,pss:决斗者1和决斗者2同时强硬的概率;psw:决斗者1强硬、决斗者2软弱的概率;pws:决斗者1软弱、决斗者2强硬的概率;pww:决斗者1软弱、决斗者2软弱的概率;虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。例如 根据贝叶斯规则,“强硬”的

    13、决斗者1可以推知:决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 1(0.2)0.40.20.3p s s1(0.3)0.60.20.3p w s1(0.25)0.50.250.25p s w1(0.25)0.50.250.25p w w 不完全信息博弈:完全信息博弈在不完全信息上的拓展,我们又将其称为贝叶斯博弈;贝叶斯博弈:静态贝叶斯博弈和动态贝叶斯博弈;三、贝叶斯博弈的战略式描述 贝叶斯博弈的定义贝叶斯博弈包含以下五个要素:(1)参与人集合 ;(2)参与人的类型集合T1,T2;(3)参与人关于其他参与

    14、人类型的推断 ,;(4)参与人类型相依的行动集A(t1),A(tn);(5)参与人类型相依的支付函数 ,。1,2,.,n 111(),p tt()nnnp tt112211(),(),();)nna ta ta ttu1122(),(),();)nnnna ta ta ttu贝叶斯博弈中的战略 在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti);它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。;();();();();)iiiiiiGTpA tu a tt 用 表示给定其他参与人的战略 ,类型为ti的参与人i选择行动ai时

    15、的期望效用,则 其中,对 ,为给定t-i时由s-i所确定的其他参与人的行动组合(,;)iiiiv a st111(),(),(),()iiinsssss(,;)()(,();)iiiiiiiiiiiiiitTv a stp tt u a attiitT()iiat111111()(),(),(),()iiiiiinnata tatata t贝叶斯博弈的时间顺序如下:(1)“自然”选择参与人的类型组合t=(t1,tn),其中,参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人但参与人i具有关于其他具有关于其他参与人类型的推断参与人类

    16、型的推断 ;(2)参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);(3)参与人i得到 。()iiip tt1122(),(),();)nniia ta ta ttu“斗鸡博弈”的贝叶斯模型 参与人为决斗者1和2;用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2=s,w。用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则决斗者1关于其对手类型的推断为p1(y|x)。决斗者1类型相依的行动空间A1(x)=U,D,决斗者2类型相依的行动空间A2(y)=U,D。每位决斗者i的支付由前面的图决定。在贝叶斯博弈中,对于一个理性的参与

    17、人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i,他将选择使自己期望效用(支付)最大化的行动 ,其中()iia t()()arg max(,;)iiiiiiiiiaA ta tv a st四、贝叶斯纳什均衡纯战略贝叶斯Nash均衡 贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合 ,其中每个参与人在给定自己的类型ti和其他参与人类型相依的行动 的情况下,最大化其期望效用。也就是,行动组合 是一个纯战略贝叶斯Nash均衡,如果对 ,;();();();();)iiiiiiGTpA tu a tt 1122(),(),()nna ta ta t()

    18、iiat1122(),(),()nna ta ta ti()()arg max()(,();)iiiiiiiiiiiiiiiaA ttTa tp tt u a att 贝叶斯博弈纳什均衡的存在性 定理 一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。类型1类型2左 右左 右3,12,03,02,10,14,00,04,1上 下 甲乙静态贝叶斯博弈均衡举例:表中甲、乙同时行动,甲只有一种类型,但乙有两种类型:2=1,2;甲不了解对方是哪一种类型,但他相信对方为1、2的概率各为1/2。求解均衡。乙:如果为1,有占优战略为“左”;如果为2,有占优战略为“右”甲:由于甲相信对方为两种类型的可能性各为1

    19、/2,故甲考虑选“上”和“下”分别给他带来的期望收益;结果选“上”,期望支付为5/2,选“下”,期望支付为2,因而甲的最优选择是“上”。纳什均衡为s1*=上;s2*(1)=左,s2*(2)=右。贝叶斯Nash均衡的求解:简化的“斗鸡博弈”:强硬强硬 软弱软弱 U D U DU D U D1 2 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-4 U D 强硬强硬-4,-42,-2-2,20,0 U21UD 2,0 D D0,1在上述博弈中参与人2的战略可定义为战略 “强硬”的决斗者选择行动U,“软弱”的决斗者选择行动U,即(U,U);战略 “强硬”的决斗者选择行动U,“软弱

    20、”的决斗者选择行动D,即(U,D);战略 “强硬”的决斗者选择行动D,“软弱”的决斗者选择行动U,即(D,U);战略 “强硬”的决斗者选择行动D,“软弱”的决斗者选择行动D,即(D,D)。12s22s33s44s 用p表示决斗者1关于决斗者2的类型的推断,即决斗者1认为决斗者2为强硬的概率为p。(x,(y,z):x表示当决斗者2选择该方格所对应的战略时,决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y和z分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。2-6p,(-4,0)2,(-2,0)-2p,(2,

    21、1)0,(0,1)21UD(,)U D(,)D D-4,-42,-2-2,20,0 U21UD 2,0 D D0,1 下面根据p的大小,求解博弈的纯战略贝叶斯 Nash均衡。情形1:,无论决斗者2选择战略(U,D)还是(D,D),决斗者1的最优行动都是U。给定决斗者1的选择U,“强硬”决斗者2的最优行动为D。所以,博弈存在惟一的纯战略贝叶斯Nash均衡决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D。1/2p 情形2:1/2p 博弈存在如下两个纯战略贝叶斯Nash均衡:(1)决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;(2)决斗者1选择

    22、行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。求解另一种情形下“斗鸡博弈”的 贝叶斯Nash均衡 强硬强硬 软弱软弱 U D U DU D U D 1,1 0,0 1,0 0,2 0,0-4,-4 0,-2-4,-4 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-4 U D U U D D强硬强硬 软弱软弱求解另一种情形下“斗鸡博弈”的 贝叶斯Nash均衡 假设“强硬”决斗者1关于决斗者2的类型推断 ;“软弱”决斗者1关于决斗者2的类型推断 ;“强硬”决斗者2关于决斗者1的类型推断 ;“软弱”决斗者2关于决斗者1的类型推断 ;0.2,0.3,0.2,0.

    23、3ssswwswwpppp11()0.4,)0.6p s sp w s22()0.5,)0.5ps spw s22()0.5,)0.5ps wpw w11()0.4,)0.6p s wp w w 强硬强硬 软弱软弱 U D U DU D U D 1,1 0,0 1,0 0,2 0,0-4,-4 0,-2-4,-4 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-4 U U D D U U D D强硬强硬 软弱软弱 强硬强硬 软弱软弱 U D U DU D U D 1,1 0,0 1,0 0,2 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-4 U U

    24、D D D D 强硬强硬 软弱软弱 强硬强硬 软弱软弱 U D U DU D U D 1,1 0,0 1,0 0,2 0,1-2,0 0,0 -2,2 2,0-4,-4 2,-2-4,-4 U U D D D D 强硬强硬 软弱软弱 强硬强硬 软弱软弱 U D D U D D 1,1 1,0 0,2 0,1 0,0 -2,2 2,0 2,-2-4,-4 U U D D D D 强硬强硬 软弱软弱 强硬强硬 软弱软弱 U D D U D D 1,1 1,0 0,2 0,1 0,0 -2,2 2,0 2,-2-4,-4 U U D D D D 强硬强硬 软弱软弱 强硬强硬 软弱软弱 U D D U

    25、 D D 1,1 1,0 0,2 2,0 2,-2-4,-4 U U D D 强硬强硬 软弱软弱以上推导说明,以上推导说明,U是强硬的决斗者是强硬的决斗者1的占优的占优策略,为什么?策略,为什么?强硬强硬 软弱软弱 U D D U D D 1,1 1,0 0,2 0,1 0,0 -2,2 2,0 2,-2-4,-4 U U D D D D 强硬强硬 软弱软弱11()0.4,)0.6p s sp w s11()0.4,)0.6p s wp w w对于强硬的决斗者1而言,有4 0.42 0.60.42(,)2 0.42 0.622(,)2 0.40 0.60.82(,)0 0.40 0.602(,

    26、)udU DD DU DD D 因此,因此,U是强硬的是强硬的决斗者决斗者1的占优策的占优策略。略。强硬强硬 软弱软弱 U D D U D D 1,1 1,0 0,2 2,0 2,-2-4,-4 U U D D 强硬强硬 软弱软弱因此,强硬的决斗者因此,强硬的决斗者2选择选择U和和D无差别。无差别。22()0.5,)0.5ps spw s22()0.5,)0.5ps wpw w对于强硬的决斗者2而言,有4 0.52 0.512 0.50 0.51ud 所以,该博弈存在如下两个纯战略Nash均衡:1)“强硬”的决斗者1选择行动U,“软弱”的决斗者1选择行动D;“强硬”的决斗者2选择行动U,“软弱”的决斗者2选择行动D。2)“强硬”的决斗者1选择行动U,“软弱”的决斗者1选择行动D;“强硬”的决斗者2和“软弱”的决斗者2选择行动D。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:不完全信息博弈和贝叶斯均衡课件.ppt
    链接地址:https://www.163wenku.com/p-3612375.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库