书签 分享 收藏 举报 版权申诉 / 49
上传文档赚钱

类型重复性博弈课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2970391
  • 上传时间:2022-06-17
  • 格式:PPT
  • 页数:49
  • 大小:2.59MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《重复性博弈课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    重复性 博弈 课件
    资源描述:

    1、重复性博弈重复性博弈n 在现实生活中在现实生活中,寡头间关于彼此产量和价格的决策寡头间关于彼此产量和价格的决策远不止一次远不止一次,他们根据对手的行为在不断地调整自他们根据对手的行为在不断地调整自己的产量和价格。己的产量和价格。n 这种不断调整其策略并改变收益的博弈被称为这种不断调整其策略并改变收益的博弈被称为重重复性博弈复性博弈。n 当囚犯困境的双方只能进行一次性博弈时,很难当囚犯困境的双方只能进行一次性博弈时,很难进行有效的惩罚;而在重复性博弈时,有效的惩进行有效的惩罚;而在重复性博弈时,有效的惩罚对方或者威胁对方就成为可能了。罚对方或者威胁对方就成为可能了。n 重复性博弈重复性博弈摆脱囚

    2、犯困境。摆脱囚犯困境。2011-13 王秋石1/100重复性博弈重复性博弈n 20 世纪世纪60 年代进行的实验性研究寻找到了一种简年代进行的实验性研究寻找到了一种简单的办法单的办法以牙还牙以牙还牙(tit-for-tat)策略策略能够有能够有效地让意欲违约者保持克制。效地让意欲违约者保持克制。n 以牙还牙策略以牙还牙策略是指在重复性博弈过程中某一选手是指在重复性博弈过程中某一选手对对方在前一期的合作同样也采取合作的态度,对对方在前一期的合作同样也采取合作的态度,对对方不合作则采取报复性的策略。对对方不合作则采取报复性的策略。n 在囚犯困境的重复性博弈中,大家都清楚地知道在囚犯困境的重复性博弈

    3、中,大家都清楚地知道,合作的巨大收益提供了合作的正面激励,对方,合作的巨大收益提供了合作的正面激励,对方的有效威胁和潜在伤害则提供了合作的负面激励的有效威胁和潜在伤害则提供了合作的负面激励。2011-13 王秋石2/100重复性博弈重复性博弈:价格:价格n 在固定价格的一次性博弈中,哪怕有约在先,双在固定价格的一次性博弈中,哪怕有约在先,双方都保持垄断价格同时分享市场需求,最后的均方都保持垄断价格同时分享市场需求,最后的均衡为各自采用竞争性价格获得零经济利润。衡为各自采用竞争性价格获得零经济利润。n 但在重复性博弈中,情况有所不同。双方知道,但在重复性博弈中,情况有所不同。双方知道,如果我降价

    4、,对方一定会降价,可能降得还更惨如果我降价,对方一定会降价,可能降得还更惨,对方要置我于死地而后快;如果我采取合作态,对方要置我于死地而后快;如果我采取合作态度,对方很可能也会合作。度,对方很可能也会合作。n 为什么我不首先采取合作态度为什么我不首先采取合作态度把价格定在垄把价格定在垄断价格呢?断价格呢?2011-13 王秋石3/100重复性博弈重复性博弈:日常生活:日常生活n 在公交车上,我们很少为素不相识的乘客买车票在公交车上,我们很少为素不相识的乘客买车票,因为这大凡是一次性博弈。,因为这大凡是一次性博弈。n 而我们很可能为朋友买车票,我们与朋友的交往而我们很可能为朋友买车票,我们与朋友

    5、的交往是重复性博弈。如果他是个吝啬鬼,你可以选择是重复性博弈。如果他是个吝啬鬼,你可以选择不与他同车等。不与他同车等。n 在重复性博弈中,每个人都比较关心自己的声誉在重复性博弈中,每个人都比较关心自己的声誉,正是这种声誉机制使得人们大量采取,正是这种声誉机制使得人们大量采取合作性策合作性策略略。2011-13 王秋石4/100重复性博弈重复性博弈:军事合作:军事合作n 牙还牙策略在军事上也有所表现。牙还牙策略在军事上也有所表现。n 有核国家首先不使用核武器的协议有核国家首先不使用核武器的协议到目前为到目前为止遵守得很好的原因就是这个以牙还牙策略。止遵守得很好的原因就是这个以牙还牙策略。n 但是

    6、,但是,两国导弹互不对准协议两国导弹互不对准协议遵循得就会差遵循得就会差一些,两国关系一旦恶化,很有可能都在暗地里一些,两国关系一旦恶化,很有可能都在暗地里违约违约。2011-13 王秋石5/100重复性博弈重复性博弈:战地医院战地医院n 以牙还牙策略可以使战地以牙还牙策略可以使战地医院享受爱情的浪漫。医院享受爱情的浪漫。n 如果你专门轰炸对方的战如果你专门轰炸对方的战地医院,你自己的医院也地医院,你自己的医院也就处于危险之中。就处于危险之中。n 如果你打我的战地医院,如果你打我的战地医院,我绝对要以牙还牙,报仇我绝对要以牙还牙,报仇雪恨。雪恨。n 以上这些对人类行为的观以上这些对人类行为的观

    7、察能够帮助我们更好地认察能够帮助我们更好地认识人类的行为方式。识人类的行为方式。2011-13 王秋石6/100重复性博弈重复性博弈n 以牙还牙策略能否成功实施取决于博弈的次数。以牙还牙策略能否成功实施取决于博弈的次数。我们将重复性博弈按次数分类为有限次重复性博我们将重复性博弈按次数分类为有限次重复性博弈和无限次重复性博弈。弈和无限次重复性博弈。n 有限次重复性博弈有限次重复性博弈就是未来博弈的次数已经确定就是未来博弈的次数已经确定的博弈,也被称为固定次数的重复性博弈。的博弈,也被称为固定次数的重复性博弈。n 无限次重复性博弈无限次重复性博弈就是可以无限次数地、重复性就是可以无限次数地、重复性

    8、地玩的一种博弈。地玩的一种博弈。2011-13 王秋石7/100有限次重复性博弈有限次重复性博弈n 假定我们知道假定我们知道囚犯困境囚犯困境博弈只博弈只玩十次玩十次,现在就是,现在就是最后一次,结果会如何呢?最后玩的那次博弈就最后一次,结果会如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,两者的结果应该是相像只玩一次的博弈。因此,两者的结果应该是相同的。同的。n 第九轮第九轮会如何呢?我们已知在第十轮双方都会承会如何呢?我们已知在第十轮双方都会承认犯罪,为什么在第九轮就要合作呢?认犯罪,为什么在第九轮就要合作呢?n 同理,同理,第八轮第八轮、第七轮、第七轮都会出现只玩一次博都会出现只玩一次博

    9、弈的纳什均衡。弈的纳什均衡。n 只要这一博弈重复的次数已知,每一轮的结果都只要这一博弈重复的次数已知,每一轮的结果都是原纳什均衡的结果。是原纳什均衡的结果。2011-13 王秋石8/100无限次无限次重复性博弈重复性博弈n 以牙还牙策略只有在无限以牙还牙策略只有在无限次重复性博弈中才能有效次重复性博弈中才能有效。n 欧佩克(欧佩克(OPECOPEC)是一个合)是一个合作比较成功的卡特尔组织作比较成功的卡特尔组织,其原因之一就是无限次,其原因之一就是无限次重复性博弈所隐含的各种重复性博弈所隐含的各种惩罚机制。惩罚机制。n 无限次重复性博弈所形成无限次重复性博弈所形成的合作均衡解并不是稳定的合作均

    10、衡解并不是稳定的,它较为容易被打破。的,它较为容易被打破。2011-13 王秋石9/100序列博弈序列博弈n 到目前为止所讨论的博弈都是两个选手要同时选到目前为止所讨论的博弈都是两个选手要同时选择策略。例如,在古诺模型中,两家企业同时决择策略。例如,在古诺模型中,两家企业同时决定产量。定产量。n 在序列博弈中,选手们按先后顺序进行选择。因在序列博弈中,选手们按先后顺序进行选择。因此,此,序列博弈序列博弈就是就是选手依次出招的博弈。选手依次出招的博弈。n 斯坦伯格模型就是序列博弈的一个例子,一企业斯坦伯格模型就是序列博弈的一个例子,一企业是领导者,率先决定其产量,另一企业是跟随者是领导者,率先决

    11、定其产量,另一企业是跟随者,相应决定其产量。,相应决定其产量。2011-13 王秋石10/100序列博弈序列博弈n 经过分析经过分析,我们知道该博弈有两个纳什均衡我们知道该博弈有两个纳什均衡:(上上,左左)和和(下下,右右)。但是。但是,我们将说明其中的一个均衡不大我们将说明其中的一个均衡不大合理。合理。2011-13 王秋石11/100扩展型博弈扩展型博弈n 图图11. 1 是表是表11. 9 中的博弈的中的博弈的扩展型博弈,扩展型博弈,它有些它有些像树状像树状,故被称为故被称为博弈树博弈树。n 因此因此,用博弈树表示的博弈被称为用博弈树表示的博弈被称为扩展型扩展型,用表格所用表格所表示的博

    12、弈被称为表示的博弈被称为常规型常规型。2011-13 王秋石12/100扩展型博弈扩展型博弈2011-13 王秋石如何求解扩展型博弈的纳什均衡呢?如何求解扩展型博弈的纳什均衡呢? 假定假定A A已经选择了上,已经选择了上,B B一定会选择左,收益一定会选择左,收益为(为(1 1,9 9);); 但如果但如果A A选择下,选择下,B B只好选择右,收益为(只好选择右,收益为(2 2,1 1)。)。13/100扩展型博弈扩展型博弈2011-13 王秋石A A是先动者,在信息完备时,当他看到博弈树端点是先动者,在信息完备时,当他看到博弈树端点的收益情况后,他一定会选择下。的收益情况后,他一定会选择下

    13、。这样(上,左)就不再是一个合理的均衡了。这样(上,左)就不再是一个合理的均衡了。从扩展型博弈看,(下,右)是唯一的纳什均从扩展型博弈看,(下,右)是唯一的纳什均衡。衡。14/100“先动优势先动优势”n A A好开心,他享受到了好开心,他享受到了“先动优势先动优势”。一步为先,。一步为先,步步为先。步步为先。n 再看看选手再看看选手B B,他有些可,他有些可怜,他本可享受怜,他本可享受9 9,最后,最后只好收益为只好收益为1 1。他要看人。他要看人家的脸色行事。家的脸色行事。2011-13 王秋石15/100“先动优势先动优势”n 当然,他可以向当然,他可以向A A发出威胁:如果发出威胁:如

    14、果A A选下,他报复选下,他报复性地选左,两人都同归于尽,各自收益为零。性地选左,两人都同归于尽,各自收益为零。n 如果如果A A相信相信B B会实施威胁,会实施威胁,A A只好选择上,这样,只好选择上,这样,A A的收益至少为的收益至少为1 1,而不是零。,而不是零。n 但这个但这个威胁可信吗威胁可信吗?在一次性博弈中,一旦?在一次性博弈中,一旦A A选择选择了下,了下,B B就没办法了,只有在就没办法了,只有在0 0和和1 1的收益中进行理的收益中进行理性选择,只好有气无力地选择右啰。性选择,只好有气无力地选择右啰。2011-13 王秋石16/100“先动优势先动优势”n 现在我们这样思考

    15、现在我们这样思考: :在此博弈中,如果由于种种原在此博弈中,如果由于种种原因,因,B B为先动者,均衡点又何在呢?它是否证明了为先动者,均衡点又何在呢?它是否证明了所谓所谓“先动优势先动优势”?n 如果上例中的如果上例中的B B先动,他会选择左,然后先动,他会选择左,然后A A没办法没办法,只好选择上。先动者得到了,只好选择上。先动者得到了9 9的收益,后动时他的收益,后动时他只得到只得到1 1。n 这就说明了的确存在着所谓的这就说明了的确存在着所谓的“先动优势先动优势”,即,即在序列博弈中,首先采取策略的选手通常得利更在序列博弈中,首先采取策略的选手通常得利更大。大。2011-13 王秋石1

    16、7/100先动优势:斯塔克伯格解先动优势:斯塔克伯格解n 用前一章学过的斯塔克伯格模型进一步解释先动用前一章学过的斯塔克伯格模型进一步解释先动优势。优势。n 需求曲线依然为需求曲线依然为 p p=120-=120-q q,n 假定企业假定企业A A为领导者,企业为领导者,企业B B为跟随者,斯塔克伯为跟随者,斯塔克伯格解为:格解为:q q* *A A=60=60,q q* *B B=30=30,p p=30=30, A =1800=1800, B=900=900。n 现在以表现在以表11.811.8为基础,再加上斯塔克伯格解,我为基础,再加上斯塔克伯格解,我们得到下表:们得到下表:2011-1

    17、3 王秋石18/100先动优势:斯塔克伯格解先动优势:斯塔克伯格解2011-13 王秋石此博弈是否存在此博弈是否存在纳什均衡纳什均衡呢?呢?如果如果A选选30,B选选40;如果;如果A选选40,B也选也选40;如果;如果A选选60,B选选30。如果如果B选选30,A选选40;如果;如果B选选40,A也选也选40;如果;如果B选选60,A选选30。这样,两个天真的跟随者的这样,两个天真的跟随者的产量(40,40)才是)才是纳什均衡。19/100先动优势:斯塔克伯格解先动优势:斯塔克伯格解n 现假定现假定A 为领导者为领导者,B 为跟随者为跟随者,把表把表11. 10 改为扩改为扩展型的博弈树。展

    18、型的博弈树。2011-13 王秋石这三对策略都是子博弈的均衡。这三对策略都是子博弈的均衡。20/100先动优势:斯塔克伯格解先动优势:斯塔克伯格解n 哪一个会成为整个博弈的均衡呢哪一个会成为整个博弈的均衡呢? 既然我先动既然我先动,我我选选60啦,我的利润最大。啦,我的利润最大。2011-13 王秋石斯塔克尔伯格的解为斯塔克尔伯格的解为(A,B)= (60,30)=(1800,900)。)。21/100几个寡头模型解的比较几个寡头模型解的比较n 给定需求函数给定需求函数p p=120-=120-q q,MCMC=0=0,1.1. E E点(点(4040,4040)为)为古诺古诺解解2.2. S

    19、 SA A(6060,3030)为)为A A先动的先动的斯斯塔克伯格解塔克伯格解,S SB B(3030,6060)为)为B B先动的斯塔克伯格先动的斯塔克伯格解;解;3.3. C C点(点(6060,6060)为)为竞争性竞争性均衡均衡;4.4. M M点(点(3030,3030)为合谋性)为合谋性均衡。均衡。2011-13 王秋石22/100进入威慑进入威慑n 在一些寡头行业,乃至垄断行业中,总是存在着在一些寡头行业,乃至垄断行业中,总是存在着企业进入的可能性。一般来说,谁都希望自己是企业进入的可能性。一般来说,谁都希望自己是个垄断者。个垄断者。n 因此,现有垄断者总是会采取一些措施威慑新

    20、企因此,现有垄断者总是会采取一些措施威慑新企业的进入。有些威胁是可信的,但也有些威胁是业的进入。有些威胁是可信的,但也有些威胁是不可信的。不可信的。n 潜在进入者潜在进入者(定义为定义为A)为先动者为先动者,它有两种选择它有两种选择:进进入或放弃。现有垄断者入或放弃。现有垄断者(定义为定义为B)为后动者为后动者,它有两它有两种策略种策略:一是降低价格实施反击一是降低价格实施反击,二是不反击。二是不反击。2011-13 王秋石23/100进入威慑进入威慑2011-13 王秋石如果如果A A不进入,不进入,B B也不反击,这是事件的起点,也不反击,这是事件的起点,A A和和B B的利润分别为的利润

    21、分别为0 0和和8 8,这是最后一行。,这是最后一行。24/100进入威慑进入威慑2011-13 王秋石如果如果A A不进入,不进入,B B还要反击,这是一组没有实际意还要反击,这是一组没有实际意义的策略组合,利润也假定同前,这是倒数第二行。义的策略组合,利润也假定同前,这是倒数第二行。25/100进入威慑进入威慑2011-13 王秋石如果如果A A选择进入,选择进入,B B发出威胁信号,要以降价为发出威胁信号,要以降价为手段反击,手段反击,(A,BA,B)=(=(-1-1,4).,4).26/100进入威慑进入威慑2011-13 王秋石如果如果A A选择进入,选择进入,B B不反击的收益为不

    22、反击的收益为6 6,大于反击,大于反击时的时的4 4,它的威胁是不可信的。,它的威胁是不可信的。因此,因此,A A决定进入。最后,均衡解为决定进入。最后,均衡解为(A(A,B)=(B)=(进进入,不反击入,不反击) )。27/100不可信威胁不可信威胁n 在现实生活中,不可信威胁还是比较多见的。比在现实生活中,不可信威胁还是比较多见的。比如如“老师,你不让我及格我无脸见朋友我就跳楼老师,你不让我及格我无脸见朋友我就跳楼”,“你不嫁给我,我就跟你同归于尽你不嫁给我,我就跟你同归于尽”,“如如果你硬要嫁给那臭小子,你就不是我的女儿,我果你硬要嫁给那臭小子,你就不是我的女儿,我也不是你爹也不是你爹”

    23、,“如果你要侵略我的盟国,我就如果你要侵略我的盟国,我就对你实施核打击对你实施核打击”等等。等等。n 这里所讲的这里所讲的“不可信不可信”是在正常状态对收益和成是在正常状态对收益和成本比较所做出的一种理性判断。但的确存在着一本比较所做出的一种理性判断。但的确存在着一些非理性的人。这种人的威胁往往是成功的,可些非理性的人。这种人的威胁往往是成功的,可信的,这被称为信的,这被称为“非理性的理性非理性的理性”。2011-13 王秋石28/100爱的心语爱的心语2011-13 王秋石如果你不买那件衣服如果你不买那件衣服给我,我就不给你烧给我,我就不给你烧饭。饭。29/100可信的可信的威胁威胁n 在本

    24、例中,现有垄断者如何实现可信的承诺呢?在本例中,现有垄断者如何实现可信的承诺呢?n 其中一种办法就是在潜在进入者尚未考虑进入之其中一种办法就是在潜在进入者尚未考虑进入之前前,就做好了扩大生产能力的物资准备,一旦有就做好了扩大生产能力的物资准备,一旦有潜在进入者进入,它就可以以更低的平均成本生潜在进入者进入,它就可以以更低的平均成本生产更多的产量,为打价格战做好了充分的准备。产更多的产量,为打价格战做好了充分的准备。此时,利润分配状况此时,利润分配状况会会发生发生实质实质变化变化。n 到时就别怪我不客气。到时就别怪我不客气。2011-13 王秋石30/100可信的可信的威胁威胁2011-13 王

    25、秋石31/100可信的可信的威胁威胁n 这种威胁可信吗?如果这种威胁可信吗?如果A A选择进入,选择进入,B B一定会选择一定会选择反击。因为反击的收益为反击。因为反击的收益为3 3,大于不反击的收益,大于不反击的收益2 2。n 一旦一旦B B反击,反击,A A的利润为(的利润为(-2-2)。如果)。如果A A选择不进入选择不进入,利润为零。那就不进入吧!,利润为零。那就不进入吧!n 最后最后,A ,A 选择放弃进入选择放弃进入,B ,B 威慑成功威慑成功。n 生命的机会成本为零的人的威胁大多可行吗?生命的机会成本为零的人的威胁大多可行吗?2011-13 王秋石32/100纯粹策略纯粹策略n

    26、在上述博弈中在上述博弈中,我们所考察的所有策略都是有特定我们所考察的所有策略都是有特定的策略或行动的的策略或行动的,例如例如,进入或不进入进入或不进入,承认或否认承认或否认,定价为定价为3 元或为元或为5 元等。元等。n 这种选手采用特定策略的策略就是这种选手采用特定策略的策略就是纯粹策略纯粹策略。n 让我们看一个让我们看一个 “手心手背博弈手心手背博弈”。2011-13 王秋石33/100手心手背博弈手心手背博弈n 给定给定A A出手心,出手心,B B的最佳策略是手背;给定的最佳策略是手背;给定A A出手背出手背,B B的最佳策略是手心。的最佳策略是手心。2011-13 王秋石 给定给定B

    27、B出手心,出手心,A A的最佳策略是手心;给定的最佳策略是手心;给定B B出手出手背,背,A A的最佳策略是手背。的最佳策略是手背。 这里不存在任何一组策略使得两人都同时满足,这里不存在任何一组策略使得两人都同时满足,因此,因此,没有没有纳什均衡纳什均衡。(不存在两个同时所指的。(不存在两个同时所指的箭头)箭头)34/100混合策略混合策略n 在纯粹策略中,选手要么选手心,要么选手背;在纯粹策略中,选手要么选手心,要么选手背;而在混合策略中,选手可以而在混合策略中,选手可以50%50%的概率出手心,的概率出手心,50%50%的概率出手背;或者其他什么概率。的概率出手背;或者其他什么概率。n 这

    28、种基于一组选择的概率对其结果进行随机选择这种基于一组选择的概率对其结果进行随机选择的策略就是的策略就是混合策略混合策略。n 尽管从纯粹策略而言,尽管从纯粹策略而言,手心手背手心手背博弈不存在着纳博弈不存在着纳什均衡;但从混合策略上讲,它是存在着纳什均什均衡;但从混合策略上讲,它是存在着纳什均衡的衡的。2011-13 王秋石35/100混合策略混合策略n 如何求解混合策略的纳什均衡呢?如何求解混合策略的纳什均衡呢?n 纳什均衡的实质纳什均衡的实质是:它必然是一个选手对另外一个选是:它必然是一个选手对另外一个选手最佳策略的一种最佳反应。如果是你的最佳策略,手最佳策略的一种最佳反应。如果是你的最佳策

    29、略,但不是我的,这不是纳什均衡;如果是我的最佳策略但不是我的,这不是纳什均衡;如果是我的最佳策略,但不是你的,这也不是纳什均衡。只有两个同时为,但不是你的,这也不是纳什均衡。只有两个同时为最佳策略才为纳什均衡。最佳策略才为纳什均衡。n 在选手在选手A A看来,如果他选手心的概率几乎为看来,如果他选手心的概率几乎为1 1,选手,选手B B几乎选手背,但几乎选手背,但A A对此的最佳反应都是选手背,没有对此的最佳反应都是选手背,没有均衡。同理,如果均衡。同理,如果A A选手心的概率几乎为选手心的概率几乎为0 0(即更可能(即更可能选手背),选手背),B B的最佳选择是手心,但的最佳选择是手心,但A

    30、 A对此的最佳反应对此的最佳反应又是手心,也没有均衡。又是手心,也没有均衡。2011-13 王秋石36/100混合策略混合策略n 要使得这一博弈存在均衡的关键是要使得这一博弈存在均衡的关键是A A要选择出手心的一个要选择出手心的一个概率概率p p(那么,出手背的概率便为(那么,出手背的概率便为1-p1-p),使得对手),使得对手B B不会不会选择一个确定性策略,而是对几种选择无差异。选择一个确定性策略,而是对几种选择无差异。n 这样,如果这样,如果A A以以p p的概率选手心,(的概率选手心,(1-p1-p)的概率选手背,)的概率选手背,那么,那么,B B选手心的预期收益(或效用)等于:选手心

    31、的预期收益(或效用)等于:2011-13 王秋石 同理,同理,B B选手背的预期效用等于:选手背的预期效用等于:37/100混合策略混合策略n 欲使欲使B B对选手心和手背的预期效用无差异,就必须对选手心和手背的预期效用无差异,就必须使得以上两式相等,使得以上两式相等, 1-2p=2p-1 1-2p=2p-1, p=1/2p=1/2 即即A A以以1/21/2的概率各出手心与手背,的概率各出手心与手背,B B在选择手心在选择手心手背之间无差异。手背之间无差异。 如果如果p1/2p1/2,B B从选择手背中得到更大的效用;从选择手背中得到更大的效用; 如果如果p1p1q1/ /2 2,A A从选

    32、择手心中得到更大效用从选择手心中得到更大效用;n 如果如果q1q1/ /2 2,A A从选手背中得到更大效用。从选手背中得到更大效用。n 这样,(这一策略组合这样,(这一策略组合p=1/2p=1/2,q=1/2q=1/2)便是)便是混合混合策略的纳什均衡策略的纳什均衡。2011-13 王秋石40/100混合策略混合策略n 一般地说,一个一般地说,一个2 2人和人和2 2种策略的博弈的收益矩阵种策略的博弈的收益矩阵以及相应概率(以及相应概率(p p,q q)可以写成表)可以写成表11.1211.12。2011-13 王秋石41/100混合策略混合策略n 混合策略的纳什均衡必须满足以下两个条件:混

    33、合策略的纳什均衡必须满足以下两个条件:第一,第一,A A选择选择S S1 1A A的概率为的概率为p p时,使得时,使得B B选择选择S S1 1B B和和S S2 2B B无差无差异:异:2011-13 王秋石第二,第二,B B选择选择S S1 1B B的概率为的概率为q q时,使得时,使得A A选择选择S S1 1A A和和S S2 2A A无差无差异:异:42/100混合策略混合策略n 求解出求解出p*和和q*便是便是混合策略的纳什均衡混合策略的纳什均衡。n 我们为什么要考虑求解混合策略的纳什均衡呢?我们为什么要考虑求解混合策略的纳什均衡呢?n 原因之一就是有些博弈的纯粹策略没有纳什均衡

    34、原因之一就是有些博弈的纯粹策略没有纳什均衡,然而,一旦允许玩混合策略,每一个博弈至少,然而,一旦允许玩混合策略,每一个博弈至少有一个纳什均衡。有一个纳什均衡。n 因此,混合策略对因此,混合策略对没有纯粹策略纳什均衡的博弈没有纯粹策略纳什均衡的博弈提供了一种解。提供了一种解。n 这个解是否合理取决于具体的博弈。在上述博弈这个解是否合理取决于具体的博弈。在上述博弈中,手心手背各随机地出,其概率为中,手心手背各随机地出,其概率为1/21/2,你的效,你的效用就实现了极大化。用就实现了极大化。2011-13 王秋石43/100性别冲突博弈性别冲突博弈n 性别冲突博弈是既有纯粹策略纳什均衡,又有混性别冲

    35、突博弈是既有纯粹策略纳什均衡,又有混合策略纳什均衡的一个例子。合策略纳什均衡的一个例子。n 丈夫和妻子很想在某一个周六晚上呆在一起,但对娱乐的丈夫和妻子很想在某一个周六晚上呆在一起,但对娱乐的偏好不尽相同。妻子喜欢听音乐会,丈夫偏爱看足球赛,偏好不尽相同。妻子喜欢听音乐会,丈夫偏爱看足球赛,同时这对新婚夫妇都认为在一起的效用比单独行动的效用同时这对新婚夫妇都认为在一起的效用比单独行动的效用更大。更大。2011-13 王秋石44/100性别冲突博弈性别冲突博弈n 给定妻子看足球赛,丈夫的最佳选择也是看足球给定妻子看足球赛,丈夫的最佳选择也是看足球赛,此时他最幸福,效用最大;给定妻子听音乐赛,此时

    36、他最幸福,效用最大;给定妻子听音乐会,丈夫的最佳选择也是听音乐会,因为他讨厌会,丈夫的最佳选择也是听音乐会,因为他讨厌一人孤独地看足球赛。一人孤独地看足球赛。2011-13 王秋石给定丈夫看足球赛,妻子的最佳选择也是看足球给定丈夫看足球赛,妻子的最佳选择也是看足球赛(因为她讨厌一人孤独地听音乐会);给定丈赛(因为她讨厌一人孤独地听音乐会);给定丈夫听音乐会,妻子的最佳选择也是听音乐会,而夫听音乐会,妻子的最佳选择也是听音乐会,而且,此时她最幸福,效用最大。且,此时她最幸福,效用最大。45/100性别冲突博弈性别冲突博弈n 这样这样,从纯粹策略上从纯粹策略上,此博弈有此博弈有2 个纳什均衡个纳什

    37、均衡:(看足看足球赛球赛,看足球赛看足球赛),(听音乐会听音乐会,听音乐会听音乐会)。2011-13 王秋石然而,谁委屈谁呢?大家来玩概率吧!然而,谁委屈谁呢?大家来玩概率吧!46/100性别冲突博弈性别冲突博弈n 这一博弈也存在着一组混合策略的纳什均衡。这一博弈也存在着一组混合策略的纳什均衡。n 参照上述方法,我们首先假定丈夫看足球赛的概参照上述方法,我们首先假定丈夫看足球赛的概率为率为p p,听音乐会的概率便为(,听音乐会的概率便为(1-p1-p);妻子看足);妻子看足球赛的概率为球赛的概率为q q,听音乐会的概率便为(,听音乐会的概率便为(1-q1-q)。)。n 欲求解最佳的欲求解最佳的

    38、p p和和q q,我们要令妻子看足球赛和听音乐会无,我们要令妻子看足球赛和听音乐会无差异,就必须差异,就必须: 1 1p+0(1-p)=0p+2(1-p) 还要令丈夫在这两者中无差异,有:还要令丈夫在这两者中无差异,有: 2 2q+0+0 (1-(1-q)=0)=0q+1+1 (1-(1-q) )2011-13 王秋石47/100性别冲突博弈性别冲突博弈n 求解得知,求解得知,p=2/3p=2/3,q=1/3q=1/3 为此博弈的为此博弈的混合策略的纳什均衡混合策略的纳什均衡。此解的含义是:如果夫妻俩不想采用确定性的行此解的含义是:如果夫妻俩不想采用确定性的行为,而想采取随机性的行为,那么,可

    39、以丈夫为,而想采取随机性的行为,那么,可以丈夫2/32/3概率和妻子概率和妻子1/31/3的概率看足球赛确保夫妻俩的预期的概率看足球赛确保夫妻俩的预期效用极大化。效用极大化。当然,同理,妻子当然,同理,妻子2/32/3概率和丈夫概率和丈夫1/31/3概率听音乐概率听音乐会也可以确保夫妻俩的预期效用极大化。会也可以确保夫妻俩的预期效用极大化。2011-13 王秋石48/100婚姻保卫战婚姻保卫战n 听音乐会还是看足球赛?听音乐会还是看足球赛?n 这是个问题。这是个问题。n 年轻时常相厮守,壮年时年轻时常相厮守,壮年时各干各的,年老是相互依各干各的,年老是相互依伴。伴。2011-13 王秋石49/100

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:重复性博弈课件.ppt
    链接地址:https://www.163wenku.com/p-2970391.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库