书签 分享 收藏 举报 版权申诉 / 60
上传文档赚钱

类型完全信息静态博弈课件2.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4106336
  • 上传时间:2022-11-11
  • 格式:PPT
  • 页数:60
  • 大小:375.49KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《完全信息静态博弈课件2.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    完全 信息 静态 博弈 课件
    资源描述:

    1、POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

    2、POWERPOINT TEMPLATE 第二章第二章 完全信息静态博弈完全信息静态博弈v在完全信息静态博弈中,博弈各参与方同时行动,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。且对博弈相关信息完全了解。v“划横线法划横线法”是求解完全信息静态博弈的常用方法。是求解完全信息静态博弈的常用方法。v通常说来,完全信息静态博弈都存在通常说来,完全信息静态博弈都存在“纳什均衡纳什均衡”或或“混合策略纳什均衡混合策略纳什均衡”。第一节第一节 定义和求解方法定义和求解方法v 一、完全信息静态博弈的定义和实例一、完全信息静态博弈的定义和实例v 完全信息静态博弈指:博弈各方同时决策,任

    3、何博弈参与完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。弈结果、博弈各方的策略集、收益等。v 可以通过支付矩阵(可以通过支付矩阵(Payoff Matrix)寻找完全信息静)寻找完全信息静态博弈的均衡。态博弈的均衡。v 以以“囚徒困境囚徒困境”为例,介绍支付矩阵的构造方法和应用。为例,介绍支付矩阵的构造方法和应用。1囚徒困境囚徒困境v 在在“囚徒困境囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。嫌疑人乙。v 将嫌

    4、疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方矩阵上方。v 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。甲可能的策略纵向排列在博弈支付矩阵左侧。v 嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。人乙可能的策略横向排列在博弈支付矩阵上方。嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2

    5、)“囚徒困境囚徒困境”博弈的支付矩阵博弈的支付矩阵v 矩阵左上方的(矩阵左上方的(5,5)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌疑人乙、嫌疑人乙选择选择“坦白坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。表示嫌疑人乙的收益。v 矩阵左下方的(矩阵左下方的(10,1)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌疑人乙选择嫌疑人乙选择“坦白坦白”时,两名嫌疑人能够得到的收

    6、益。时,两名嫌疑人能够得到的收益。v 矩阵右上方的(矩阵右上方的(1,10)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。v 矩阵右下方的(矩阵右下方的(2,2)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。2智猪博弈智猪博弈v 猪栏里养了两头猪,一头大猪、一头小猪。猪栏里养了两头猪,一头大猪、一头小猪。v 在猪圈的一端有一个盛食槽。在猪圈的一端有一个盛食槽。v 在猪圈

    7、的另一端有一个按压式开关。在猪圈的另一端有一个按压式开关。v 开关每被按压一次,就有固定数量的食物出现在盛食槽中。开关每被按压一次,就有固定数量的食物出现在盛食槽中。v 大猪和小猪都在思考是否去按压开关。大猪和小猪都在思考是否去按压开关。v 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种

    8、情况下,大猪的收益为压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为,小猪的收益为-1。v 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是下,大猪得到的收益是 4,小猪得

    9、到的收益是,小猪得到的收益是 2。v 如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益的郁

    10、闷,小猪得到收益-2。v 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益物,大猪和小猪均得到收益 0。小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)“智猪博弈智猪博弈”的支付矩阵的支付矩阵二、划横线法二、划横线法v 1通过通过“划横线法划横线法”求解求解“囚徒困境囚徒困境”博弈的均衡博弈的均衡嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)v 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选

    11、择?如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择?v 理性的嫌疑人甲会选择坦白。理性的嫌疑人甲会选择坦白。v 在嫌疑人甲选择坦白所对应的收益在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。的下方划一道短横线。v 类似可分析其他情况类似可分析其他情况v 2通过通过“划横线法划横线法”求解求解“智猪博弈智猪博弈”的均衡的均衡v 如果大猪选择按开关,那么小猪应该如何选择?如果大猪选择按开关,那么小猪应该如何选择?v 理性的小猪会选择等待。理性的小猪会选择等待。v 在小猪选择等待所对应的收益在小猪选择等待所对应的收益“2”的下方划一道短横线。的下方划一道短横线。v 类似可分析其他情况类似可分

    12、析其他情况小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)第二节第二节 纳什均衡纳什均衡v 一、纳什均衡的定义一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者都给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为被称为“纳什均衡纳什均衡”(Nash Equilibrium)。)。v“囚徒困境囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。嫌疑人乙选择坦白)。v

    13、给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均衡的策略。衡的策略。v 给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什均衡的策略。均衡的策略。v“智猪博弈智猪博弈”的纳什均衡为:(大猪选择按开关,小猪选的纳什均衡为:(大猪选择按开关,小猪选择等待)。择等待)。v 给定大猪在纳什均衡的策略选择:

    14、按开关;小猪的最优策给定大猪在纳什均衡的策略选择:按开关;小猪的最优策略就是等待,小猪没有动机改变策略。略就是等待,小猪没有动机改变策略。v 给定小猪在纳什均衡的策略选择:等待;大猪的最优策略给定小猪在纳什均衡的策略选择:等待;大猪的最优策略就是按开关,大猪没有动机改变策略。就是按开关,大猪没有动机改变策略。二、存在多个纳什均衡的博弈二、存在多个纳什均衡的博弈v 1性别博弈性别博弈v 采用采用“划横线法划横线法”寻找寻找“性别博弈性别博弈”的纳什均衡的纳什均衡v(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博弈性别博弈

    15、”的纳什均衡。的纳什均衡。女方女方看足球看足球听昆曲听昆曲男方男方看足球看足球(10,2)(-1,-1)听昆曲听昆曲(-1,-1)(2,10)v 甲、乙两人相对而行,试图通过一座独木桥。甲、乙两人相对而行,试图通过一座独木桥。v 独木桥仅能容纳一人通行。独木桥仅能容纳一人通行。v 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄的独木桥,两人都会掉到河里,均得到收益的独木桥,两人都会掉到河里,均得到收益-10。v 如果甲选择退让,让乙先行,那么得意的乙将得到收益如果甲选择退让,让乙先行,那么得意的乙将得到收益 20,面子受损的甲面子受

    16、损的甲 得到收益得到收益-2。v 如果乙选择退让,让甲先行,那么得意的甲将得到收益如果乙选择退让,让甲先行,那么得意的甲将得到收益 20,面子受损的乙得到收益面子受损的乙得到收益-2。v 如果甲和乙均选择退让,那么双方均得到收益如果甲和乙均选择退让,那么双方均得到收益 10。2.“斗鸡博弈斗鸡博弈”v 采用采用“划横线法划横线法”寻找寻找“斗鸡博弈斗鸡博弈”的纳什均衡的纳什均衡v(甲前行、乙退让)和(甲退让、乙前行)都是(甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈斗鸡博弈”的纳什均衡。的纳什均衡。乙乙前行前行退让退让甲甲前行前行(-10,-10)(20,-2)退让退让(-2,20)(0

    17、,0)v 假设在市场中有两个竞争对手。一个是已经在市场中的假设在市场中有两个竞争对手。一个是已经在市场中的“在位者在位者”,另一个是企图进入市场的另一个是企图进入市场的“潜在进入者潜在进入者”。v 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个可以选择的策略:斗争、默许。可以选择的策略:斗争、默许。v 如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会使得双方均亏损,双方收益均为使得双方均亏损,双方收益均为-10。v 如果潜在进入者选择进入,在位者选择

    18、默许,那么双方在市场中均可如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可获得收益获得收益 5。v 如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 20。v 如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 153“市场争夺战市场争夺战”博弈博弈v 采用采用“划横线法划横线法”寻找寻找“市场争夺战市场争夺战”博弈的纳什均衡博弈的纳什均衡v(潜在进入者进

    19、入、在位者默许)和(潜在进入者不进入、在(潜在进入者进入、在位者默许)和(潜在进入者不进入、在位者斗争)都是位者斗争)都是“市场争夺战市场争夺战”博弈的纳什均衡。博弈的纳什均衡。在位者在位者斗争斗争默许默许潜在进入者潜在进入者进入进入(-10,-10)(5,5)不进入不进入(0,20)(0,15)三、无法通过三、无法通过“划横线法划横线法”找到纳什均衡的博弈找到纳什均衡的博弈v 1“锤头、剪刀、布锤头、剪刀、布”博弈博弈v 通过通过“划横线法划横线法”无法找到无法找到“锤头、剪刀、布锤头、剪刀、布”博弈的纳什均衡。博弈的纳什均衡。参与者参与者2锤头锤头剪刀剪刀布布参与者参与者1锤头锤头(0,0

    20、)(1,-1)(-1,1)剪刀剪刀(-1,1)(0,0)(1,-1)布布(1,-1)(-1,1)(0,0)v 市场中有两个厂商进行产量竞争。市场中有两个厂商进行产量竞争。v 市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2。v 其中:其中:Q 为总产量,为总产量,q1 为厂商为厂商 1 的产量,的产量,q2 为厂商为厂商 2 的产量。的产量。v 市场的需求函数为:市场的需求函数为:P=A-Q。v 其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v 厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本

    21、,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的生产没有固定成本。v 类似的,厂商类似的,厂商 2 的生产成本函数为:的生产成本函数为:C(q2)=cq2。v 厂商厂商 1 和厂商和厂商 2 通过选择各自的最优产量达到各自利润最大化通过选择各自的最优产量达到各自利润最大化的目标。的目标。2古诺寡头博弈古诺寡头博弈v 在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法通过通过“划横线法划横线法”求解古诺寡头博弈的均衡。求解古诺寡头博弈的均衡。v 但可以通过求解两个厂商的但可以通过求解两个厂商的“反应函数(反应函数

    22、(Reaction function)”来求解寡头博弈的均衡。来求解寡头博弈的均衡。v 厂商厂商 1 在决策时,假设厂商在决策时,假设厂商 2 的产量为给定的产量为给定v 厂商厂商 2 在决策时,假设厂商在决策时,假设厂商 1 的产量为给定的产量为给定v 根据根据 ,得到,得到v 得到反应函数(得到反应函数(Reaction Function)121222qqAcqqAc*1*233AcqAcq古诺寡头博弈反应函数和均衡古诺寡头博弈反应函数和均衡v 市场中有市场中有 n 个厂商进行产量竞争。个厂商进行产量竞争。v 市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2+qn。v 其中:

    23、其中:Q 为总产量,为总产量,qi 为厂商为厂商 i 的产量。的产量。v 市场的需求函数为:市场的需求函数为:P=A-Q。v 其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v 厂商厂商 i 的生产成本函数为:的生产成本函数为:C(qi)=cqi。其中。其中 c 为厂商为厂商 i 的的边际成本,且假设厂商边际成本,且假设厂商 i 的生产没有固定成本。的生产没有固定成本。v 市场中市场中 n 个厂商个厂商 通过选择各自的最优产量达到各自利润最大通过选择各自的最优产量达到各自利润最大化的目标。化的目标。3多厂商古诺寡头博弈多厂商古诺寡头博弈1221.112.1.1 1.2nqA

    24、cqAcqAcv 市场中的市场中的 n 个厂商利润最大化,一阶条件得到:个厂商利润最大化,一阶条件得到:v 均衡产量为:均衡产量为:v 均衡价格为:均衡价格为:*12.1nAcqqqn*12*(.)*11nAcAn cpAqqqAnnnv 可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边际成本际成本 c,即:,即:v 也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋于无穷时,市场的均衡价格趋于完全竞争市场下的价格。于无穷时,市场的均衡价格趋于完全竞争市场下的价格。*limli

    25、m1nnAn cpcn4伯特兰德寡头博弈伯特兰德寡头博弈v 市场中有两个厂商进行价格竞争。市场中有两个厂商进行价格竞争。v 厂商厂商 1 的价格为的价格为 p1。v 厂商厂商 2 的价格为的价格为 p2。v 厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的生产没有固定成本。v 类似的,厂商类似的,厂商 2 的生产成本函数为:的生产成本函数为:C(q2)=cq2。v 厂商厂商 1 和厂商和厂商 2 通过选择各自的最优价格达到各自利润最大化通过选择各自的最优价格达到各自利

    26、润最大化的目标。的目标。v 当厂商当厂商 1 产品的价格大于厂商产品的价格大于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 2 的产品,对厂商的产品,对厂商 1 产品的消费量为零。产品的消费量为零。v 当厂商当厂商 1 产品的价格小于厂商产品的价格小于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 1 的产品,对厂商的产品,对厂商 2 产品的消费量为零。产品的消费量为零。v 当厂商当厂商 1 产品的价格等于厂商产品的价格等于厂商 2 产品的价格时,消费者产品的价格时,消费者会同时消费厂商会同时消费厂商 1 和厂商和厂商 2 的产品。的产品。v

    27、因此伯特兰德寡头博弈的均衡为:因此伯特兰德寡头博弈的均衡为:*12ppcv 伯特兰德寡头博弈的均衡是一个纳什均衡。伯特兰德寡头博弈的均衡是一个纳什均衡。v 这是因为:当厂商这是因为:当厂商 2 的价格满足的价格满足 时,时,v 厂商厂商1的最优策略选择是使得自己的定价满足的最优策略选择是使得自己的定价满足v 如果厂商如果厂商 1 的定价高于的定价高于 c,则厂商,则厂商 1 会失去整个市场;会失去整个市场;v 如果厂商如果厂商 1 的定价低于的定价低于 c,则厂商,则厂商 1 会亏损。会亏损。v 因此当厂商因此当厂商 2 的定价等于的定价等于 c 时,厂商时,厂商 1 的最优定价策略的最优定价

    28、策略是使得价格等于是使得价格等于 c。v 类似的,当厂商类似的,当厂商 1 的价格等于的价格等于 c 时,厂商时,厂商 2 的最优定价的最优定价策略也是使得价格等于策略也是使得价格等于 c。*2pc*1pc现实中的囚徒困境现实中的囚徒困境v 1囚徒困境与苏美争霸囚徒困境与苏美争霸v 在苏美争霸博弈中,美国和前苏联都处于在苏美争霸博弈中,美国和前苏联都处于“囚徒困境囚徒困境”中。中。前苏联前苏联不扩军备战不扩军备战扩军备战扩军备战美国美国不扩军备战不扩军备战(10,10)(-100,100)扩军备战扩军备战(100,-100)(0,0)苏美争霸博弈的支付矩阵苏美争霸博弈的支付矩阵v 2囚徒困境与

    29、观看演出囚徒困境与观看演出v 不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷不管别人的策略是什么,所有理性人的选择都是踮起脚尖,观众都陷入入“囚徒困境囚徒困境”中。中。观众观众2不踮脚尖不踮脚尖踮脚尖踮脚尖观众观众1不踮脚尖不踮脚尖(10,10)(-5,15)踮脚尖踮脚尖(15,-5)(5,5)众人观看演出博弈的支付矩阵众人观看演出博弈的支付矩阵v 3囚徒困境与交通秩序囚徒困境与交通秩序v 博弈均衡是一个博弈均衡是一个“囚徒困境囚徒困境”。v 博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不博弈参与者都选择无视交通规范和交通礼仪,胡乱夹塞,结果不但不能提高交通参与者的

    30、出行效率,反而会使所有人的出行时间延长。能提高交通参与者的出行效率,反而会使所有人的出行时间延长。驾驶员驾驶员2不夹塞不夹塞夹塞夹塞驾驶员驾驶员1不夹塞不夹塞(10,10)(-10,20)夹塞夹塞(20,-10)(0,0)交通秩序博弈的支付矩阵交通秩序博弈的支付矩阵v“囚徒困境囚徒困境”的内在根源是:人类的个人理性有时可能导的内在根源是:人类的个人理性有时可能导致集体的非理性致集体的非理性v 在在“囚徒困境囚徒困境”中,每个博弈参与者都是理性人。中,每个博弈参与者都是理性人。v 博弈参与者的个体理性表现为:每个博弈参与者都只关心博弈参与者的个体理性表现为:每个博弈参与者都只关心自己的利益,不关

    31、心博弈对方的利益及整体利益。自己的利益,不关心博弈对方的利益及整体利益。v 然而,个体理性自由发挥的结果,导致了集体不理性。然而,个体理性自由发挥的结果,导致了集体不理性。第三节第三节 混合策略均衡混合策略均衡v 一、混合策略纳什均衡的定义和求解方法一、混合策略纳什均衡的定义和求解方法 混合策略均衡指博弈参与者以一定的概率分布随机选择混合策略均衡指博弈参与者以一定的概率分布随机选择策略集中的策略,使得其他博弈参与者在各个可能的策策略集中的策略,使得其他博弈参与者在各个可能的策略之间无差异。略之间无差异。v 在在“锤头、剪刀、布锤头、剪刀、布”的博弈中的博弈中v 博弈参与者博弈参与者 1 的混合

    32、策略指:博弈参与者的混合策略指:博弈参与者 1 在在“锤头、剪刀、锤头、剪刀、布布”三个策略中随机选择,使得博弈参与者三个策略中随机选择,使得博弈参与者 2 在在“锤头、剪刀、锤头、剪刀、布布”三个策略之间无差异。三个策略之间无差异。v 博弈参与者博弈参与者 2 的混合策略指:博弈参与者的混合策略指:博弈参与者 2 在在“锤头、剪刀、锤头、剪刀、布布”三个策略中随机选择,使得博弈参与者三个策略中随机选择,使得博弈参与者 1 在在“锤头、剪刀、锤头、剪刀、布布”三个策略之间无差异。三个策略之间无差异。v 假设博弈参与者假设博弈参与者 1 选择出选择出“锤头锤头”的概率为的概率为 ,选择出,选择出

    33、“剪刀剪刀”的概率为的概率为 ,选择出,选择出“布布”的概率为的概率为 1p锤头1p剪刀1p布v 得到联立方程组:得到联立方程组:v 类似的,得到联立方程组:类似的,得到联立方程组:v 得到得到111111111111ppppppppppp 剪刀布锤头布锤头布锤头剪刀锤头剪刀布222222222221ppppppppppp 剪刀布锤头布锤头布锤头剪刀锤头剪刀布1111/3ppp锤头剪刀布2221/3ppp锤头剪刀布二、二、“小偷和守卫小偷和守卫”博弈博弈v“小偷和守卫小偷和守卫”博弈是一个存在混合策略纳什均衡的经典博弈。博弈是一个存在混合策略纳什均衡的经典博弈。v 守卫负责在夜间看守一个仓库,

    34、小偷试图在夜间去偷窃这个仓库守卫负责在夜间看守一个仓库,小偷试图在夜间去偷窃这个仓库的物品。的物品。v 守卫有两个策略:睡觉、不睡觉。守卫有两个策略:睡觉、不睡觉。v 小偷也有两个策略:偷、不偷。小偷也有两个策略:偷、不偷。小偷小偷偷偷不偷不偷守卫守卫睡觉睡觉(-5,5)(0,0)不睡觉不睡觉(10,-10)(-2,0)v 根据根据“划横线法划横线法”,“小偷和守卫小偷和守卫”博弈没有纯策略均衡博弈没有纯策略均衡(Pure Strategy Equilibrium),但),但“小偷和守卫小偷和守卫”博弈存在一个混合策略纳什均衡。博弈存在一个混合策略纳什均衡。v 假设守卫选择假设守卫选择“睡觉睡

    35、觉”的概率为的概率为 ,选择,选择“不睡觉不睡觉”的概率为的概率为v 得到:得到:v 求解联立方程组,得到:求解联立方程组,得到:1p睡觉1p不睡11115*(10)*01pppp 睡觉不睡睡觉不睡1=2/3p睡觉1=1/3p不睡v 假设小偷选择假设小偷选择“偷偷”的概率为的概率为 ,选择,选择“不偷不偷”的概的概率为率为v 小偷通过选择自己的策略使得守卫在选择小偷通过选择自己的策略使得守卫在选择“睡觉睡觉”和和“不不睡觉睡觉”两种策略之间无差异。两种策略之间无差异。v 得到:得到:v 求解联立方程组,得到:求解联立方程组,得到:2p偷2p不偷222222(5)*0*10*(2)*1ppppp

    36、p 偷不偷偷不偷偷不偷22/17p偷215/17p不偷第四节第四节 占优策略与均衡占优策略与均衡v 一、严格占优策略的定义一、严格占优策略的定义 博弈参与者进行策略选择时,有可能存在某个策略的收益博弈参与者进行策略选择时,有可能存在某个策略的收益严格优于其他策略的情况,该策略被称为严格占优策略严格优于其他策略的情况,该策略被称为严格占优策略(Strictly Dominant Strategy)。)。v“囚徒困境囚徒困境”博弈与严格占优策略博弈与严格占优策略v 不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最优策略都是坦白。在这种

    37、情况下,优策略都是坦白。在这种情况下,“坦白坦白”是嫌疑人甲的严格占是嫌疑人甲的严格占优策略。优策略。v 不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最优策略都是坦白。因此优策略都是坦白。因此“坦白坦白”也是嫌疑人乙的严格占优策略。也是嫌疑人乙的严格占优策略。嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)二、通过寻找严格占优策略求解博弈均衡二、通过寻找严格占优策略求解博弈均衡v 在寻找博弈均衡时,如果该博弈某参与者存在严格占优策在寻找博弈均衡时,如果该博弈某参

    38、与者存在严格占优策略,那么在博弈均衡中,该参与者会选择严格占优策略,略,那么在博弈均衡中,该参与者会选择严格占优策略,而不会选择其他策略。而不会选择其他策略。v 因为不管其他参与者选择何种策略,该参与者选择严格占因为不管其他参与者选择何种策略,该参与者选择严格占优策略的收益均高于选择其他策略的收益。优策略的收益均高于选择其他策略的收益。v 因此在博弈均衡中,理性参与者一定会选择严格占优策略。因此在博弈均衡中,理性参与者一定会选择严格占优策略。1“囚徒困境囚徒困境”博弈博弈v 由于由于“坦白坦白”是嫌疑人甲的严格占优策略,所以将嫌疑人甲选择是嫌疑人甲的严格占优策略,所以将嫌疑人甲选择“坦白坦白”

    39、策略导致的博弈结果从博弈支付矩阵中剥离出来。策略导致的博弈结果从博弈支付矩阵中剥离出来。v 将嫌疑人乙选择将嫌疑人乙选择“坦白坦白”策略导致的博弈结果从上表中剥离出来策略导致的博弈结果从上表中剥离出来嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)嫌疑人乙嫌疑人乙坦白坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)v定理:定理:如果每个博弈参与者都存在一个严格占优策略,如果每个博弈参与者都存在一个严格占优策略,那么在博弈中各参与者必然选择其严格占优策略。那么在博弈中各参与者必然选择其严格占优策略。各博弈参与者的严格占优策略构成博弈均衡。各博弈参与者的严格占优策略构成博弈

    40、均衡。v 在某些博弈中,并不是所有博弈参与者都存在严格占优策略。在某些博弈中,并不是所有博弈参与者都存在严格占优策略。v 2.“智猪博弈智猪博弈”v 小猪存在严格占优策略,大猪没有严格占优策略。小猪存在严格占优策略,大猪没有严格占优策略。v 将小猪选择严格占优策略将小猪选择严格占优策略“等待等待”导致的博弈结果从上表中剥离导致的博弈结果从上表中剥离出来出来小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)v 得到:得到:v 给定小猪必然选择给定小猪必然选择“等待等待”,大猪如果选择,大猪如果选择“按开关按开关”,大猪得,大猪得到的收益为到的收

    41、益为 4,如果选择,如果选择“等待等待”,大猪得到的收益为,大猪得到的收益为 0。因此。因此大猪会选择大猪会选择“按开关按开关”。v 所以所以“智猪博弈智猪博弈”的均衡解为(大猪选择按开关,小猪选择等的均衡解为(大猪选择按开关,小猪选择等待)。待)。小猪小猪等待等待大猪大猪按开关按开关(4,2)等待等待(0,0)v 在某些博弈中,所有博弈参与者均不存在严格占优策略。在某些博弈中,所有博弈参与者均不存在严格占优策略。v 3性别博弈性别博弈v 对男方而言,如果女方选择看足球,那么男方会选择看足球;如果女方对男方而言,如果女方选择看足球,那么男方会选择看足球;如果女方选择听昆曲,那么男方会选择听昆曲

    42、。男方不存在严格占优策略。选择听昆曲,那么男方会选择听昆曲。男方不存在严格占优策略。v 对女方而言,如果男方选择看足球,那么女方会选择看足球;如果男方对女方而言,如果男方选择看足球,那么女方会选择看足球;如果男方选择听昆曲,那么女方会选择听昆曲。女方也不存在严格占优策略。选择听昆曲,那么女方会选择听昆曲。女方也不存在严格占优策略。v 无法通过寻找严格最优策略法求解无法通过寻找严格最优策略法求解“性别博弈性别博弈”的均衡解。的均衡解。女方女方看足球看足球听昆曲听昆曲男方男方看足球看足球(10,2)(-1,-1)听昆曲听昆曲(-1,-1)(2,10)三、严格被占优策略三、严格被占优策略v 有些博弈

    43、不存在严格占优策略,但存在严格被占优策略有些博弈不存在严格占优策略,但存在严格被占优策略(Strictly Dominated Strategy)。)。v 通过剔除严格被占优策略的方法也可以找出博弈的均衡。通过剔除严格被占优策略的方法也可以找出博弈的均衡。v 1严格被占优策略的定义严格被占优策略的定义 严格被占优的策略指:不管其他博弈参与者采用何种策略,严格被占优的策略指:不管其他博弈参与者采用何种策略,某个博弈参与者采用某种策略的收益总是小于采用另外某某个博弈参与者采用某种策略的收益总是小于采用另外某种策略的收益。收益较小的策略称为该博弈参与者的严格种策略的收益。收益较小的策略称为该博弈参与

    44、者的严格被占优策略。被占优策略。v 存在严格被占优策略的博弈存在严格被占优策略的博弈v 博弈参与者博弈参与者 1 和博弈参与者和博弈参与者 2 都没有严格占优策略。都没有严格占优策略。v 无法通过寻找严格占优策略法求解此博弈的均衡。无法通过寻找严格占优策略法求解此博弈的均衡。v 策略策略c是博弈参与者是博弈参与者 2 的严格被占优策略。的严格被占优策略。v 不管博弈参与者不管博弈参与者 1 采用何种策略,博弈参与者采用何种策略,博弈参与者 2 选择策略选择策略 c 的的收益均小于选择策略收益均小于选择策略 b 的收益。的收益。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A

    45、(3,1)(5,5)(1,3)策略策略B(1,5)(1,3)(5,1)2剔除严格被占优策略与博弈均衡剔除严格被占优策略与博弈均衡v 将博弈参与者将博弈参与者 2 的严格被占优策略从博弈支付矩阵中剔除,的严格被占优策略从博弈支付矩阵中剔除,得到:得到:v 策略策略 A 成为博弈参与者成为博弈参与者 1 的严格占优策略。的严格占优策略。v 将参与者将参与者 1 选择策略选择策略 A 导致的博弈结果从表中剥离出来,导致的博弈结果从表中剥离出来,得到:得到:参与者参与者2策略策略a策略策略b参与者参与者1策略策略A(3,1)(5,5)策略策略B(1,5)(1,3)v 当博弈参与者当博弈参与者 1 选择

    46、策略选择策略 A 时,博弈参与者时,博弈参与者 2 的最优策略选的最优策略选择是策略择是策略 b。v 博弈均衡为:(参与者博弈均衡为:(参与者1选择策略选择策略A,参与者,参与者2选择策略选择策略b)参与者参与者2策略策略a策略策略b参与者参与者1策略策略A(3,1)(5,5)v 练习:通过剔除严格被占优策略法找到下表的博弈均衡练习:通过剔除严格被占优策略法找到下表的博弈均衡v 博弈的均衡解为:博弈参与者博弈的均衡解为:博弈参与者 1 选择策略选择策略 C,博弈参与者,博弈参与者 2 选择策略选择策略 c。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A(1,0)(6,4)

    47、(0,9)策略策略B(4,6)(2,0)(0,3)策略策略C(7,3)(3,2)(1,4)四、弱占优策略与弱被占优策略四、弱占优策略与弱被占优策略v 有些博弈不存在严格占优策略,但存在弱占优策略。有些博弈不存在有些博弈不存在严格占优策略,但存在弱占优策略。有些博弈不存在严格被占优策略,但存在弱被占优策略。严格被占优策略,但存在弱被占优策略。v 1弱占优策略与弱被占优策略的定义弱占优策略与弱被占优策略的定义v 弱占优策略(弱占优策略(Dominant Strategy)指:不管其他博弈参与者采用)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略得到的收益总是大于或等于采何种策略,某博

    48、弈参与者采用某种策略得到的收益总是大于或等于采用另外某种策略的收益。收益较大的策略称为该博弈参与者的弱占优用另外某种策略的收益。收益较大的策略称为该博弈参与者的弱占优策略。策略。v 弱被占优策略(弱被占优策略(Dominated Strategy)指:不管其他博弈参与者)指:不管其他博弈参与者采用何种策略,某博弈参与者采用某种策略的收益总是小于或等于采采用何种策略,某博弈参与者采用某种策略的收益总是小于或等于采用另外某种策略的收益。收益较小的策略称为该博弈参与者的弱被占用另外某种策略的收益。收益较小的策略称为该博弈参与者的弱被占优策略。优策略。v 严格占优策略指博弈参与者选择某个策略的收益严格

    49、占优策略指博弈参与者选择某个策略的收益严格大于严格大于另外某个策略的收益。另外某个策略的收益。v 弱占优策略指博弈参与者选择某个策略的收益弱占优策略指博弈参与者选择某个策略的收益大于等于大于等于另另外某个策略的收益。外某个策略的收益。v 严格被占优策略指博弈参与者选择某个策略的收益严格被占优策略指博弈参与者选择某个策略的收益严格小严格小于于另外某个策略的收益。另外某个策略的收益。v 弱被占优策略指博弈参与者选择某个策略的收益弱被占优策略指博弈参与者选择某个策略的收益小于等于小于等于另外某个策略的收益。另外某个策略的收益。2弱占优策略与弱被占优策略的应用与局限弱占优策略与弱被占优策略的应用与局限

    50、v 在下表中,策略在下表中,策略 C 是博弈参与者是博弈参与者 1 的弱被占优策略,策略的弱被占优策略,策略 C 被策略被策略 A 弱占优,也被策略弱占优,也被策略 B 弱占优。弱占优。v 面对同样的博弈支付矩阵,通过剔除弱被占优策略的方法求解时,剔面对同样的博弈支付矩阵,通过剔除弱被占优策略的方法求解时,剔除策略的顺序不同,得到的均衡解也可能不同。除策略的顺序不同,得到的均衡解也可能不同。v 因此不建议采用剔除弱被占优策略的方法寻找博弈均衡。因此不建议采用剔除弱被占优策略的方法寻找博弈均衡。参与者参与者2策略策略a策略策略b策略策略c参与者参与者1策略策略A(3,8)(2,5)(2,8)策略

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:完全信息静态博弈课件2.ppt
    链接地址:https://www.163wenku.com/p-4106336.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库