博弈论(第三章修改)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈论(第三章修改)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 第三 修改 课件
- 资源描述:
-
1、第三章第三章 完全且完美信息的动态博弈完全且完美信息的动态博弈动态博弈:动态博弈:指的是博弈方的行动有先后次序,且后行动者能够观察到先行动者所选择的行动并在此基础上采取自己最有利的策略。完全信息的博弈:完全信息的博弈:在一个博弈中,每一个博弈方都完全了解所有博弈方的在各种情况下得益的博弈。完美信息的动态博弈完美信息的动态博弈:在动态博弈中,若所有的博弈方在轮到自己行动时,对此前的全部过程完全了解。第一节第一节 动态博弈的表示方法和特点动态博弈的表示方法和特点 一、阶段和扩展形表示一、阶段和扩展形表示 阶段:在动态博弈中,一个博弈方的一次选择策略的 行为我们常称为一个阶段。在动态博弈中,各个博弈
2、方的选择策略的行为有先后次序,所以动态博弈也称为序列博弈,或称之为多阶段博弈。二、扩展式表述二、扩展式表述是用博弈树来表述的。而博弈树是有选择结点(信息集),终端结点以及树枝所组成的。其中,空心圆表示选择结点,实心圆表示终端结点,标注在博弈树终端结点下的是博弈方的得益函数;而直线表示博弈树的树枝,代表博弈方的一个选择。也就是:扩展式表示动态博弈,它包括选择结点选择结点,终终端结点和树枝端结点和树枝组成。扩展式表述例题扩展式表述例题例:有一个容量有限的市场已经被厂商A抢先占领,而 另一个生产同样产品的厂商B也想加入该市场发 展,分享一定的利润。厂商B知道一旦自己进入该 市场先占领市场的厂商A有可
3、能通过降价等竞争手 段来打击自己,此时厂商B不但不能赢利,而且肯 定还会亏损。例题的假定例题的假定在这个“先来后到”博弈中,假设A独占市场时利润为10个单位;与B和平共处分享市场则双方各得5个单位;如B进入市场而A进行打击,则B要亏损2个单位,A的利润则降为3个单位。我们可以用博弈的扩展式表述来表达。“现来后到现来后到”博弈的扩展式表示博弈的扩展式表示 B 进进 A 不进不进 打击打击 和平和平 (0,10)(-2,3)(5,5)注意:双方损益值中,第一个是先动一方的损益。“开发金矿开发金矿”的博弈的博弈例:“开发金矿”的博弈 甲有一价值4万元的金矿,但缺1万元的开发资金,而乙正好有1万元资金
4、可以投资。设甲想说服乙将这 一万元资金借给自己用于开发金矿,并许诺在采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。“开发金矿开发金矿”博弈表示一博弈表示一三阶段三阶段“开发金矿开发金矿”博弈表示二(法律保证不足)博弈表示二(法律保证不足)三阶段三阶段“开发金矿开发金矿”博弈表示三(有法律保证)博弈表示三(有法律保证)“仿冒和反仿冒仿冒和反仿冒”的博弈的博弈设有一家企业的产品被另一家企业仿冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒,如果仿冒企业不采取措施制止,那么仿冒企业就会继续仿冒。上述博弈有两个博弈方A,B,其中博弈方A是仿冒企业,博弈方B是被仿冒企业,并且假设仿冒最多进行
5、两次。再假设第一次不仿冒,仿冒被制止以及第一次仿冒没被制止的情况下,第二次不仿冒,仿冒被制止和仿冒不被制止这几种情况下,写出它的扩展式表示。“仿冒和反仿冒仿冒和反仿冒”的扩展式表示的扩展式表示博弈树所遵循的原则博弈树所遵循的原则(1)每一个结点至多有一个其他结点直接位于它 的前 面。(2)在博弈树中没有一条路径可以使选择结点与自身 相连。(3)每个博弈树必须有初始结点。(4)每个博弈树只有一个初始结点。三、动态博弈的策略三、动态博弈的策略动态博弈的策略:动态博弈的策略:在整个的动态博弈中,各博弈方在每个阶段所选择的行为,以及针对前面的每个阶段的各种行为所做的相应选择的完整过程,称之为动态博弈中
6、博弈方的一个策略。“仿冒和反仿冒仿冒和反仿冒”的扩展式表示的扩展式表示三阶段三阶段“开发金矿开发金矿”博弈表示二(法律保证不足)博弈表示二(法律保证不足)四、动态博弈的结果四、动态博弈的结果动态博弈的结果有三个含义:(1)指各博弈方由动态博弈的策略所构成的策略组合。(2)是各博弈方的策略组合形成的一条连接各个阶段 的路径。从动态博弈的扩展式图中来看,是指连接 博弈每个阶段的一条路径。(3)动态博弈的结果还包括实施上述策略组合的最终得 益。就是上述路径终端结点处得益数组的数字。“仿冒和反仿冒仿冒和反仿冒”的扩展式表示的扩展式表示三阶段三阶段“开发金矿开发金矿”博弈表示二(法律保证不足)博弈表示二
7、(法律保证不足)五、动态博弈的非对称性五、动态博弈的非对称性是指由于动态博弈中各个博弈方的选择行为有先后次序,且后行为者可以观察到此前选择行为博弈方的选择行为,因此动态博弈中各博弈方的地位是不对称的。第二节第二节 动态博弈中的纳什均衡和可信性问题动态博弈中的纳什均衡和可信性问题一、动态博弈中的纳什均衡一、动态博弈中的纳什均衡纳什均衡的策略组合是指每一个博弈方的策略都是针对其他博弈方策略的最佳对策,各博弈方都不愿意改变策略的策略组合,具有一定的稳定性。动态博弈的纳什均衡分析动态博弈的纳什均衡分析例:“开发金矿的博弈”甲有一价值4万元的金矿,但缺1万元的开发资金,而乙正好有1万元资金可以投资。设甲
8、想说服乙将这 一万元资金借给自己用于开发金矿,并许诺在采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。“开发金矿开发金矿”的博弈表示(法律保证不足)的博弈表示(法律保证不足)“开发金矿开发金矿”博弈(有法律保证)博弈(有法律保证)二、二、相机选择和策略中的可信性问题相机选择和策略中的可信性问题相机选择问题:相机选择问题:在动态博弈中,对于博弈方在各个阶段针对各种情况所预先设定的策略,只要符合博弈方自己的利益,他们完全可以在博弈过程中改变预先设定的策略。我们称这种问题为动态博弈的相机选择问题。“开发金矿开发金矿”博弈博弈“开发金矿开发金矿”博弈(有法律保证)博弈(有法律保证)第二节第二节
9、动态博弈的分析方法动态博弈的分析方法 -逆推归纳法逆推归纳法 逆推归纳法:逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法。我们称之为逆推归纳法。“开发金矿开发金矿”博弈(法律保证不足)博弈(法律保证不足)“开发金矿开发金矿”博弈(有法律保证)博弈(有法律保证)逆推归纳法的例子一逆推归纳法的例子一甲(2,0)(1,1)(0,2)上 乙 右 甲 后下 左 前(3,0)逆推归纳法的例子二逆推归纳法的例子二有5个海盗抢来100枚金币,大家决定了下面分赃的方式:由海盗一提出一种分赃的方式,如果同意这种方式的人达到半数,那么该
10、提议就通过并付诸实施;若同意这种方式的人未达到半数,则提议不能通过且提议人将被扔进大海喂鲨鱼,然后由接下来的海盗继续重复提议过程。假设海盗个个都非常聪明,也不互相合作,并且每个海盗都想尽可能多得到金币,那么,第一个提议的海盗将怎样提议既可以使得提议被通过又可以最大限度得到金币呢?逆推归纳法的总结逆推归纳法的总结(1)逆推归纳法就是把多阶段动态博弈化为一系列 的单人博弈进行分析;(2)逆推归纳法是严格下策反复消去法在动态博弈中 的应用。(3)由逆推归纳法确定的各个博弈方在各阶段的选择都 是建立在后续阶段各个博弈方理性的基础上的,因 此自然排除了包含不可信的许诺;(4)逆推归纳法不适用于无限博弈和
11、不完美信息博弈。第三节第三节 子博弈完美纳什均衡子博弈完美纳什均衡 一、子博弈一、子博弈定义:由一个动态博弈的第一阶段以外的某阶段开始 的后续博弈所有阶段构成,有初始信息集和进 行博弈所需要的全部信息,能够自成一个博 弈,并且是原博弈的一部分,我们称之为原动 态博弈的一个“子博弈”。子博弈(子博弈(1):):“开发金矿开发金矿”博弈博弈例:在“开发金矿”的博弈中,虚线框中的部分满足 上述定义,因此是这个博弈的“子博弈”。子博弈(子博弈(2):):“开发金矿开发金矿”博弈博弈子博弈的子博弈:子博弈的子博弈:称后面的这个子博弈为原博弈的“二级子博弈”。二、子博弈完美纳什均衡二、子博弈完美纳什均衡定
12、义:在一个完美信息的动态博弈中,如果各博弈方的 策略构成的一个策略组合满足,在整个动态博弈 以及它的所有子博弈中都构成纳什均衡,那么,这个策略组合称为该动态博弈的一个“子博弈完 美纳什均衡”。求完美信息动态博弈的子博弈完美纳什均衡的最基本的方法就是我们已经介绍的逆推归纳法。“现来后到现来后到”博弈:子博弈完美纳什均衡博弈:子博弈完美纳什均衡 B 进进 A 不进不进 打击打击 和平和平 (0,10)(-2,3)(5,5)注意:双方损益值中,第一个是先动一方的损益。“仿冒和反仿冒仿冒和反仿冒”:子博弈完美纳什均:子博弈完美纳什均衡衡三、几个经典的动态博弈模型三、几个经典的动态博弈模型(1)寡占的斯
展开阅读全文