运筹学博弈论-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《运筹学博弈论-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 博弈论 课件
- 资源描述:
-
1、第第1010章章 博弈论博弈论10.110.1博弈论概述博弈论概述10.210.2完全信息静态博弈完全信息静态博弈第一节第一节 博弈论概述博弈论概述精品资料 你怎么称呼老师?如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进?你所经历的课堂,是讲座式还是讨论式?教师的教鞭“不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘”“太阳当空照,花儿对我笑,小鸟说早早早”田忌赛马博弈田忌赛马博弈华容道博弈华容道博弈 一、博弈论的产生和发展一、博弈论的产生和发展1.1.博弈在中国博弈在中国从孙子兵法到三十六计从孙子兵法到三十六计从田忌赛马到孙庞斗智从田忌赛马到孙庞斗智
2、从运筹帷幄到韬光养晦从运筹帷幄到韬光养晦从曹刿论战到论持久战从曹刿论战到论持久战2.博弈论的开山之作博弈论的开山之作1943年,冯年,冯诺依曼和摩诺依曼和摩根斯顿发表根斯顿发表博弈论和经博弈论和经济行为济行为的一书,的一书,标志着博弈论作为一门独立科学的开始,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发也标志着新古典经济学进入了一个新的发展阶段。展阶段。3.1994年三位获诺奖的博弈论学者年三位获诺奖的博弈论学者John NashJohn HarsanyLeihaden Selten4.1996年诺贝尔经年诺贝尔经济学奖得主:詹姆济学奖得主:詹姆斯斯莫里莫里 斯:主
3、要斯:主要贡献:不对称信息贡献:不对称信息条件下的激励理论条件下的激励理论5.2001年诺贝尔经济年诺贝尔经济学奖得主:迈克尔学奖得主:迈克尔斯斯宾塞:在不对称信息市宾塞:在不对称信息市场分析方面所做出开创场分析方面所做出开创性研究。性研究。6.2005年二位获诺奖的博弈论学者年二位获诺奖的博弈论学者Robert AumannThomas Shelling10.1.2 博弈及博弈论博弈就是策略对抗,或策略有关键作用的游戏博弈就是策略对抗,或策略有关键作用的游戏博弈Game,博弈论Game Theory,Game即游戏、竞技游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互
4、依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决策、市场阻入、投标拍卖 政治、军事美国和伊拉克、以色列和巴勒斯坦定义定义:博弈就是参与人(可能是个人,也可能是团体,如国家、企业、国际组织等)在一定得规则下,同时或先或后,一次或多次,从各自允许选择的行动或战略中进行选择并加以实施,而取得相应结果(支付函数)的过程。都有一定的规则都有一定的规则 都有一个结果都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏策略至关重要,游戏者不同的策略选择常会带来不同的游戏结果结果 策略和利益有相互依存性策略和利益有相互依存性 博弈论:博弈论就是系统研究具有上述特征的博弈问博弈论:博弈论就是
5、系统研究具有上述特征的博弈问题,寻求各博弈方合理选择战略情况下博弈的解,并题,寻求各博弈方合理选择战略情况下博弈的解,并对这些解进行讨论分析的理论。对这些解进行讨论分析的理论。博弈的分类及对应的均衡概念博弈的分类及对应的均衡概念 10.2 完全信息静态博弈10.2.1 策略型博弈模型及占优战略博弈10.2.2 重复剔除的占优战略博弈10.2.3 纳什均衡10.2.1 策略型博弈模型及占优战略博弈非合作博弈模型从模型自身形式上可分为扩展型和策略型两种,一般用策略型模型描述完全信息静态博弈模型。构成策略型博弈模型的三个要素:局中人、策略、支付函数 参与人或局中人参与人或局中人(Players)(P
6、layers):独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈 策略或战略(策略或战略(strategiesstrategies):博弈中各博弈方的选择内容。策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个 支付函数支付函数(Payoffs function)(Payoffs function):各博弈方从
7、博弈中所获得的利益。得益对应博弈的结果,也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据根据得益的博弈分类:零和博弈、常和博弈、变和博弈例10.1 囚徒困境博弈囚徒的困境是图克(Tucker)1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷基本模型 经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉
8、默,此人将即时获释,沉默者将判监8年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。若二人都互相检举(互相“背叛”),则二人同样判监5年。囚徒困境-5,-50,-8-8,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖坦白是坦白是A A的的占优战略占优战略坦白是坦白是B B的的占优战略占优战略占优策略占优策略(上策上策)均衡均衡l 占优策略占优策略(上策上策)通俗来说是:通俗来说是:“我所做的是不管你做什么我所能做的最好的我所做的是不管你做什么我所能做的最好的”“你所做的是不管我做什么你所能做的最好的你所做的是不管我做什么你所能做的最好的”l 占优策略均衡占优策略均衡指博弈中的所有
9、参与者的占优策指博弈中的所有参与者的占优策略组合所构成的均衡。略组合所构成的均衡。囚徒困境(囚徒困境(PrisonersDilemma )l 只达到效率很差的个体理性解,没有实现团体只达到效率很差的个体理性解,没有实现团体理性解。理性解。l 前者是稳定的,是自动实施的;尽管团体理性前者是稳定的,是自动实施的;尽管团体理性解对大家都好,但它是不能自动实施的,需要改变解对大家都好,但它是不能自动实施的,需要改变条件。条件。提示:提示:该博弈揭示了个体理性与团体理性之间的矛盾。从个体利益出发的行为往往不能实现团体的最大利益,同时也揭示了个体理性本身的内在矛盾从个体利益出发的行为最终也不一定能真正实现
10、个体的最大利益,甚至得到相当差的结果。10.2.2 重复剔除的占优战略均衡 首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为“重复剔除的占优战重复剔除的占优战略均衡略均衡”(iterated dominance equilibrium).(iterated dominance equilibrium).智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控
11、制猪食的供应。按一下按钮。将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择,它必须付出如下代价:第一,它需要收益相当于2个单位的成本;第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。大猪先到:大猪吃到9个单位,小猪吃到1个单位;小猪先到:小猪吃到4个单位,大猪吃到6个单位;同时到达:大猪吃到7个单位,小猪吃到3个单位。27大猪不按按不按按小猪(4,4)(5,1)(9,-1)(0,0)小猪大猪按等待按5,14,4等待9,10,0小猪的上策2930重复剔除的占优均衡1,01,20
12、,30,1M列先生行先生UDL0,12,0R行:没有占优策略列:M严格优于R剔除 R行:U优于D列:无占优策略剔除 DM优于L(U,M)是重复剔除的占优均衡u纳什均衡概念是现代博弈论的核心概念。它是以美国数学家、经济学家纳什(Nash)的名字命名的,纳什在1950年的一篇论文中提出了纳什均衡的概念。10.2.3 10.2.3 纳什(纳什(NashNash)均衡)均衡纳什均衡(Nash Equilibrium)通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。1.纯战略Nash均衡策略空间:每个博
13、弈方的全部可选策略的集合博弈方 的第 个策略:博弈方 的得益:博弈:,;,11nnuuSSGnSS,1ijiSsiuiij定义1在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方 的策略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡(Nash Equilibrium)。,;,11nnuuSSGi),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*nissG),(*niss*is 定义2:一个Nash均衡是强的(Strict或Strong),
展开阅读全文