《运筹学思想方法及应用》课件ch5 博弈论的思想方法及其应用.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《运筹学思想方法及应用》课件ch5 博弈论的思想方法及其应用.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学思想方法及应用 运筹学思想方法及应用课件ch5 博弈论的思想方法及其应用 运筹学 思想 方法 应用 课件 ch5 博弈论 及其
- 资源描述:
-
1、要想在现代社会做一个有文化的人,要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解你必须对博弈论有一个大致了解.诺贝尔经济学奖获得者 Paul Samuelson博弈论(博弈论(The Games Theory)The Games Theory)是运筹学学科的一个重是运筹学学科的一个重要分支。具有竞争或对抗性质的行为称为博弈行为,要分支。具有竞争或对抗性质的行为称为博弈行为,在这类行为中,参与斗争或竞争的各方各自具有不同在这类行为中,参与斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目的,各方必须考虑的目标和利益,为了达到各自的目的,各方必须考虑对手的各种可能的行动方案,并
2、力图选取对自己最为对手的各种可能的行动方案,并力图选取对自己最为有利或最合理的方案。有利或最合理的方案。博弈论就是研究博弈行为中,斗争各方是否存在最合博弈论就是研究博弈行为中,斗争各方是否存在最合理的行动方案,以及如何找到这个合理方案的理论和理的行动方案,以及如何找到这个合理方案的理论和方法。方法。5.1 博弈论的基本概念5.2 矩阵博弈的纯策略5.3 矩阵博弈的混合策略 5.4 矩阵博弈求解方法 5.5 纳什均衡 5.6 合作博弈与效益分配5.7 动态博弈与承诺行动 5.8 应用举例附录 博弈论与诺贝尔经济学奖5.1 博弈论的基本概念5.1 博弈论的基本概念1944年,数学家冯诺伊曼(J.v
3、on-Neumann)和经济学家摩根施特恩(O.Morgenstern)写成了博弈论与经济行为一书,这是博弈论这一分支的经典之作.该书不仅建立了博弈论的严格的公理化体系,而且对大量的经济活动进行了深入的分析,奠定了博弈论的基础.5.1 博弈论的基本概念5.1 博弈论的基本概念博弈论的基本概念5.1 博弈论的基本概念博弈论是矛盾和合作的规范研究,是系统研究决策主体的行为发生直接相互作用情况下的决策以及这种决策均衡的理论.也就是说,当一个决策主体的选择受到其他决策主体选择的影响,并且它的决策也影响其他决策主体的决策时的合理选择问题.博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各
4、方在冲突或合作后所实现的得失结果不仅取决于自己所采用的行为方案,同时也依赖于其他参与人所采用的行为方案,它是各参与人行为方案组合的函数.在现实生活中,经常可以看到一些具有对抗和竞争性的现象,如体育比赛、军事斗争中双方兵力的对抗,各公司企业之间的经济谈判以及为争夺市场而进行的竞争等等。在竞争过程中,各方为了达到自己的目标和利益,必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,也就是说要研究采取对抗其他竞争者的策略。从数学角度来说,博弈论就是研究竞争行为中的竞争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。5.1 博弈论的基本概念博弈论
5、认为:人是理性的,即人人都会在约束条件下最大化自身的利益;人们在交往合作中有冲突,行为互相影响,而且信息不对称.5.1 博弈论的基本概念5.1 博弈论的基本概念囚徒困境问题甲和乙两个小偷联手作案,因私入民宅被警方抓住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招,则两人各判刑8年;若两人都不招,则未获证据但因私入民宅各拘留1年。将这些数据列出,如下:5.1 博弈论的基本概念囚徒困境博弈囚徒困境博弈尽管甲不知道乙是否招供,但他认为自己选“招”最好,因而甲会选择“招”,乙也同样会选择“招”,结果各判8年;但若两人都不招
6、,结果是每人只被判1年,但在“人是理性的,即人人都会在约束条件下最大化自身的利益”的基本假设下,这种结果是不会出现的.5.1 博弈论的基本概念甲和乙是参与博弈的人,称为“局中人”.表中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付.表中的双变量矩阵称为博弈支付矩阵.局中人所选择的战略构成的组合(招,招)被称为博弈均衡.这个组合中前后两个战略分别表示甲和乙所选择的战略.5.1 博弈论的基本概念如果甲和乙在决策时抛掉谨慎,加入一定的“疯狂”,不约而同地采取“不招”的策略,其结果是每人只被判1年.显然,这对甲、乙二人来说,比他们采取理性策略的结果“好”.5.1
7、博弈论的基本概念5.1 博弈论的基本概念商家价格战 出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱.当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来.5.1 博弈论的基本概念博弈论有三个基本假设:参与人是理性的;他们有这些理性的共同知识;他们知道博弈规则.任何一个博弈问题都包含如下三个要素:局中人、策略和支付函数.5.1 博弈论的基本概念(1)局中人(Players)在一场具有竞争性的决策中,有制定对付对手的行动与方案权,并有权作出决策的参加者称为局中人,如囚徒
8、困境问题中的甲和乙.局中人可理解为那些利益完全一致的集体或集团,局中人是有理智、聪明的,并有行动决定权的.我们称只有两个局中人的博弈现象为两人博弈;而多于两个局中人的博弈称为多人博弈.在多人博弈中,局中人之间允许合作的称为结盟博弈,不允许合作的称为不结盟博弈.5.1 博弈论的基本概念(2)策略(Strategies)在一局博弈中,每个局中人都有一套可供选择的指导自始至终如何行动的方案,以求争取较好的结果,我们称此行动方案为这个局中人的一个策略,而把这个局中人的策略全体称为这个局中人的策略集.在一局博弈中,各个局中人选定的策略构成的一个策略组,称之为一个局势.如果在一局博弈中,各个局中人只有有限
9、的策略,我们称之为有限博弈;否则称为无限博弈.5.1 博弈论的基本概念(3)支付函数(Payoff Function)在一局博弈结束后,对每个局中人来说,其结果不外乎是赢(得)或输(失).显然,这种输赢局势是随局中人所选取的策略组的变化而变化的,局中人选定一个策略组,必然对应着一个博弈结果.因此,我们可以用一个函数来表示输赢(或得失).将这个函数称之为支付函数.对应所有策略组的支付函数的各个取值可以用一个矩阵来表示,称之为支付矩阵.5.1 博弈论的基本概念对于一个博弈问题,如果在每一个局势中,全体局中人的得失相加都是零,则称此博弈为零和博弈,否则称为非零和博弈.5.1 博弈论的基本概念博弈中有
10、关局中人的策略集、支付函数等构成了博弈的信息.按照局中人对信息掌握的情况,可分为完全信息博弈和不完全信息博弈。按照局中人采取行动的次序,当局中人同时采取行动或在互相保密情况下采取行动,称这种情况为静态博弈.如果局中人采取行动有先后,后采取行动的人可以观察到前面人采取的行动,则属于动态博弈。按照局中人是否结盟情况,还可以将博弈分为结盟博弈与不结盟博弈.5.1 博弈论的基本概念完全理性非合作博弈按博弈方式有限理性合作博弈二人零和博弈二人博弈按博弈人数二人非零和博弈多人博弈完全信息静态博弈静态博弈不完全信息静态博弈按博弈状态完全信息动态博弈动态博弈不完全信息动态博弈博弈分类5.1 博弈论的基本概念二
11、人有限零和博弈二人有限零和博弈 在众多博弈模型中,占有重要地位的是二人有限零和博弈,即在博弈只有两个局中人,各自的策略集只含有限个策略,每局中两个局中人的得失总和为零(即一个局中人的赢得恰为另一个局中人所输掉的值),这类博弈又称为矩阵博弈.5.1 博弈论的基本概念5.1 博弈论的基本概念【例5.1】田忌赛马战国时期(自公元前475周元王元年起,至公元前221年秦始皇吞并六国建立中国第一个统一的多民族的中央集权的封建国家为止,是我国历史上的战国时期)齐王与田忌赛马.双方约定:每人从自己的上、中、下三个等级的马中,各选出一匹马参赛,每一场比赛各出一匹马,一共比三场,每匹马只能参加一场比赛,每场比赛
12、后输者要付给赢者一千金.就同级的马而言,齐王的马都比田忌的马强.解 在本问题中局中人为齐王和田忌。以马出场的顺序而言,齐王有六种博弈策略.例如先用上等马,再用中等马,最后下等马,以(上、中、下)表示之.同样,田忌也有六种博弈策略,即两位局中人的策略集都含有六个策略.可以用表5.2表示齐王的支付.5.1 博弈论的基本概念5.1 博弈论的基本概念表5.25.1 博弈论的基本概念将表5.2中的数字表成矩阵称为齐王的赢得矩阵.311111131111113111111311111131111113 这个博弈问题是一个二人有限零和博弈问题.形势显然对田忌不利.但是田忌的谋士孙膑建议,每场比赛前要齐王报他
13、要出哪匹马.孙膑让田忌的下等马对齐王的上等马,用中等马对齐王的下等马,用上等马对齐王的中等马.结果反而赢了齐王一千金,这是一个典型的博弈问题.它表明在博弈问题中,局中人必须运用智慧,保守自己的秘密并设法获得对方的情报,采取恰当的策略方能取得较好的结果.5.1 博弈论的基本概念本节知识要点 1.博弈论研究的问题 2.博弈论思想的主要特征 3.博弈论的基本概念 4.博弈论有三个基本假设 5.博弈论的分类 5.1 博弈论的基本概念5.2矩阵博弈的纯策略局中人从 中选一个策略 ,同时局中人从 中选一个策略 ,这样就构成一个局势 对应于策略集 和 ,一共有 个局势.在局势 下局中人的赢得记为 ,则局中人
14、在m个策略 下的赢得构成一个矩阵.5.2矩阵博弈的纯策略用,分别表示两个局中人,设局中人有m个策略;局中人有n个策略;其策略集分别表示为 ,112,mS 212,nS 1Si2Sj(,).ij1S2Snm(,)ijija12,.,m5.2矩阵博弈的纯策略称为局中人的赢得矩阵.111212122212.().nnijm nmmmnaaaaaaAaaaa由于对策是零和的,表示在同一局势 下局中人的赢得,故局中人的赢得矩阵为 记这个博弈为 ija(,)ij 12,;.GSSA.A矩阵博弈的数学模型为:,其中 12,;GS S A112,mS 212,nS 111212122212.().nnijm
15、nmmmnaaaaaaAaaaa5.2矩阵博弈的纯策略5.2矩阵博弈的纯策略在矩阵博弈中要讨论的问题是:各局中人应该如何选择自己的策略,使自己在博弈中获得最好的结果.下面用一个例子说明.5.2矩阵博弈的纯策略【例5.2】设矩阵博弈局中人,应如何选择自己的策略,以保证自己在博弈中取得有利的地位?12,;GS S A112,mS 212,nS 812534121A解:对局中人而言,他的最大的收益是8,他理所当然地会选择策略 ,同时,他希望局中人选择策略 。但是局中人发现,如果局中人采取策略 ,他不会愚蠢地选择 以致失去8。反之,他会选择 ,这样他仅失去1。然而,当局中人选择 时,局中人就会选择 ,
16、这样做比选择 有利,可使收益由1增加到3。这时,局中人、都不愿再改变选择,因为如果局中人改变选择,失去的不是3,而是5或4,如果局中人改变选择,其得到的不是3,而是1或2。显然,这种状态是一种平衡状态。111122215.2矩阵博弈的纯策略对应于策略 ,局中人的赢得由5降到3,然后又由3升到4;对应于策略 ,局中人的支付由1上升到3,然后又由3下降到2.中间这个 数3,从第二行看来它形成一个凹 槽,从第二列看它形成一个凸脊,正像一个马鞍形,点3处于马鞍的 中心.225.2矩阵博弈的纯策略上面解题的数学方法为:对局中人来讲,先对矩阵A的每行元素取最小值:min 8,1,21;min 5,3,43
17、;min1,2,11.再从这些最小值中取最大值:。也就是说,局中人采取悲观主义原则,从最坏的情况中,取得的最好结果是3,这时,他应采取的策略是 ,不论局中人采取什么策略,都可以保证赢得不会少于3.31,3,1max25.2矩阵博弈的纯策略5.2矩阵博弈的纯策略注意到矩阵A中的元素 反号后是局中人的赢得,故局中人采取悲观主义原则时,应先对矩阵A的每一列元素中取出最大值:再从这些最大值中取最小值:。因此,局中人应采取策略 ,则不论局中人采取什么策略,最大损失不会大于3。ijamax 8,5,18;max 1,3,23;max 2,4,14.34,3,8min25.2矩阵博弈的纯策略因此,局中人、只
18、有分别采取 、时才是他们的最优策略。为了与后面的概念相区别,我们称 、分别为局中人、的最优纯策略,而局势 称为博弈的解,或博弈 的纳什均衡。222222(,)12,;GS SA12,;GS SA5.2矩阵博弈的纯策略一般地,对最优纯策略及纯策略意义下的纳什均衡有如下定义:考虑矩阵博弈如果成立等式则 分别称为局中人、的最优纯策略,对应的策略组合即局势 称为矩阵博弈 在纯策略意义下的纳什均衡。数值 称为矩阵博弈 的值。112,mS 212,nS 812534121A*1111maxminminmaxijiji jj nj ni mi maaa 12,;GS SA*,ij*(,)ij12,;GS S
19、 A*Gi jVa12,;GS S A【例例5.3】设矩阵博弈设矩阵博弈 ,其中,其中5.2矩阵博弈的纯策略求解纳什均衡与博弈的值。12,;GS SA11232123,SS 534519206A 解 对局中人,先对矩阵A的每行求最小值,得到 ,再求其最大值得到3,即3,5,21313max min3ijjia 对局中人,先对矩阵A的每行求最大值,得到 ,再求其最大值得到3,即5,3,91313m in m ax3ijjia 从而13131313maxminminmax3ijijjjiiaa 所以,该博弈的纳什均衡为 ,博弈的值 .可以看出:满足不等式12(,)123GVa12a2121,(1,
20、2,3;1,2,3)ijaaaij 将这个结论推广,我们给出如下定理:5.2矩阵博弈的纯策略5.2矩阵博弈的纯策略矩阵博弈 在纯策略意义下有纳什均衡的充分必要条件是:存在策略 ,使得 12,;GS SA*(,)ij*1111max minmin maxijiji jj nj ni mi maaa 或 ,*iji ji jaaa1,2,;1,2,im jn定理5.15.2矩阵博弈的纯策略设矩阵博弈 ,其中 12,;GS SA1123421234,SS 85952343105754282A求解纳什均衡与博弈的值.【例例5.45.4】解 对局中人,先对矩阵A的每行求最小值,得到 ,再求其最大值得到5
21、,即.5,3,5,41414maxmin5ijjia 对局中人,先对矩阵A的每列求最大值,得到 ,再求其最小值得到5,即10,5,9,514 14minmax5ijjia 从而 *14141414maxminminmax5(1,3;2,4)ijiji jjjiiaaaij 所以,局势 都是博弈 的纳什均衡,博弈值 。12143234(,),(,),(,),(,)5GV12,;GS SA5.2矩阵博弈的纯策略本节知识要点本节知识要点 1.矩阵博弈的数学模型 2.博弈 的纳什均衡 3.矩阵博弈 在纯策略意义下有纳什均衡的充分必要条件12,;GS SA12,;GS SA5.3 矩阵博弈的混合策略矩阵
22、博弈的混合策略 5.3 矩阵博弈的混合策略矩阵博弈的混合策略上节讨论了在纯策略意义下有纳什均衡的矩阵博弈问题。但是,并非所有的矩阵博弈在纯策略意义下都有纳什均衡。例如本章的齐王赛马的博弈在纯策略下没有纳什均衡。因为所以在齐王赛马的博弈中,双方都没有最优纯策略,从而在纯策略意义下就没有纳什均衡。1616161616161616maxmin1;minmax3;maxminminmax.ijijjjiiijijjjiiaaaa 5.3 矩阵博弈的混合策略矩阵博弈的混合策略【例例5.55.5】设矩阵博弈 ,其中解解 故此博弈不存在鞍点,从而双方都没有最优纯策略。12,;GS SA11211215,73
23、SSA 33,1maxminmax2121ijjia55,7minmaxmin2121ijija5.3 矩阵博弈的混合策略矩阵博弈的混合策略此时,我们可以设想局中人随机地取纯策略来进行博弈。例如,局中人以概率选取纯策略,以概率选取纯策略;局中人以概率选取纯策略,以概率选取纯策略。于是,对局中人来说,他的赢得可用期望值来描述:x1x1y21y12),(yxE)1)(1(3)1(7)1(5),(yxyxyxxyyxE8243118()()4.24xyxyxy 5.3 矩阵博弈的混合策略矩阵博弈的混合策略由上式可以看出,当时,即局中人以概率选取纯策略时,其期望值至少是4,但不能保证期望值超过4,这是
24、因为局中人取时,即以概率选取纯策略时,可以控制局中人的赢得不会超过4.21x21141y4115.3 矩阵博弈的混合策略矩阵博弈的混合策略从上述分析可以看出,每个局中人决策时,不是决定用哪一个纯策略,而是决定用多大概率选择每一个纯策略。一般地,设矩阵博弈,其中 12,;GS SA112,.,mS nmijaA)(212,nS 5.3 矩阵博弈的混合策略矩阵博弈的混合策略则将纯策略集合对应的概率向量 分别称为局中人与的混合策略,这里是局中人选取的概率,是局中人选取的概率,显然,纯策略可以看成是混合策略的一种特殊情况。又称数学期望为局中人的赢得,为局中人的赢得,而称为混合局势。121(,),0,1
25、,2,;1mmiiiXx xxximx121(,),0,1,2,;1nnjjjYy yyyjnyminjjiijyxaYXE11),(ixijyj),(YXE),(YX5.3 矩阵博弈的混合策略矩阵博弈的混合策略对给定博弈,称为博弈的混合扩充,其中为局中人的所有混合策略集;为局中人的所有混合策略集。12,;GS SA*12,;GSSE*1SX*2SY5.3 矩阵博弈的混合策略矩阵博弈的混合策略在混合扩充博弈中,局中人选取某种混合策略时,必定要想到局中人会针对性选取一种策略,使其期望赢得最小,于是局中人的目标就是寻求一种以概率选取的策略,使局中人不论采取何种策略时,都能使自己的期望赢得中最小的尽
展开阅读全文