对策论运筹学讲义课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《对策论运筹学讲义课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 策论 运筹学 讲义 课件
- 资源描述:
-
1、第十章 对策论 由“齐王赛马”引入1 1 对策论的例子2 2矩阵矩阵对策论的基本概念3 3 矩阵对策的最优纯策略矩阵对策的最优纯策略4 4矩阵对策的混合策略矩阵对策的混合策略5 5 其他类型的对策其他类型的对策对策论或博弈论(Game Theory)是研究具有对抗和竞争性行为问题的数学理论与方法。是运筹学的重要分支学科经济学领域一般称博弈论,是经济学领域近几十年发展起来一门新兴学科对策论从理论上作严格的讨论却起始于二十世纪:1912年,德国数学家E.Zermelo证明了国际象棋的3种着法必定存在一种;1921年,法国数学家E.Borel引入了“最优策略”等概念;1928年,美籍匈牙利人J.Vo
2、n Neumann证明了对策论的基本定理-最大值最小值定理;1944年,Von Neumann和O.Morgenstern合写了对策论与经济行为一书,建立起对策论的基本理论,奠定了对策论研究的基础。对策问题举例例例1 1 猜单和猜双的博弈。两个人同时出一个指头或两个指头,猜单和猜双的博弈。两个人同时出一个指头或两个指头,如果两人出的指头相同,则局中人如果两人出的指头相同,则局中人1 1从局中人从局中人2 2处赢得五元;处赢得五元;如果出的不一样,局中人如果出的不一样,局中人1 1就要支付给局中人就要支付给局中人2 2五元。两个五元。两个对手都可以采取两个策略:出一个手指和出两个手指,下对手都可
3、以采取两个策略:出一个手指和出两个手指,下表是局中人表是局中人1 1的赢得矩阵的赢得矩阵(二指莫拉问题二指莫拉问题)策 略局中人2出1指出2指局中人1出1指55出2指55局中人局中人1 1从局中人从局中人2 2该如何选择策略,已获得利益?该如何选择策略,已获得利益?例例2 2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判刑判刑8 8年;如果两人都抵赖,由于证据不充分,两人将各年;如果两人都抵赖,由于证据不充分,两人将各判刑判刑2 2年;如果其
4、中一人坦白,另一人抵赖,则坦白者年;如果其中一人坦白,另一人抵赖,则坦白者立即释放,抵赖者判刑立即释放,抵赖者判刑1010年。在这个例子中两人嫌疑犯都年。在这个例子中两人嫌疑犯都有两种策略:坦白或抵赖。可以用一个矩阵表示两个嫌疑有两种策略:坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益犯的策略的损益策 略囚徒2坦白抵赖囚徒1坦白(8,8)(0,10)抵赖(10,0)(2,2)囚徒该如何选择策略?囚徒该如何选择策略?囚徒困境反映了个人理性和集体理性的矛盾。对于双方,(抵赖,抵赖)囚徒困境反映了个人理性和集体理性的矛盾。对于双方,(抵赖,抵赖)的结果是最好的,但因为每个囚徒都是理性人,他们追
5、求自身效应的最的结果是最好的,但因为每个囚徒都是理性人,他们追求自身效应的最大化,结果就变成了(坦白,坦白)。个人理性导致了集体不理性大化,结果就变成了(坦白,坦白)。个人理性导致了集体不理性例3 田忌与齐王赛马 战国时期,齐威王与大将田忌赛马,双方约定:从各战国时期,齐威王与大将田忌赛马,双方约定:从各自的自的上、中、下三个等级上、中、下三个等级的马中各选一匹马出场比赛,负者的马中各选一匹马出场比赛,负者要付给胜者一千金。已知田忌的马要比齐王同一等级的马差要付给胜者一千金。已知田忌的马要比齐王同一等级的马差一些,但比齐王等级较低的马却要强一些。因此,如用同等一些,但比齐王等级较低的马却要强一
6、些。因此,如用同等级的马对抗,田忌必连输三场,失三千金无疑。田忌的谋士级的马对抗,田忌必连输三场,失三千金无疑。田忌的谋士孙膑给田忌出了个主意:每局比赛前先了解齐王参赛马的等孙膑给田忌出了个主意:每局比赛前先了解齐王参赛马的等级,再采用级,再采用下等马对齐王上等马下等马对齐王上等马、中等马对齐王下等马中等马对齐王下等马、上上等马对齐王中等马等马对齐王中等马的策略。比赛结果,田忌二胜一负,反而的策略。比赛结果,田忌二胜一负,反而赢得一千金。由此可见,双方各采取什么样的出马次序对胜赢得一千金。由此可见,双方各采取什么样的出马次序对胜负至关重要。负至关重要。“齐王赛马齐王赛马”齐王在各局势中的益损值
7、表齐王在各局势中的益损值表(单位:千金单位:千金)齐王和田忌可以任意选择三匹马出场的顺序齐王和田忌可以任意选择三匹马出场的顺序1 1对策论的基本概念对策模型的三个基本要素:对策模型的三个基本要素:1.1.局中人局中人(Players):参与对抗的各方;:参与对抗的各方;2.2.策略集策略集(Strategices):(Strategices):局中人选择对付其它局中人的行动局中人选择对付其它局中人的行动方案称为方案称为策略策略;某局中人的所有可能策略全体称为;某局中人的所有可能策略全体称为策略集策略集3.3.一局势对策的益损值:局中人各自使用一个对策就形成了一局势对策的益损值:局中人各自使用一
8、个对策就形成了一个局势一个局势,一个局势决定了各局中人的对策结果(量化),一个局势决定了各局中人的对策结果(量化)称为该局势对策的称为该局势对策的益损值益损值。赢得函数赢得函数(payoff function)(payoff function):定义在局势上,取值为相应:定义在局势上,取值为相应益损值的函数益损值的函数4.纳什均衡:纳什均衡:纳什均衡指所有局中人最优策略组成的一种局纳什均衡指所有局中人最优策略组成的一种局势,既在给定其他局中人策略的情况下,没有任何局中人势,既在给定其他局中人策略的情况下,没有任何局中人有积极性去选择其他策略有积极性去选择其他策略对策的分类对策按对策方式合作对策
9、非合作对策完全理性有限理性两人对策零和对策非零和对策多人对策结盟对策不结盟对策按对策人数静态对策完全信息静态对策不完全信息静态对策动态对策完全信息动态对策不完全信息动态对策按对策状态二人有限零和对策二人有限零和对策(又称(又称矩阵对策矩阵对策):):局中人为局中人为2 2;每个局中人的策略集的策略数目都是有限的;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。局中人的益损值之和为零。通常将矩阵对策记为通常将矩阵对策记为:G=S1,S2,A局中人甲的策略集:局中人甲的策略集:局
10、中人乙的策略集:局中人乙的策略集:甲的赢得矩阵:甲的赢得矩阵:矩阵对策矩阵对策112,mS212,nS111212122212mmmmmnaaaaaaAaaaaij为局中人甲在局势 下的赢得(,)ij其中:齐王的策略集其中:齐王的策略集:S1=1,2,3,4,5,6,田忌的策略集:田忌的策略集:S2=1,2,3,4,5,6。下面矩阵称齐王的下面矩阵称齐王的赢得矩阵赢得矩阵:3 1 1 1 -1 1 1 3 1 1 1 -1 A=1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 “齐王赛马齐王赛马”是一个矩阵策略。是一个矩阵策略。2 2 矩阵
11、对策的最优纯策略矩阵对策的最优纯策略例4 甲、乙两队进行球赛,双方各可排出三种不同的阵容。设甲队为局中人,乙队为局中人,每一种阵容为一个策略,有S1=1,2,3,S2=1,2,3。根据 以往两队比赛的记录,甲队得分情况的赢得矩阵为415306213A问:这次比赛中,双方应 如何对阵?在如此反复对策的过程中,各局中人如果不想冒险,就应该考虑从自身可能出现的最坏情况下着眼,去选择一种尽可能好的结果,即双方都是从各自可能出现的最不利即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。的情形选择一种最为有利的情况作为决策的依据。这就是所谓“理智行为理智行为”。称为最小最大准则最
12、小最大准则,按照这个各方均避免冒险的观念,就形成如下的推演过程推演过程。415306213A解 从A中可以看出,最多可得6分。于是,为得6分而选2。但是推测会有此心理,从而选3来对付,使得非但得不到6分,反而要失去3分。当然也会料到会有此心理,从而改选3,以使欲得3分而反失4分。矩阵矩阵A中每行的最小元素分别为中每行的最小元素分别为1,-3,-5。在这些最少赢得中最好的结果是在这些最少赢得中最好的结果是1 1,故,故局中人局中人会采取会采取策略策略 1 1,无论对手采取何策略,无论对手采取何策略,局中人局中人至少得至少得1 1分。对于分。对于局中人局中人,1 1,2 2,3 3 可能带来的最少
13、赢得,即可能带来的最少赢得,即A中每列的中每列的最大元素,分别为最大元素,分别为6,1,4。局中人局中人会采取会采取 2 2策略,确保策略,确保局局中人中人不会超过不会超过1 1分分。1 1和和 2 2分别称为局中人分别称为局中人、的最优策略。由于双方必的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。然选择这一种策略,所以,这种策略又称为最优纯策略。2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略326035141AMin1356Max14 1 2 3 1 2 3定义定义1 1 设有矩阵对策设有矩阵对策G=S1,S2;A,其中,其中,A=ai j mn,若有若有vaaa
14、jiijijijji*maxminminmax则局势则局势(i*,j*)称为G在在纯策略意义下的解纯策略意义下的解,也称,也称为为G的的鞍点鞍点;i*、j*分别称为局中人分别称为局中人和和的的最最优纯策略优纯策略;v称为称为G的值,也称的值,也称对策值对策值。对于例对于例4,G的解的解(鞍点鞍点)为为(1,2),1、2分别为分别为、的最优策略。对策值的最优策略。对策值v=1 0,反映优势在反映优势在方方(对对有利有利);若;若v 0,为任一常数。则为任一常数。则 (1)(2)T(G1)=T(G2)21GGvv定理定理9 设设G S1,S2;A为一矩阵对策,且为一矩阵对策,且A=AT为斜对称为斜
15、对称矩阵,称这样的对策为对称对策,则矩阵,称这样的对策为对称对策,则 (1)vG=0 (2)T1(G)=T2(G)其中其中T1(G)和和 T2(G)分别为局中人分别为局中人和和的最优策略集的最优策略集定理定理7和和8可以可以用来简化矩阵中的元素数字,使得以后的求解用来简化矩阵中的元素数字,使得以后的求解更为方便。更为方便。n矩阵对策的解法矩阵对策的解法 1优超原则法优超原则法 设有矩阵对策设有矩阵对策G=S1,S2;A,其中其中:A=ai j mn,如果对一切如果对一切j=1,n,都有都有 即矩阵的第即矩阵的第 行元素均不小于行元素均不小于 行的元素,则行的元素,则称局中人称局中人的纯策略的纯
16、策略 优超于纯策略优超于纯策略 ;同样,若对于;同样,若对于一切一切i=1,m,有有 ,即矩阵的第即矩阵的第 列均不大于列均不大于 列的元素,则称局中人列的元素,则称局中人的纯策略的纯策略 优超于纯策略优超于纯策略 112,mS212,nS00ijkjaa0i0k0i0k00i jikaa0j0k0j0k当局中人当局中人的纯策略的纯策略 优超于纯策略优超于纯策略 时,局中人时,局中人采用采用策略策略 超过采用策略超过采用策略 ;当称局中人;当称局中人的纯策略的纯策略 优优超于纯策超于纯策 时,局中人时,局中人采用纯策略采用纯策略 超过采用纯策略超过采用纯策略 。在求解矩阵对策时,如果出现上述优
17、超情况,可将矩。在求解矩阵对策时,如果出现上述优超情况,可将矩阵阵A的第的第 行删除;当行删除;当的纯策略的纯策略 优超于纯策优超于纯策 时,时,可以将矩阵可以将矩阵A第第 列删除。列删除。优超原则可以优超原则可以缩小了缩小了A A的规模的规模,使计算简化。一般情况下,优,使计算简化。一般情况下,优超原理只是一种超原理只是一种降阶技术降阶技术,但如精简之后,但如精简之后,A A中的剩余元素中的剩余元素仅有一个,则意味着已求得了对策的鞍点仅有一个,则意味着已求得了对策的鞍点。0i0k0j0k0i0k0k0j0k0j0k0k 例例9 9 求解矩阵对策,其中:求解矩阵对策,其中:5865101261
18、10A585106151061解解 查视各列,发现可划去第查视各列,发现可划去第1 1列,列,得得查视各行,发现可划去第查视各行,发现可划去第3 3行,得行,得查视各行列,知已无法继续优超,查视各行列,知已无法继续优超,故原矩阵故原矩阵A A被简化为被简化为22规模规模。二、二、2 22 2公式解法公式解法设矩阵对策中的设矩阵对策中的A A为为11122122aaAaa1*2*1*222*112*221*111xxvxaxavxaxa1*2*1*222*121*212*111yyvyayavyaya若无鞍点,则若无鞍点,则X*与与Y*中各分量必不为零中各分量必不为零 (否则,假定否则,假定 ,
19、则则 ,局中人,局中人选择纯策略选择纯策略1 1,局中人,局中人选择选择 中最小元素对应的策略,即对策存在有鞍点中最小元素对应的策略,即对策存在有鞍点)。由定理由定理6 6的的(3)、(4),得,得*10 x*21x2122,aa二、二、2 22 2公式解法公式解法*2221111221221*11122111221221*2212111221221*112121112212211122122111221221 ,1 ,1 Gaaxaaaaaaxxaaaaaayaaaaaayyaaaaa aaavvaaaa求解后,得:求解后,得:(11)1342A用用2 22 2求解例求解例5 5 已知矩阵对
20、策已知矩阵对策G,其中:其中:解解 G是不存在鞍点是不存在鞍点*1*2*1*22421,12344213112342231,1234414312344212105.123442Gxxyyv 用用2 22 2求解例求解例9 9*12231571111552222222222Gxxyyv,;,;5002.5A 求解例求解例7 7 已知矩阵对策已知矩阵对策G,其中:其中:解解 利用优超原理得利用优超原理得*1*21*1*212.50152.50032132.50152.500321352.512.55.52.5007.53Gxxxyyyv555002.507.5A用公式计算用公式计算得:得:矩阵对策
21、的解矩阵对策的解 :X*=(0,1/3,2/3,0)T,Y*=(1/3,2/3)T vG=53三、三、2 2n n和和m m2 2图解法图解法 当对策双方中的当对策双方中的某一方策略个数为某一方策略个数为2 2,而另一方策略个,而另一方策略个数大于数大于2 2时,可以采用图解法来方便地求解这类对策问题。时,可以采用图解法来方便地求解这类对策问题。下面通过例子来介绍这种直观的几何方法。下面通过例子来介绍这种直观的几何方法。1713902A用一个例子来看解法用一个例子来看解法例例10 10 求解矩阵对策,其中求解矩阵对策,其中:解解 显然,显然,G G无鞍点且无优超关系。无鞍点且无优超关系。设局中
22、人设局中人的混合策略为的混合策略为X=(x1,x2)T=(x,1x)T,则按则按“理智行为理智行为”,期望的赢得为期望的赢得为1.1.考虑考虑2n 阶矩阵阶矩阵1112121222nnaaaAaaa*21101max min,max min(,)jxYSXSvEX YE Xj1T121222(,)(,1-)(1)()jjjjjjjaE X jxxa xaxaaxaa1010101max min9 1,7,132 1max min89,7,152max ()xxxvxxxxxxxxfx在在Oxv平面直角坐标系中,平面直角坐标系中,x0,1 画直线段(图画直线段(图10-110-1):):L1:v
23、=-8x+9L2:v=7xL3:v=15x-2图图10-110-1xvO2468101Cx*DEFL1L2L3于是,v=f(x)的图形就是折线CDEF。因为E点是折线的最高点,所以v=f(x*)。注意到E点是L1与L2的交点,求解xvxv798得x*=35,vG=215,的最优混合策略为X*=(3/5,2/5)T。图图10-110-1xvO2468101Cx*DEFL1L2L3设局中人的最优混合策略为Y*=(y1*,y2*,y3*)T,则由定理6知*123*1321(1,)713521(2,)925EYyyyEYyy图图10-110-1xvO2468101Cx*DEFL1L2L3*123*13
24、21(1,)713521(2,)925EYyyyEYyy根据定理根据定理6 6 得得y3*=0=0。也可根据。也可根据E点只与点只与L L1 1、L L2 2有关且此处有关且此处L L3 3高高于于E E点,即只与点,即只与1 1,2 2有关且有关且3 3不必考虑不必考虑,所以所以,y3*=0=0,代入上式,可解得代入上式,可解得 y1*=715,y2*=815。于是,于是,的最优混合策略为的最优混合策略为 Y*=(7/15,8/15,0)T。矩阵对策的解矩阵对策的解 X*=(3/5,2/5)T,Y*=(7/15,8/15,0)T vG=215注意:注意:*21(,1)(,2)5321(,3)
25、152755E XE XE X例例11 11 求解矩阵对策,其中求解矩阵对策,其中:解解 显然,显然,G G无鞍点使用优超原理,无鞍点使用优超原理,1 1优超优超4 4,删去第删去第4 4行,将行,将A A简化为简化为设局中人设局中人的混合策略为的混合策略为Y=(y1,y2)T=(y,1y)T,则按则按“理智行为理智行为”,期望的赢得为期望的赢得为2.2.考虑考虑m2阶矩阵阶矩阵111221221mmaaaaAaa15442305A154423A*212011220101min max,min max(,)min max()min()yiYSXSiiiyyivEX YE i Yaayag y在
展开阅读全文