博弈中纯策略纳什均衡点课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈中纯策略纳什均衡点课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 策略 均衡 课件
- 资源描述:
-
1、博弈论及其应用博弈论及其应用第2章 纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)2 主要内容:主要内容:2.1 2.1 基本概念基本概念 2.2 2.2 纳什均衡纳什均衡 2.3 2.3 混合策略纳什均衡混合策略纳什均衡 2.4 2.4 矩阵博弈矩阵博弈第2章 纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32.1 基本概念 2.1.1 2.1.1 基本概念基本概念 2.1.2 2.1.2 占优均衡占优均衡 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)42.1.1 基本概念 例例2.1.1 2.1.1 智猪博弈智猪博弈 例例2.1.2 2.1.2 夫妻爱好问题夫妻爱好
2、问题 例例2.1.3 2.1.3 猜钱币游戏猜钱币游戏 完全信息静态博弈的三个基本要素完全信息静态博弈的三个基本要素 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)5智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪圈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有一个食槽,另一边安装一个控制按钮的一边有一个食槽,另一边安装一个控制按钮,它能控制食料的供应。按一下按钮有,它能控制食料的供应。按一下按钮有8 8个单个单位的食料进入猪食槽,但需要支付位的食料进入猪食槽,但需要支付2 2个单位的个单位的劳动成本。在吃食的过程中,若大猪先到,大劳动成本。在吃食的过程中,若大猪先到,大猪能吃猪能吃7 7
3、个单位的食料,小猪只能吃个单位的食料,小猪只能吃1 1个单位个单位。若小猪先到,小猪能吃到。若小猪先到,小猪能吃到4 4个单位的食料,个单位的食料,大猪只能吃大猪只能吃4 4个单位。若两只猪同时到,大猪个单位。若两只猪同时到,大猪吃吃5 5个单位,小猪吃个单位,小猪吃3 3个单位的食料。大猪和个单位的食料。大猪和小猪都有两个策略,按或等待。小猪都有两个策略,按或等待。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)6智猪博弈(续)两只猪在不同策略下的支付矩阵:两只猪在不同策略下的支付矩阵:大猪和小猪分别采取什么样的策略,且各自的收益分别为多少大猪和小猪分别采取什么样的策略,且各自的收益分别为多
4、少?博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)7夫妻爱好问题 OROR博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)8猜钱币游戏博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)9完全信息静态博弈三要素 局中人集合局中人集合 局中人集合即博弈参加人的集合。若给定局中人局中人集合即博弈参加人的集合。若给定局中人 ,则记,则记 策略集策略集 每个局中人每个局中人 有一个策略集有一个策略集S Si i ,策略集,策略集S Si i ,可以是有限集,也可以是有限集,也可以是无限集,当策略集是有限集时,我们记:可以是无限集,当策略集是有限集时,我们记:当每个局中人当每个局中人 选定一个策略选定一个
5、策略s si i 后,形成一个策略组合后,形成一个策略组合 ,并称为一,并称为一个局势,记为:个局势,记为:我们也引入如下记号:我们也引入如下记号:显然,显然,也是一个局势,且也是一个局势,且 。支付函数支付函数 每个局中人有一个支付函数。是局势每个局中人有一个支付函数。是局势 s 的函数,是局中人在局势下所的函数,是局中人在局势下所能得到的收益。当然,每个局中人都希望自己的尽可能大。能得到的收益。当然,每个局中人都希望自己的尽可能大。,2,1nNi iNi iS()i iN()()()12,iiiiiimSssss1,2,inis12(,)nss ss,1,2,iisS in111|(,)i
6、iiinstsst ssiiSt|ist|isss完全信息静态博弈三要素 完全信息静态博弈就是在上述三要素的基础上,分完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。析各局中人为实现自身利益最大化的策略行为分析。简记为简记为:,iiPSNG 博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)10博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)112.1.2 占优均衡 定义定义2.1.1 2.1.1 严格占优策略严格占优策略 定义定义2.1.2 2.1.2 占优均衡占优均衡 定义定义2.1.3 2.1.3 重复剔除占优均衡重复剔除占优均衡 博弈论及其应用
7、博弈论及其应用(汪贤裕)(汪贤裕)12定义2.1.1 严格占优策略 在博弈在博弈 中,若中,若 和和 是局中人是局中人 的两个的两个策略,对任意策略组合策略,对任意策略组合 都有:都有:(2.1.12.1.1)则称,局中人则称,局中人 的策略的策略 严格占优策略严格占优策略 ,或称策略,或称策略 相相对于对于 是是严格劣策略严格劣策略。囚徒困境囚徒困境中、中、犯罪嫌疑人犯罪嫌疑人A A和和B B策略(承认)就是一个严策略(承认)就是一个严格占优策略。格占优策略。,iiPSNG)(iks)(ihsis)|()|()()(ihiikissPssPi)(iks)(ihs()ihs()iks博弈论及其
8、应用博弈论及其应用(汪贤裕)(汪贤裕)13定义2.1.2 占优均衡 在博弈在博弈 中,若每一个局中人中,若每一个局中人 都存在一个策略都存在一个策略 ,使得,使得 占优于占优于 中任何策略,那么策略组合中任何策略,那么策略组合 称为称为 的占优策略均衡,简称的占优策略均衡,简称占优均衡占优均衡。对应的。对应的 称为称为占优均衡结果占优均衡结果。,iiPSNGi)(,NiSsiiisiisS),(21nssssG|)(NisPi博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)14定义2.1.2 占优均衡(续)囚徒困境囚徒困境中严格占优均衡:中严格占优均衡:(承认,承认)(承认,承认)均衡结果博弈
9、论及其应用博弈论及其应用(汪贤裕)(汪贤裕)15定义2.1.3 重复剔除占优均衡 在博弈在博弈 中,经过重复剔出严格劣策略中,经过重复剔出严格劣策略后,每个局中人后,每个局中人 只剩下一个唯一的策略:只剩下一个唯一的策略:那么,策略组合那么,策略组合 称为博弈称为博弈 的的重复重复剔除占优均衡。剔除占优均衡。对应对应 称为称为 的的重复剔除占优均衡结果重复剔除占优均衡结果。,iiPSNG iiisS),2,1(ni12(,)nss ssG()|1,2,iP sinG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)16定义2.1.3 重复剔除占优均衡(续)智猪博弈智猪博弈中重复剔除占优均衡中重复
10、剔除占优均衡:(按,不按)(按,不按)均衡结果博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)172.2 纳什均衡 2.2.1 2.2.1 纯策略纳什均衡纯策略纳什均衡 2.2.2 2.2.2 双矩阵博弈的划线法双矩阵博弈的划线法 2.2.3 2.2.3 无限策略的纯策略纳什均衡无限策略的纯策略纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)182.2.1 纯策略纳什均衡 定义定义2.2.1 2.2.1 纯策略纳什均衡点和均衡结果纯策略纳什均衡点和均衡结果 定理定理2.2.1 2.2.1 重复剔除占优均衡与纯策略纳什均衡重复剔除占优均衡与纯策略纳什均衡 纳什均衡点与多目标规划求解比较博
11、弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)19纯策略纳什均衡点和结果 定义定义2.2.12.2.1 在在 人非合作博弈人非合作博弈 中,若有策略组合中,若有策略组合 ,使得每一个,使得每一个 ,对任意,对任意 都有都有 (2.2.12.2.1)则称则称 是是 的一个的一个纯策略纳什均衡点纯策略纳什均衡点,对应的,对应的 称为对应的称为对应的均衡结果。均衡结果。n),(21nssssiiSs 1,2,inNiiiSt)()()|()(sPtsPiiini,2,1),(21nssssG,2,1|)(nisPi,iiGNSP1,2,Nn博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)20纯策略纳
12、什均衡点和结果 夫妻爱好夫妻爱好博弈中纯策略纳什均衡点:博弈中纯策略纳什均衡点:(足球,看足球)(足球,看足球)&(看芭蕾,看芭蕾)(看芭蕾,看芭蕾)均衡结果均衡结果博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)21纯策略纳什均衡点和结果(续)猜钱币游戏猜钱币游戏中不存在纯策略纳什均衡点中不存在纯策略纳什均衡点。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)22定理2.2.1 在在 人非合作博弈人非合作博弈 中:中:若,若,是是重复剔除占优均衡重复剔除占优均衡,则则 一定是一定是纯策略纳什均衡点纯策略纳什均衡点。n,iiPSNG),(21nssss),(21nssss博弈论及其应用博弈论及
13、其应用(汪贤裕)(汪贤裕)23定理2.2.1的证明证明:证明:用用反证法反证法。若若 是重复剔除占优均衡,但不是纯策略纳什均衡点。则有是重复剔除占优均衡,但不是纯策略纳什均衡点。则有 和和 ,使得使得 (2.2.22.2.2)那么在局中人那么在局中人 在对在对 的剔除过程中应有对任意的策略组合的剔除过程中应有对任意的策略组合 满足满足(2.2.12.2.1)式。这里策略组合当然也包括)式。这里策略组合当然也包括 ,即,即 因此(因此(2.2.22.2.2)式是不可能出现的,即()式是不可能出现的,即(2.2.22.2.2)式与剔除严格劣策略过程)式与剔除严格劣策略过程矛盾。矛盾。从而定理从而定
14、理2.2.12.2.1成立。成立。12,nss ssNi()iitsiiSt)()|()|()(iiiitsPssPi)(itss()(|)(|)iiiiP ssP st博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)24纳什均衡点与多目标规划求解比较 在在n n人非合作博弈人非合作博弈 中,对每一个局中人中,对每一个局中人 ,都在寻找自己的策略都在寻找自己的策略 使得自己的收益使得自己的收益 最大最大,但是局中人,但是局中人 单方面不能找到自己的最佳策略,其结果是相互单方面不能找到自己的最佳策略,其结果是相互影响的,是由策略组合影响的,是由策略组合 决定的。这就是一个有决定的。这就是一个有相
15、互影响的多人决策问题。有人可能这样设想:是否有一个局外相互影响的多人决策问题。有人可能这样设想:是否有一个局外人,将人,将 个局中人的收益最大作为个局中人的收益最大作为 个目标的个目标的多目标规划问题多目标规划问题,即求:即求:(2.2.32.2.3)纳什均衡点和上面的(纳什均衡点和上面的(2.2.32.2.3)的多目标规划的求解是两个不同)的多目标规划的求解是两个不同的概念。的概念。12(,)nss ss,iiGNSPiNiisS12(,)inP s ssinn121max(),(),().nniP s P sP sstisS博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)25纳什均衡点与多
16、目标规划求解比较(续)囚犯困境是一个囚犯困境是一个2 2人非合作博弈人非合作博弈 两个局中人策略集两个局中人策略集 和支付和支付 函数函数 都表示在表都表示在表1.2.11.2.1中中 图图2.2.1 2.2.1 囚犯困境中的局中人囚犯困境中的局中人 收益图收益图12,S S12,P P以囚徒困境为例以囚徒困境为例博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)26纳什均衡点与多目标规划求解比较(续)各点代表不同策略组合下双方的收益:各点代表不同策略组合下双方的收益:A A点对应策略组合(承认,承认)点对应策略组合(承认,承认)B B点对应策略组合(承认,不承认)点对应策略组合(承认,不承认)
17、C C点对应策略组合(不承认,不承认)点对应策略组合(不承认,不承认)DD点对应策略组合(不承认,承认)点对应策略组合(不承认,承认)B B点、点、C C点和点和D D点所代表的策略组合点所代表的策略组合 都是单人决策的多目标规划(都是单人决策的多目标规划(2.2.32.2.3)中的非劣解。中的非劣解。但策略组合(承认,承认)是唯一的纳什均衡点。但策略组合(承认,承认)是唯一的纳什均衡点。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)27纳什均衡点与多目标规划求解比较(续)结论:结论:(一)非合作博弈中的纳什均衡点,不可能用(一)非合作博弈中的纳什均衡点,不可能用(2.2.32.2.3)表示
18、的多目标规划作为替代,双方有不)表示的多目标规划作为替代,双方有不同的思想基础。同的思想基础。(二)博弈论与多目标规划这类多人决策问题的(二)博弈论与多目标规划这类多人决策问题的差异,进一步显示出纳什均衡思想在博弈论中的差异,进一步显示出纳什均衡思想在博弈论中的重要地位。重要地位。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)282.2.2 双矩阵博弈的划线法 双矩阵博弈的定义双矩阵博弈的定义 纯策略纳什均衡的简单求解方法纯策略纳什均衡的简单求解方法划线法划线法 定理定理2.2.2 2.2.2 划线法与纯策略纳什均衡划线法与纯策略纳什均衡博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)29双
19、矩阵博弈的定义在博弈中,若三要素的前两个要素满足:在博弈中,若三要素的前两个要素满足:只有只有两个局中人两个局中人,即,即 ;策略集有限策略集有限,即,即 ,此类博弈我们称为此类博弈我们称为双矩阵博弈双矩阵博弈。2,1N,211mS,212nS双矩阵博弈称呼的由来(补充1)在双矩阵博弈中,对任意策略组合在双矩阵博弈中,对任意策略组合 ,记支付,记支付函数函数 ,将两个局中人的支,将两个局中人的支付函数分别记为矩阵付函数分别记为矩阵A A和矩阵和矩阵B B如下:如下:111212122212()nnij m nmmmnaaaaaaAaaaa),(jiijjiaP),(1ijjibP),(2111
20、212122212()nnijm nmmmnbbbbbbBBbbb博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)30博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)31双矩阵博弈称呼的由来(补充2)(2.2.4)回到:划线法 定理2.2.2111112121121212222221122(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)nnnnijij m nmmmmmnmna ba ba ba ba baba bababab划线法 (1)(1)对局中人对局中人1 1,在(,在(2.2.42.2.4)式)式 的每一行的每一行 中,找出对中,找出对方支付矩阵方支付矩阵B B中该行的最
21、大元素中该行的最大元素 ,即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。(2)(2)对局中人对局中人2 2,在(,在(2.2.42.2.4)式每一列)式每一列 中,找出对方支中,找出对方支付矩阵付矩阵A A中该列的最大元素中该列的最大元素 即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。iijb,2,1|maxnjbbijijijbijbi jaji jai jamax|1,2,iji jaaim博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32划线法(续)(3)(3)若存在一对若存在一对 ,使得其两个元素,使得其
22、两个元素 和和 下面都有划线,则下面都有划线,则 是纯策略纳什均衡是纯策略纳什均衡点,点,和和 是对应的纳什均衡结果。是对应的纳什均衡结果。(4)(4)若不存在满足(若不存在满足(3 3)的数对,则该博弈无纯策略)的数对,则该博弈无纯策略纳什均衡。纳什均衡。),(jijiajibjiajib),(ji博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)33博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)34定理2.2.2 在双矩阵博弈在双矩阵博弈 中划线法的使用:中划线法的使用:(1)(1)若若 和和 同时得到划线,则同时得到划线,则 一定是一定是 的纯策略纳什均衡点。的纯策略纳什均衡点。(2)(
23、2)若不存在能够同时得到划线的数对,则若不存在能够同时得到划线的数对,则 无纯无纯策略纳什均衡点。策略纳什均衡点。Gjiajib),(jiGG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)35定理2.2.2的证明 设设 和和 都得到划线,则下面两式同时成立:都得到划线,则下面两式同时成立:(2.2.52.2.5)(2.2.62.2.6)是博弈的是博弈的纯策略纳什均衡点纯策略纳什均衡点。若不存在同时得到划线的数对,即不存在若不存在同时得到划线的数对,即不存在 同时满同时满足(足(2.2.52.2.5)和()和(2.2.62.2.6)式,则博弈)式,则博弈 也就不存在纯策也就不存在纯策略纳什均衡
24、点。略纳什均衡点。jiajib),(),(111ikjkkjjijiSPaaP),(),(212jhhihijijiSPbbP),(ji),(jiG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)362.2.3无限策略的纯策略纳什均衡 定理定理2.2.3 2.2.3 无限纯策略纳什均衡点存在性定理无限纯策略纳什均衡点存在性定理 无限策略纳什均衡点的求解思路无限策略纳什均衡点的求解思路 例例2.2.2 2.2.2 古诺模型古诺模型 例例2.2.3 2.2.3 伯川德双寡头垄断模型伯川德双寡头垄断模型 例例2.2.4 2.2.4 公共地的悲剧公共地的悲剧 例例2.2.5 2.2.5 豪泰林价格竞争
25、模型豪泰林价格竞争模型博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)37定理2.2.3 在博弈在博弈 中,若局中人中,若局中人 的策的策略集略集 是有界闭区域,支付函数是有界闭区域,支付函数 对对任意任意 都是都是 的拟凹连续函数,则博弈的拟凹连续函数,则博弈 一定存在有纯策略纳什均衡点。一定存在有纯策略纳什均衡点。注:严格拟凹函数定义点击注:严格拟凹函数定义点击 ,iiPSNG iiS),(iiissPiisSisG博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)38严格拟凹函数定义 设设 是凸集是凸集 上的函数,对任意上的函数,对任意 及及任意任意 ,若有:,若有:(2.2.82.2.8
展开阅读全文