博弈模型数模课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈模型数模课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 模型 数模 课件
- 资源描述:
-
1、数学建模之数学建模之 博弈模型博弈模型重庆邮电大学重庆邮电大学 杨春德杨春德 教授教授2019-1 宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象,这些现象很很早就引起各类学者的重视。数学被认为是科学的语言,能否用数学语言描述各种带有矛盾因素的模型或现象?o博弈论便是这样一种处理各类带有矛盾因素的博弈论便是这样一种处理各类带有矛盾因素的模型的数学工具模型的数学工具。博弈论现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用博弈论现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、进化等问题及相关模型之中。博于讨论各类带有冲突、矛盾、合作、竞争
2、、进化等问题及相关模型之中。博弈论已成为人们分析复杂系统与作重大决策时的有力工具。弈论已成为人们分析复杂系统与作重大决策时的有力工具。2019-2一、博弈论基本概念一、博弈论基本概念世事纷争一棋局世事纷争一棋局o许多冲突模型在游戏中就存在,博弈论早期就是许多冲突模型在游戏中就存在,博弈论早期就是由研究国际象棋开始的,所以被命名为由研究国际象棋开始的,所以被命名为Game Theory。人们很快认识到此种理论可用于经济、。人们很快认识到此种理论可用于经济、政治、军事等领域。政治、军事等领域。o1944年冯年冯诺曼和奥诺曼和奥摩根斯特恩合著的摩根斯特恩合著的竞赛论与经济行为竞赛论与经济行为问世,总
3、问世,总结了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的结了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的矛盾冲突等活动中,局中人(矛盾冲突等活动中,局中人(Player)采取何种合理的策略()采取何种合理的策略(strategy)而能处于而能处于“优越优越”的地位,以便取得较好效益,所以将它译为博弈论。的地位,以便取得较好效益,所以将它译为博弈论。博弈论(博弈论(Game theory)可以被定义为是对)可以被定义为是对智能的智能的理性理性决策者之间冲决策者之间冲突与合作的数学模型的研究。突与合作的数学模型的研究。2019-3 常见的游戏如棋类,两人对奕,此两人
4、便称为常见的游戏如棋类,两人对奕,此两人便称为局中人,他们各有一套棋路,或善于用马,或长局中人,他们各有一套棋路,或善于用马,或长于用炮。在每次轮到一方走子时,他可能有许多于用炮。在每次轮到一方走子时,他可能有许多走法,这些走法依赖于当时棋局形势以及棋手想走法,这些走法依赖于当时棋局形势以及棋手想要达到的目的,以及他惯用的走法,从而形成他要达到的目的,以及他惯用的走法,从而形成他走棋的指导思想。对奕时指导棋手行动的思想便走棋的指导思想。对奕时指导棋手行动的思想便称为策略。对局终了可能有三种结局:甲胜;乙称为策略。对局终了可能有三种结局:甲胜;乙胜;和局。如果用数量表示各种结局,例如胜家胜;和局
5、。如果用数量表示各种结局,例如胜家赢得彩金若干(设所得彩金由输家付给,则输家赢得彩金若干(设所得彩金由输家付给,则输家当然失去若干),和局时都不能取得彩金,此种当然失去若干),和局时都不能取得彩金,此种表示结局的数称为支付(表示结局的数称为支付(payoff)。局中人、策略)。局中人、策略、支付是博弈论中常见的基本概念、支付是博弈论中常见的基本概念,下面我们将逐下面我们将逐一介绍。一介绍。2019-4(1)参与者)参与者o参与者指的是一个博弈中的决策主体,通常又称为参与人或局参与者指的是一个博弈中的决策主体,通常又称为参与人或局中人。中人。博弈参与者集合一般表示为博弈参与者集合一般表示为 1,
6、2,n o参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的收益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,收益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,甚至是国家组成的集团(如欧盟、甚至是国家组成的集团(如欧盟、OPEC等)。对参与者而言,在博弈过程等)。对参与者而言,在博弈过程中,他必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算中,他必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算出各参与者不同的行动组合产生的效益(或效用)。出各参与者不同的行动
7、组合产生的效益(或效用)。2019-5(2)战略)战略o战略战略是参与者如何对其他参与者的行动作出反应的行动规则,它规是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候该选择什么行动。或者说。战略是参与者定参与者在什么时候该选择什么行动。或者说。战略是参与者“相相机行动方案机行动方案”。2019-6(3)收益函数)收益函数o在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效效用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必须能用数
8、值刻画其大小。收益是博弈参与者真正关心的问题用必须能用数值刻画其大小。收益是博弈参与者真正关心的问题。注释:注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选定一个战略形成的战略组合的函数。选定一个战略形成的战略组合的函数。o在博弈论中,通常用在博弈论中,通常用ui表示参与者表示参与者i的收益,一个战略组合是,每个参与的收益,一个战略组合是,每个参与者者的收益可以表示为的收益可以表示为 12(,
9、),1,2,iinuu s ss in 2019-7 参与者、战略、收益函数是标准博弈的三要素。由前面我们对这三要素的分析,可以得到一个标准博弈的定义:o 标准博弈的定义:标准博弈的定义:2019-8(4)博弈的解)博弈的解纳什均衡纳什均衡o注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用2019-9信息o 信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括“自然”的选择,其他参与者的特征和行动等。信息对参与者是至关重要的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与者的行动和了解的有关情况作出自己的最佳选择。o 由于信
10、息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的类型,因此寻求博弈间的方法也不同。这里只就信息有关的两个基本的、重要的概念进行讨论。o 首先,关于“共同知识”的概念。一个博弈问题所涉及的“自然”的不同选择、参与者的行动以及相应产生的效用(效果、收益)都是一种知识(信息)。博弈论所谓的共同知识指的是“所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道”的知识。2019-10 为了说明共同知识的重要性,我引用一个众所周为了说明共同知识的重要性,我引用一个众所周知的寓言。故事发生在一个村庄,村里有知的寓言。故事发生在一个村庄,村里有100对已婚对已婚夫
11、妇,他们都是地道的逻辑学家,但也有一些多少有夫妇,他们都是地道的逻辑学家,但也有一些多少有点奇特的社会风俗。每天晚上,村里的男人们都将点点奇特的社会风俗。每天晚上,村里的男人们都将点起篝火,绕圈围坐举行一个会议,且每个人都谈论自起篝火,绕圈围坐举行一个会议,且每个人都谈论自己的妻子。在会议开始时,如果一个男人有理由认为己的妻子。在会议开始时,如果一个男人有理由认为他的妻子对他总是守贞的,那么他就对在坐的男人们他的妻子对他总是守贞的,那么他就对在坐的男人们赞扬她的美德。另一方面,如果在当前会议之前的任赞扬她的美德。另一方面,如果在当前会议之前的任何时间,只要他发现了他妻子不贞的证据,那他就会何时
12、间,只要他发现了他妻子不贞的证据,那他就会悲鸣恸哭,并祈求神灵严厉地惩罚她。再则,如果一悲鸣恸哭,并祈求神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她和她的情人将会立即通知村里个妻子曾有不贞,那她和她的情人将会立即通知村里除她丈夫外所有的男人。所有这些传统都是村民们的除她丈夫外所有的男人。所有这些传统都是村民们的共同知识。共同知识。2019-11 事实上,每个妻子都已对自己的丈夫不忠。于事实上,每个妻子都已对自己的丈夫不忠。于是,每个丈夫都知道除自己的妻子外都是不贞的是,每个丈夫都知道除自己的妻子外都是不贞的女人,而对自己的妻子每晚都要赞扬。女人,而对自己的妻子每晚都要赞扬。这种状况持续了
13、很多年,直到一个传教徒走访这种状况持续了很多年,直到一个传教徒走访到这个村庄。他坐在髯火旁参加了一次会议并听到到这个村庄。他坐在髯火旁参加了一次会议并听到每个男人都赞扬自己的妻子之后,他站到丈夫们围每个男人都赞扬自己的妻子之后,他站到丈夫们围坐的圆中心,大声地说:坐的圆中心,大声地说:“这个村里有一个妻子已这个村里有一个妻子已经不贞了。经不贞了。”在此后的在此后的99个晚上丈夫们继续开会并个晚上丈夫们继续开会并赞扬他们的妻子,但在第赞扬他们的妻子,但在第100个晚上,他们全都悲个晚上,他们全都悲鸣偷哭并祈求严厉地惩罚他们的妻子。鸣偷哭并祈求严厉地惩罚他们的妻子。2019-12o 现在,让我们试
14、问一下,这个传教徒告诉了这些丈夫们他们所不知现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知道的什么?每个丈夫都已经知道了道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人个不贞的妻子,故这对任何人来说都不是新闻。但来说都不是新闻。但“这个传教徒对所有男人做了一个声明这个传教徒对所有男人做了一个声明”是共是共同知识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也同知识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了所有男人中间的共同知识。在传教徒宣告之前,每个形如就成了所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈夫知道)有一个不贞的妻子(每个丈
15、夫知道)有一个不贞的妻子”的判断对于的判断对于99都是正确的,都是正确的,但对但对100就不正确了。就不正确了。2019-13 其次,关于其次,关于“完全信息完全信息”的概念。完全的概念。完全信息是博弈论非常重要的基本概念,有了上信息是博弈论非常重要的基本概念,有了上述的共同知识概念,这里就可以给出完全信述的共同知识概念,这里就可以给出完全信息的严格定义。完全信息指的是所有参与者息的严格定义。完全信息指的是所有参与者各自选择的行动的不同组合所决定的各参与各自选择的行动的不同组合所决定的各参与者的收益对所有参与者来说是共同知识。简者的收益对所有参与者来说是共同知识。简单通俗地说,完全信息是指每一
16、个参与者对单通俗地说,完全信息是指每一个参与者对自己以及其他参与者的行动,以及各参与者自己以及其他参与者的行动,以及各参与者选择的行动组合产生的收益等知识有完全的选择的行动组合产生的收益等知识有完全的了解。了解。2019-14二、囚徒困境博弈模型分二、囚徒困境博弈模型分析析 两个共同作案的犯罪嫌疑人被捕,并受到指控。两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一个人招认犯罪,否则警方无充分证据将他除非至少一个人招认犯罪,否则警方无充分证据将他们按罪判刑。警方把他们关入不同的牢室,并对他们们按罪判刑。警方把他们关入不同的牢室,并对他们说明不同行动带来的后果。如果两人都采取沉默的抗说明不同行
17、动带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱入狱1个月;如果双方都坦白,根据案情两人将被判个月;如果双方都坦白,根据案情两人将被判入狱入狱6个月;如果一个招供而另一个拒不坦白,招认个月;如果一个招供而另一个拒不坦白,招认者因有主动认罪立功表现将立即释放,而另一人将被者因有主动认罪立功表现将立即释放,而另一人将被判入狱判入狱9个月(所犯罪行判个月(所犯罪行判6个月,干扰司法加判个月,干扰司法加判3个个月)。月)。1、问题的提出、问题的提出这两个犯罪这两个犯罪嫌疑人是坦嫌疑人是坦白还是拒不白还是拒不坦白呢?坦白
18、呢?2019-153、问题分、问题分析析o囚徒困境问题可以用图囚徒困境问题可以用图11所示的双变量矩阵的形式来描述。所示的双变量矩阵的形式来描述。注释:注释:在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默)。图默)。图1-1的矩阵中每一个单元的两个数字表示一组特定的战略组合下两个囚的矩阵中每一个单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术语了),其中第犯的收益(或支付、效用,这里已经开始引用经济学的术语了),其中第1个数个数字是囚徒字是囚徒1(习惯上是位
19、于矩阵横行上的参与者)的收益,第(习惯上是位于矩阵横行上的参与者)的收益,第2个数字是囚徒个数字是囚徒2(位于竖行上的参与者)的收益。如果囚徒(位于竖行上的参与者)的收益。如果囚徒1选择沉默,而囚徒选择沉默,而囚徒2选择坦白,那选择坦白,那么囚徒么囚徒1的收益是的收益是9(表示判刑(表示判刑9个月),囚徒个月),囚徒2的收益为的收益为0(表示马上释放)(表示马上释放)。2、假设:、假设:两囚徒都是理性的和两囚徒都是理性的和智能的。智能的。2019-164、模型建模型建立立o 参与者集合:参与者集合:=囚徒囚徒1,囚徒,囚徒2o 战略空间:战略空间:S1=S2=坦白,沉默坦白,沉默u1(坦白坦白
20、,坦白坦白)=u2(坦白坦白,坦白坦白)-6,u1(沉默沉默,坦白坦白)u2(沉默沉默,坦白坦白)=-9u1(坦白坦白,沉默沉默)u2(坦白坦白,沉默沉默)=0,u1(沉默沉默,沉默沉默)u2(沉默沉默,沉默沉默)=-1o 收益函数收益函数2019-175、模型求、模型求解解2019-186、结果分析、结果分析战略组合(沉默,沉默),即如果两个人都不坦白,战略组合(沉默,沉默),即如果两个人都不坦白,各人只判刑一个月,不是比战略组合(坦白,坦白)各人只判刑一个月,不是比战略组合(坦白,坦白)带来的各判刑带来的各判刑6个月要好吗?个月要好吗?注释:这正是囚徒困境的注释:这正是囚徒困境的“困境困境
21、”两个字的体现,两个字的体现,如果用经济学中的如果用经济学中的“有效有效”的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚徒问题的博弈解。这体现了个人利益和全体利益的矛盾。徒问题的博弈解。这体现了个人利益和全体利益的矛盾。2019-197、模型的推广与应用、模型的推广与应用o 与囚徒困境类似的博弈问题在经济、社会等领域有许许多多的版本。与囚徒困境类似的博弈问题在经济、社会等领域有许许多多的版本。应用应用1:A,B两个公司以高低两种价格向市场竞相销售同一种产品。两个公司以高低两种价格向市场竞相销售同一种产品。注释:注
22、释:双方协定以高价格垄断市场,可以使彼此获得满意的利润收益,至少要好于双方都以低双方协定以高价格垄断市场,可以使彼此获得满意的利润收益,至少要好于双方都以低价格出售产品的情形。但如果某一方坚持高价,而另一方为了独占市场却将产品以低价价格出售产品的情形。但如果某一方坚持高价,而另一方为了独占市场却将产品以低价格推销,因为协定不被遵守时是不会受处罚,那么后者将获高盈利而前者将损失惨重。格推销,因为协定不被遵守时是不会受处罚,那么后者将获高盈利而前者将损失惨重。市场上商品的价格战,常常出现的结局一般是以低价格销售商品,消费者从中得到好处市场上商品的价格战,常常出现的结局一般是以低价格销售商品,消费者
23、从中得到好处,如现在的通信三大运营商:移动、电信和联通,这种结果正是博弈论预测的合理结局,如现在的通信三大运营商:移动、电信和联通,这种结果正是博弈论预测的合理结局,你们不妨自己设计一个类似于图,你们不妨自己设计一个类似于图1-1的的A,B公司的收益矩阵。公司的收益矩阵。应用应用2:军备竞赛问题军备竞赛问题注释:美苏冷战期间,两个超级大国构成博弈的两方,可供美苏冷战期间,两个超级大国构成博弈的两方,可供选择的战略是:扩军(增加军费运算)、裁军(减少军费运选择的战略是:扩军(增加军费运算)、裁军(减少军费运算)。如果双方都热衷于扩军,两国都要为此付出高额军费算)。如果双方都热衷于扩军,两国都要为
24、此付出高额军费(从社会福利角度来看这是一笔庞大的付收益)(从社会福利角度来看这是一笔庞大的付收益);如果双方如果双方都选择裁军,则可省下这笔钱;如果一方面裁军而另一方面都选择裁军,则可省下这笔钱;如果一方面裁军而另一方面进行扩军,扩军的一方到时候就会以武力相威胁甚至发动战进行扩军,扩军的一方到时候就会以武力相威胁甚至发动战争,这是,战争胜败双方的收益与支付将出现难以估量的差争,这是,战争胜败双方的收益与支付将出现难以估量的差异。博弈论给出军备竞赛问题的是战略组合异。博弈论给出军备竞赛问题的是战略组合(扩军,扩军扩军,扩军),博弈理论预测双方都扩军可以达到对抗中的相对稳定,这是博弈理论预测双方都
25、扩军可以达到对抗中的相对稳定,这是一个符合现实的合理结局。一个符合现实的合理结局。2019-20三、海滩占位博弈模型分三、海滩占位博弈模型分析析 甲乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格、相同的甲乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格、相同的质量向均匀分布在海滩上的众多游客(他们来此享受海水和阳光,进行日光质量向均匀分布在海滩上的众多游客(他们来此享受海水和阳光,进行日光浴或游泳活动)销售冷饮。既然是做生意,目的总是希望尽可能多赚点钱,浴或游泳活动)销售冷饮。既然是做生意,目的总是希望尽可能多赚点钱,甲乙两人又是在同一地点做同样的生意,竞争就是不可避免的事情了。
展开阅读全文