博弈论经典PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈论经典PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 经典 PPT 课件
- 资源描述:
-
1、博弈论博弈论1参考书目:参考书目:博弈论基础博弈论基础,罗伯特,罗伯特吉本斯,高峰译吉本斯,高峰译 中国社会科学出版社,中国社会科学出版社,19991999年年3 3月月策略策略- -博弈论导论博弈论导论,乔尔,乔尔沃森,费方域,赖丹沃森,费方域,赖丹馨译,上海人民出版社,馨译,上海人民出版社,20102010年年1111月月经济博弈论(第二版)经济博弈论(第二版),谢枳予,谢枳予 复旦大学出版社,复旦大学出版社,20022002年年1 1月月2主要内容主要内容第一章第一章 完全信息静态博弈完全信息静态博弈第二章第二章 完全信息的动态博弈完全信息的动态博弈第三章第三章 非完全信息静态博弈非完全
2、信息静态博弈第四章第四章 非完全信息动态博弈非完全信息动态博弈3在所有社会,人们经常互动。在所有社会,人们经常互动。互动有时是合作,有时是竞争。互动有时是合作,有时是竞争。在这两种情况下,都可以用一个术语,即在这两种情况下,都可以用一个术语,即相互依相互依赖性赖性来表示一个人的行为对另外一个人的福利造来表示一个人的行为对另外一个人的福利造成的影响。成的影响。相互依赖的情形可称为相互依赖的情形可称为策略环境策略环境。因为人们为了。因为人们为了确定所采取的最优行动,必须考虑他周围的其他确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。人会怎样选择行动。博弈就是策略对抗博弈就是策略对抗博弈
3、的定义博弈的定义4定义:定义:博弈就是一些个人、队组或其他组织,面对一定博弈就是一些个人、队组或其他组织,面对一定的环境条件,的环境条件, 在一定的规则下,同时或先后,一次或在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。实施,各自取得相应结果的过程。四个核心方面四个核心方面 博弈的参加人博弈的参加人(Player)博弈方博弈方 各博弈方的策略各博弈方的策略(Strategies)或行为或行为(Actions) 博弈的次序博弈的次序(Order) 博弈方的得益博弈方的得益(Payof
4、fs)5目前,博弈论被许多来自不同领域的专业人士使用,这些目前,博弈论被许多来自不同领域的专业人士使用,这些领域包括经济学、政治学、法律、生物、国际关系哲学以领域包括经济学、政治学、法律、生物、国际关系哲学以及数学。及数学。事实上,事实上,大多数情形即包含了冲突元素,也包含了合作的大多数情形即包含了冲突元素,也包含了合作的元素元素。我们对博弈的组成要有一个广义的理解。我们对博弈的组成要有一个广义的理解。简而言之,博弈是策略环境的正式描述。因此,博弈论是简而言之,博弈是策略环境的正式描述。因此,博弈论是研究相互依赖情形的正式的方法论。这里,研究相互依赖情形的正式的方法论。这里,“正式正式”是指是
5、指一种以数学化的精确,以及逻辑上的一致见长的结构。一种以数学化的精确,以及逻辑上的一致见长的结构。利用正确的理论工具,我们可以研究各种情况下的行为,利用正确的理论工具,我们可以研究各种情况下的行为,从而更好地理解经济中的相互作用。从而更好地理解经济中的相互作用。6静态博弈:静态博弈:所有博弈方同时或可看作同时选择策略所有博弈方同时或可看作同时选择策略的博弈的博弈 石头剪刀布、猜硬币、古诺模型石头剪刀布、猜硬币、古诺模型动态博弈:动态博弈:各博弈方的选择和行动有先后次序且后各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可选择、后行动的博弈方在自己选择、行动之前可以看到
6、其他博弈方的选择和行动以看到其他博弈方的选择和行动 弈棋、市场进入、斯坦博格型市场结构弈棋、市场进入、斯坦博格型市场结构7 完全信息博弈:完全信息博弈:各博弈方都完全了解所有博弈方各各博弈方都完全了解所有博弈方各种情况下的得益种情况下的得益 不完全信息博弈:不完全信息博弈:至少部分博弈方不完全了解其他至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为博弈方得益的情况的博弈,也称为“不对称信息博不对称信息博弈弈” 完美信息博弈:完美信息博弈:每个轮到行动的博弈方对博弈的进每个轮到行动的博弈方对博弈的进程完全了解的博弈程完全了解的博弈 不完美信息博弈:不完美信息博弈:至少某些博弈方在轮到行
7、动时不至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈完全了解此前全部博弈的进程的博弈8 约翰约翰福布斯福布斯纳什纳什(John Forbes Nash Jr., 1950, (John Forbes Nash Jr., 1950, 1951)1951)利用不动点定理证明了均衡点的存在,为博弈利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。论的一般化奠定了坚实的基础。19941994年年约翰约翰福布福布斯斯纳什纳什、约翰约翰C C海萨尼海萨尼以及以及莱因哈德莱因哈德泽尔腾泽尔腾,三人,三人同时因为他们对博弈论的研究,所作出的突出贡献,同时因为他们对博弈论的研究,
8、所作出的突出贡献,而获得诺贝尔经济学奖。而获得诺贝尔经济学奖。 John HarsanyJohn NashLeihaden Selten9三位大师主要的贡献三位大师主要的贡献 19501950年和年和19511951年纳什的两篇关于非合作博弈论的重要论年纳什的两篇关于非合作博弈论的重要论文,证明了非合作博弈及其均衡解,并证明了文,证明了非合作博弈及其均衡解,并证明了均衡解的均衡解的存在性存在性,即著名的纳什均衡。从而揭示了博弈均衡与经,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。济均衡的内在联系。 泽尔腾(泽尔腾(19651965)将纳什均衡概念引入了动态分析,提出)将纳什均衡概
9、念引入了动态分析,提出了了“精炼纳什均衡精炼纳什均衡”概念。概念。 海萨尼发展了刻画不完全信息静态博弈的海萨尼发展了刻画不完全信息静态博弈的“贝叶斯纳什贝叶斯纳什均衡均衡”(1967196719681968)。)。 泽尔腾和海萨尼进一步将纳什均衡动态化,加入了接近泽尔腾和海萨尼进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型弈论,提供了基本思路和模型 。10第一章第一章 完全信息静态博弈完全信息静态博弈 1.1 基本理论基本理论: 博弈的标准式和纳什均衡博弈的标准式和纳什均衡 1.2 应
10、用举例应用举例 1.3 混合策略和均衡的存在混合策略和均衡的存在111.1 基本理论基本理论: 博弈的标准式和纳什均衡博弈的标准式和纳什均衡 例例1 儿童游戏:儿童游戏:“石头、剪刀、布石头、剪刀、布”。 参与人参与人:1,2。 策略空间策略空间:S1 = S2 = 石头、剪刀、布石头、剪刀、布 收益收益:两人出手的函数:两人出手的函数 u1 (石头,石头石头,石头) = 0, u1 (石头,剪刀石头,剪刀) = 1, u1 (石石头,布头,布) = -1 u2 (石头,石头石头,石头) = 0, u2 (石头,剪刀石头,剪刀) = -1,u2 (石石头,布头,布) = 112博弈的标准式表示
11、博弈的标准式表示 (normal-form representation) (1) 参与人参与人 ( player). n 个参与人:个参与人:1, 2, , i, , n (2) 策略策略 (strategy). 一个参与人的策略是他采取的一个行动。一个参与人的策略是他采取的一个行动。 参与人参与人 i 的策略:的策略:si 参与人参与人 i 的策略空间的策略空间: Si 策略的一个组合策略的一个组合: s =s1,s2, , sn 简化表示:简化表示:s- i= s1,, s i -1, s i+1, , sn (3) 收益收益 (payoff). 参与人参与人 i 的收益:的收益:ui=
12、 ui(s1,s2, , sn) n 个参与人博弈的标准形式表示个参与人博弈的标准形式表示: G = S1, S2, , Sn;u1, u2, , un13博弈标准式特例:博弈标准式特例:u1(s11,s21), u2(s11,s21)u1(s11,s22), u2(s11,s22 )u1(s12,s21), u2(s12,s21)u1(s12,s22), u2(s12,s22 )u1(s13,s21), u2(s13,s21)u1(s13,s22), u2(s13,s22 )s11 s12 s13参与人参与人1参与人参与人2s21 s22S1=s11, s12, s13 S2=s21, s2
13、2 收益表收益表(Payoff):两个参与人,有限个战略的博弈两个参与人,有限个战略的博弈的表示方法的表示方法 14 0 , 0 1 , -1 -1 ,1 -1 , 1 0 , 0 1 ,-1 1 ,-1 -1 , 1 0 ,0石头石头剪刀剪刀布布 石头石头 剪刀剪刀 布布P1P215 囚徒囚徒1的考虑:无论对方选沉默还是招认,自己选的考虑:无论对方选沉默还是招认,自己选“招认招认”好于好于“沉默沉默”。 囚徒囚徒2的考虑:的考虑: 无论对方选什么,无论对方选什么,“招认招认”好于好于“沉默沉默”。 两人的选择两人的选择: (招认招认,招认招认)。-1 ,-1-9 ,00 ,-9-6 ,-6
14、囚徒囚徒 2沉默沉默 招认招认沉默沉默 招认招认例例 囚徒困境囚徒困境 (The Prisoners Dilemma) 囚徒囚徒1占优占优1617 每一个博弈都是一个你中有我,我中有你的情形,每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于不同的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取己采取的行动,也取决于其他博弈参与者所采取的行动。的行动。 博弈论的精髓在于基于系统思维基础上的理性换博弈论的精髓在于基于系统思维基础上的理性换位思考,位
15、思考,即在选择你的行动时,你应当用他人的即在选择你的行动时,你应当用他人的得益去推测他人的行动,从而选择最有利于自己得益去推测他人的行动,从而选择最有利于自己的行动。的行动。17鹰鸽博弈(斗鸡博弈)鹰鸽博弈(斗鸡博弈)参与人:鹰和鸽参与人:鹰和鸽策略:保持原方向和转向策略:保持原方向和转向偏好:如果他们都保持原方向,就会撞车。如偏好:如果他们都保持原方向,就会撞车。如果都转向,就都保住了面子。如果只有对方转果都转向,就都保住了面子。如果只有对方转向,就会被称为硬汉。向,就会被称为硬汉。保持保持 转向转向 保持保持 0,0 3,1转向转向 1,32,2鸽鸽鹰鹰18公共财产的悲剧公共财产的悲剧12
16、少吃少吃 多吃多吃 少吃少吃 2,20,3多吃多吃 3,01,119智猪博弈智猪博弈12按下按下 不按不按 按下按下 4,2 2,3不按不按 6,-10,0小猪小猪大大猪猪20 定义定义:si 是是si 的的严格劣势战略严格劣势战略(strictly dominated),如果),如果: ui(si ,s-i) ui(si ,s-i)“沉默沉默”是是“招认招认”的严格劣战略的严格劣战略-1 ,-1-9 ,00 ,-9-6 ,-6 囚徒囚徒 2沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1理性的参与人不会理性的参与人不会选择严格劣策略选择严格劣策略21公共财产的悲剧公共财产的悲剧12少吃少吃 多
17、吃多吃 少吃少吃 2,20,3多吃多吃 3,01,122重复剔除严格劣策略重复剔除严格劣策略1,01,20,10,30,12,0上下参与人2左 中 右参与人11,01,20,30,1上下参与人2左 中参与人1博弈结果(上,中)博弈结果(上,中)23两人都没有严格劣策略两人都没有严格劣策略保持保持 转向转向 保持保持 0,0 3,1转向转向 1,32,2鸽鸽鹰鹰12按下按下 不按不按 按下按下 4,2 2,3不按不按 6,-10,0小猪小猪大大猪猪24 定义定义:s* = (s1*,sn*)是一个是一个纳什均衡纳什均衡(Nash equilibrium), 如果对如果对 i,ui(si*,s i
18、*) ui(si,s i *)纳什均衡为如下最大化问题的解纳什均衡为如下最大化问题的解 ui = ui (s1*, , si, , sn*)iiSs max给定你的策略,我的策略是最好的策略给定你的策略,我的策略是最好的策略给定我的策略,你的策略也是最好的策略给定我的策略,你的策略也是最好的策略因此没有一个参与人会轻率地偏离这个策略组合而使因此没有一个参与人会轻率地偏离这个策略组合而使 自己蒙受损失自己蒙受损失25纳什均衡特例:纳什均衡特例:u1(s11,s21), u2(s11,s21)u1(s11,s22), u2(s11,s22 )u1(s12,s21), u2(s12,s21)u1(s
19、12,s22), u2(s12,s22 )u1(s13,s21), u2(s13,s21)u1(s13,s22), u2(s13,s22 )s11 s12 s13参与人参与人1 1参与人参与人2 2s21 s22(s11*, s21*)是纳什均衡,如果是纳什均衡,如果 u1(s11*,s21*) u1(s12,s21*) u1(s11*,s21*) u1(s13,s21*) u2(s11*,s21*) u2(s11*,s22).26寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法-1 ,-1-9 ,00 , -9-6 ,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚
20、徒1-6 ,-6没有哪个博弈方有偏离这个预测结果的愿望没有哪个博弈方有偏离这个预测结果的愿望第一类决策矛盾:强第一类决策矛盾:强烈的个人动机将导致烈的个人动机将导致集体的损失集体的损失27 对于策略组合对于策略组合S和和S,如果所有的参与人相对于,如果所有的参与人相对于S都更偏好于都更偏好于采取采取S,而且至少对一个参与人来说是严格偏好的,我们就,而且至少对一个参与人来说是严格偏好的,我们就说说S比比S更有效率更有效率。用数学来表示,如果。用数学来表示,如果ui(S) ui(S)对每个参对每个参与人与人i都成立,并且不等式至少对一个参与人是严格成立的,都成立,并且不等式至少对一个参与人是严格成
21、立的,那么那么S比比S更有效率更有效率。-1 ,-1-9 ,00 , -9-6 ,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1 (沉默,沉默)比(招认,招认)更有效率(沉默,沉默)比(招认,招认)更有效率28 如果不存在其他更有效率的策略组合,我们就称这个策略组如果不存在其他更有效率的策略组合,我们就称这个策略组合合S是有效的是有效的。用数学来表示,不存在其他策略组合。用数学来表示,不存在其他策略组合S对每个对每个参与人参与人i来说都满足来说都满足ui(S) ui(S),同时对某个参与人,同时对某个参与人j来说满来说满足足ui(S)ui(S) 。-1 ,-1-9 ,00
22、, -9-6 ,-6 囚徒囚徒 2 沉默沉默 招认招认沉默沉默 招认招认囚徒囚徒1 (沉默,沉默)(沉默,沉默),(招认,沉默),(招认,沉默), (沉默,招认)都是有(沉默,招认)都是有效的策略组合效的策略组合29寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法1,01,20,10,30,12,0上上下下参与人参与人2左左 中中 右右参与人参与人11 ,230寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法0,44,05,34,00,45,33,53,56,6上上中中下下参与人参与人2左左 中中 右右参与人参与人16 ,631寻找纳什均衡的方法之一:划线法寻找纳什均衡
23、的方法之一:划线法2 ,10 ,00 , 01 ,2 帕特帕特歌剧歌剧 拳击拳击歌剧歌剧 拳击拳击克里斯克里斯性别战性别战 (the battle of the Sexes)1 ,22 ,1第二类决策矛盾:达成第二类决策矛盾:达成均衡的方式不止一种,均衡的方式不止一种,策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得沟通沟通32寻找纳什均衡的方法之一:划线法寻找纳什均衡的方法之一:划线法鹰鸽博弈鹰鸽博弈保持保持 转向转向 保持保持 0,0 3,1转向转向 1,32,2鸽鸽鹰鹰制度、规则、制度、规则、行为及文化行为及文化第二类决策矛盾:达成第二类决策矛盾:达成均衡的方式不
24、止一种,均衡的方式不止一种,策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得33现实生活中无效率均衡的例子现实生活中无效率均衡的例子-QWERTY的键位设计的键位设计第三类决策矛盾:习惯已经根深蒂固了第三类决策矛盾:习惯已经根深蒂固了标准的键位设计(第三行以标准的键位设计(第三行以QWERTY开始)是由打字机的发开始)是由打字机的发明者为了防止按键卡死而修正的。对于机械打字机来说,当两明者为了防止按键卡死而修正的。对于机械打字机来说,当两个位置接近的按键同时按下的时候,会导致用来敲打色带的铅个位置接近的按键同时按下的时候,会导致用来敲打色带的铅字杠杆之间发生纠结,因此发
25、明者设计键位的原则是将那些经字杠杆之间发生纠结,因此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。但按键卡死在现代来说并不常连在一起使用的字母分开排列。但按键卡死在现代来说并不是一个问题。是一个问题。20实际实际30年代,年代,August Dvorak和和William Dealey通过对英语中通过对英语中单词运用的仔细研究,设计了一种新的键盘单词运用的仔细研究,设计了一种新的键盘- Dvorak键盘,人们键盘,人们确信这种键盘比使用确信这种键盘比使用QWERTY键盘打字效率显著提高。键盘打字效率显著提高。为什么为什么QWERTY键盘现在仍然是标准?键盘现在仍然是标准?34寻找
展开阅读全文