博弈论经典PPT课件.ppt

上传人（卖家）：三亚风情

文档编号：2645300

上传时间：2022-05-14

格式：PPT

页数：343

大小：6.57MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

32 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《博弈论经典PPT课件.ppt》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 博弈论经典 PPT 课件

资源描述：: 1、博弈论博弈论1参考书目：参考书目：博弈论基础博弈论基础，罗伯特，罗伯特吉本斯，高峰译吉本斯，高峰译中国社会科学出版社，中国社会科学出版社，19991999年年3 3月月策略策略- -博弈论导论博弈论导论，乔尔，乔尔沃森，费方域，赖丹沃森，费方域，赖丹馨译，上海人民出版社，馨译，上海人民出版社，20102010年年1111月月经济博弈论（第二版）经济博弈论（第二版），谢枳予，谢枳予复旦大学出版社，复旦大学出版社，20022002年年1 1月月2主要内容主要内容第一章第一章完全信息静态博弈完全信息静态博弈第二章第二章完全信息的动态博弈完全信息的动态博弈第三章第三章非完全信息静态博弈非完全
2、信息静态博弈第四章第四章非完全信息动态博弈非完全信息动态博弈3在所有社会，人们经常互动。在所有社会，人们经常互动。互动有时是合作，有时是竞争。互动有时是合作，有时是竞争。在这两种情况下，都可以用一个术语，即在这两种情况下，都可以用一个术语，即相互依相互依赖性赖性来表示一个人的行为对另外一个人的福利造来表示一个人的行为对另外一个人的福利造成的影响。成的影响。相互依赖的情形可称为相互依赖的情形可称为策略环境策略环境。因为人们为了。因为人们为了确定所采取的最优行动，必须考虑他周围的其他确定所采取的最优行动，必须考虑他周围的其他人会怎样选择行动。人会怎样选择行动。博弈就是策略对抗博弈就是策略对抗博弈
3、的定义博弈的定义4定义：定义：博弈就是一些个人、队组或其他组织，面对一定博弈就是一些个人、队组或其他组织，面对一定的环境条件，的环境条件，在一定的规则下，同时或先后，一次或在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。实施，各自取得相应结果的过程。四个核心方面四个核心方面博弈的参加人博弈的参加人(Player)博弈方博弈方各博弈方的策略各博弈方的策略(Strategies)或行为或行为(Actions) 博弈的次序博弈的次序(Order) 博弈方的得益博弈方的得益(Payof
4、fs)5目前，博弈论被许多来自不同领域的专业人士使用，这些目前，博弈论被许多来自不同领域的专业人士使用，这些领域包括经济学、政治学、法律、生物、国际关系哲学以领域包括经济学、政治学、法律、生物、国际关系哲学以及数学。及数学。事实上，事实上，大多数情形即包含了冲突元素，也包含了合作的大多数情形即包含了冲突元素，也包含了合作的元素元素。我们对博弈的组成要有一个广义的理解。我们对博弈的组成要有一个广义的理解。简而言之，博弈是策略环境的正式描述。因此，博弈论是简而言之，博弈是策略环境的正式描述。因此，博弈论是研究相互依赖情形的正式的方法论。这里，研究相互依赖情形的正式的方法论。这里，“正式正式”是指是
5、指一种以数学化的精确，以及逻辑上的一致见长的结构。一种以数学化的精确，以及逻辑上的一致见长的结构。利用正确的理论工具，我们可以研究各种情况下的行为，利用正确的理论工具，我们可以研究各种情况下的行为，从而更好地理解经济中的相互作用。从而更好地理解经济中的相互作用。6静态博弈：静态博弈：所有博弈方同时或可看作同时选择策略所有博弈方同时或可看作同时选择策略的博弈的博弈石头剪刀布、猜硬币、古诺模型石头剪刀布、猜硬币、古诺模型动态博弈：动态博弈：各博弈方的选择和行动有先后次序且后各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可选择、后行动的博弈方在自己选择、行动之前可以看到
6、其他博弈方的选择和行动以看到其他博弈方的选择和行动弈棋、市场进入、斯坦博格型市场结构弈棋、市场进入、斯坦博格型市场结构7 完全信息博弈：完全信息博弈：各博弈方都完全了解所有博弈方各各博弈方都完全了解所有博弈方各种情况下的得益种情况下的得益不完全信息博弈：不完全信息博弈：至少部分博弈方不完全了解其他至少部分博弈方不完全了解其他博弈方得益的情况的博弈，也称为博弈方得益的情况的博弈，也称为“不对称信息博不对称信息博弈弈” 完美信息博弈：完美信息博弈：每个轮到行动的博弈方对博弈的进每个轮到行动的博弈方对博弈的进程完全了解的博弈程完全了解的博弈不完美信息博弈：不完美信息博弈：至少某些博弈方在轮到行
7、动时不至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈完全了解此前全部博弈的进程的博弈8 约翰约翰福布斯福布斯纳什纳什(John Forbes Nash Jr., 1950, (John Forbes Nash Jr., 1950, 1951)1951)利用不动点定理证明了均衡点的存在，为博弈利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。论的一般化奠定了坚实的基础。19941994年年约翰约翰福布福布斯斯纳什纳什、约翰约翰C C海萨尼海萨尼以及以及莱因哈德莱因哈德泽尔腾泽尔腾，三人，三人同时因为他们对博弈论的研究，所作出的突出贡献，同时因为他们对博弈论的研究，
8、所作出的突出贡献，而获得诺贝尔经济学奖。而获得诺贝尔经济学奖。 John HarsanyJohn NashLeihaden Selten9三位大师主要的贡献三位大师主要的贡献 19501950年和年和19511951年纳什的两篇关于非合作博弈论的重要论年纳什的两篇关于非合作博弈论的重要论文，证明了非合作博弈及其均衡解，并证明了文，证明了非合作博弈及其均衡解，并证明了均衡解的均衡解的存在性存在性，即著名的纳什均衡。从而揭示了博弈均衡与经，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。济均衡的内在联系。泽尔腾（泽尔腾（19651965）将纳什均衡概念引入了动态分析，提出）将纳什均衡概
9、念引入了动态分析，提出了了“精炼纳什均衡精炼纳什均衡”概念。概念。海萨尼发展了刻画不完全信息静态博弈的海萨尼发展了刻画不完全信息静态博弈的“贝叶斯纳什贝叶斯纳什均衡均衡”（1967196719681968）。）。泽尔腾和海萨尼进一步将纳什均衡动态化，加入了接近泽尔腾和海萨尼进一步将纳什均衡动态化，加入了接近实际的不完全信息条件。他们的工作为后人继续发展博实际的不完全信息条件。他们的工作为后人继续发展博弈论，提供了基本思路和模型弈论，提供了基本思路和模型。10第一章第一章完全信息静态博弈完全信息静态博弈 1.1 基本理论基本理论: 博弈的标准式和纳什均衡博弈的标准式和纳什均衡 1.2 应
10、用举例应用举例 1.3 混合策略和均衡的存在混合策略和均衡的存在111.1 基本理论基本理论: 博弈的标准式和纳什均衡博弈的标准式和纳什均衡例例1 儿童游戏：儿童游戏：“石头、剪刀、布石头、剪刀、布”。参与人参与人：1，2。策略空间策略空间：S1 = S2 = 石头、剪刀、布石头、剪刀、布收益收益：两人出手的函数：两人出手的函数 u1 (石头，石头石头，石头) = 0， u1 (石头，剪刀石头，剪刀) = 1， u1 (石石头，布头，布) = -1 u2 (石头，石头石头，石头) = 0， u2 (石头，剪刀石头，剪刀) = -1，u2 (石石头，布头，布) = 112博弈的标准式表示
11、博弈的标准式表示 (normal-form representation) (1) 参与人参与人 ( player). n 个参与人：个参与人：1, 2, , i, , n (2) 策略策略 (strategy). 一个参与人的策略是他采取的一个行动。一个参与人的策略是他采取的一个行动。参与人参与人 i 的策略：的策略：si 参与人参与人 i 的策略空间的策略空间: Si 策略的一个组合策略的一个组合: s =s1，s2, , sn 简化表示：简化表示：s- i= s1，, s i -1， s i+1, , sn (3) 收益收益 (payoff). 参与人参与人 i 的收益：的收益：ui=
12、 ui(s1，s2, , sn) n 个参与人博弈的标准形式表示个参与人博弈的标准形式表示: G = S1, S2, , Sn；u1, u2, , un13博弈标准式特例：博弈标准式特例：u1(s11,s21), u2(s11,s21)u1(s11,s22), u2(s11,s22 )u1(s12,s21), u2(s12,s21)u1(s12,s22), u2(s12,s22 )u1(s13,s21), u2(s13,s21)u1(s13,s22), u2(s13,s22 )s11 s12 s13参与人参与人1参与人参与人2s21 s22S1=s11, s12, s13 S2=s21, s2
13、2 收益表收益表(Payoff)：两个参与人，有限个战略的博弈两个参与人，有限个战略的博弈的表示方法的表示方法 14 0 ， 0 1 ， -1 -1 ，1 -1 ， 1 0 ， 0 1 ，-1 1 ，-1 -1 ， 1 0 ，0石头石头剪刀剪刀布布石头石头剪刀剪刀布布P1P215 囚徒囚徒1的考虑：无论对方选沉默还是招认，自己选的考虑：无论对方选沉默还是招认，自己选“招认招认”好于好于“沉默沉默”。囚徒囚徒2的考虑：的考虑：无论对方选什么，无论对方选什么，“招认招认”好于好于“沉默沉默”。两人的选择两人的选择: (招认招认,招认招认)。-1 ，-1-9 ，00 ，-9-6 ，-6
14、囚徒囚徒 2沉默沉默招认招认沉默沉默招认招认例例囚徒困境囚徒困境 (The Prisoners Dilemma) 囚徒囚徒1占优占优1617 每一个博弈都是一个你中有我，我中有你的情形，每一个博弈都是一个你中有我，我中有你的情形，不同的博弈参与者可以选择不同的行动，但由于不同的博弈参与者可以选择不同的行动，但由于相互作用，一个博弈参与者的得益不仅取决于自相互作用，一个博弈参与者的得益不仅取决于自己采取的行动，也取决于其他博弈参与者所采取己采取的行动，也取决于其他博弈参与者所采取的行动。的行动。博弈论的精髓在于基于系统思维基础上的理性换博弈论的精髓在于基于系统思维基础上的理性换位思考，位
15、思考，即在选择你的行动时，你应当用他人的即在选择你的行动时，你应当用他人的得益去推测他人的行动，从而选择最有利于自己得益去推测他人的行动，从而选择最有利于自己的行动。的行动。17鹰鸽博弈（斗鸡博弈）鹰鸽博弈（斗鸡博弈）参与人：鹰和鸽参与人：鹰和鸽策略：保持原方向和转向策略：保持原方向和转向偏好：如果他们都保持原方向，就会撞车。如偏好：如果他们都保持原方向，就会撞车。如果都转向，就都保住了面子。如果只有对方转果都转向，就都保住了面子。如果只有对方转向，就会被称为硬汉。向，就会被称为硬汉。保持保持转向转向保持保持 0，0 3，1转向转向 1，32，2鸽鸽鹰鹰18公共财产的悲剧公共财产的悲剧12
16、少吃少吃多吃多吃少吃少吃 2，20，3多吃多吃 3，01，119智猪博弈智猪博弈12按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大大猪猪20 定义定义：si 是是si 的的严格劣势战略严格劣势战略（strictly dominated），如果），如果: ui(si ，s-i) ui(si ，s-i)“沉默沉默”是是“招认招认”的严格劣战略的严格劣战略-1 ，-1-9 ，00 ，-9-6 ，-6 囚徒囚徒 2沉默沉默招认招认沉默沉默招认招认囚徒囚徒1理性的参与人不会理性的参与人不会选择严格劣策略选择严格劣策略21公共财产的悲剧公共财产的悲剧12少吃少吃多
17、吃多吃少吃少吃 2，20，3多吃多吃 3，01，122重复剔除严格劣策略重复剔除严格劣策略1，01，20，10，30，12，0上下参与人2左中右参与人11，01，20，30，1上下参与人2左中参与人1博弈结果（上，中）博弈结果（上，中）23两人都没有严格劣策略两人都没有严格劣策略保持保持转向转向保持保持 0，0 3，1转向转向 1，32，2鸽鸽鹰鹰12按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大大猪猪24 定义定义：s* = (s1*，sn*)是一个是一个纳什均衡纳什均衡(Nash equilibrium), 如果对如果对 i，ui(si*，s i
18、*) ui(si，s i *)纳什均衡为如下最大化问题的解纳什均衡为如下最大化问题的解 ui = ui (s1*, , si, , sn*)iiSs max给定你的策略，我的策略是最好的策略给定你的策略，我的策略是最好的策略给定我的策略，你的策略也是最好的策略给定我的策略，你的策略也是最好的策略因此没有一个参与人会轻率地偏离这个策略组合而使因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失自己蒙受损失25纳什均衡特例：纳什均衡特例：u1(s11,s21), u2(s11,s21)u1(s11,s22), u2(s11,s22 )u1(s12,s21), u2(s12,s21)u1(s
19、12,s22), u2(s12,s22 )u1(s13,s21), u2(s13,s21)u1(s13,s22), u2(s13,s22 )s11 s12 s13参与人参与人1 1参与人参与人2 2s21 s22(s11*, s21*)是纳什均衡，如果是纳什均衡，如果 u1(s11*,s21*) u1(s12,s21*) u1(s11*,s21*) u1(s13,s21*) u2(s11*,s21*) u2(s11*,s22).26寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法-1 ，-1-9 ，00 ， -9-6 ，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚
20、徒1-6 ，-6没有哪个博弈方有偏离这个预测结果的愿望没有哪个博弈方有偏离这个预测结果的愿望第一类决策矛盾：强第一类决策矛盾：强烈的个人动机将导致烈的个人动机将导致集体的损失集体的损失27 对于策略组合对于策略组合S和和S，如果所有的参与人相对于，如果所有的参与人相对于S都更偏好于都更偏好于采取采取S，而且至少对一个参与人来说是严格偏好的，我们就，而且至少对一个参与人来说是严格偏好的，我们就说说S比比S更有效率更有效率。用数学来表示，如果。用数学来表示，如果ui(S) ui(S)对每个参对每个参与人与人i都成立，并且不等式至少对一个参与人是严格成立的，都成立，并且不等式至少对一个参与人是严格成
21、立的，那么那么S比比S更有效率更有效率。-1 ，-1-9 ，00 ， -9-6 ，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚徒1 （沉默，沉默）比（招认，招认）更有效率（沉默，沉默）比（招认，招认）更有效率28 如果不存在其他更有效率的策略组合，我们就称这个策略组如果不存在其他更有效率的策略组合，我们就称这个策略组合合S是有效的是有效的。用数学来表示，不存在其他策略组合。用数学来表示，不存在其他策略组合S对每个对每个参与人参与人i来说都满足来说都满足ui(S) ui(S)，同时对某个参与人，同时对某个参与人j来说满来说满足足ui(S)ui(S) 。-1 ，-1-9 ，00
22、， -9-6 ，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚徒1 （沉默，沉默）（沉默，沉默）,（招认，沉默），（招认，沉默），（沉默，招认）都是有（沉默，招认）都是有效的策略组合效的策略组合29寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法1，01，20，10，30，12，0上上下下参与人参与人2左左中中右右参与人参与人11 ，230寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法0，44，05，34，00，45，33，53，56，6上上中中下下参与人参与人2左左中中右右参与人参与人16 ，631寻找纳什均衡的方法之一：划线法寻找纳什均衡
23、的方法之一：划线法2 ，10 ，00 ， 01 ，2 帕特帕特歌剧歌剧拳击拳击歌剧歌剧拳击拳击克里斯克里斯性别战性别战 (the battle of the Sexes)1 ，22 ，1第二类决策矛盾：达成第二类决策矛盾：达成均衡的方式不止一种，均衡的方式不止一种，策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得沟通沟通32寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法鹰鸽博弈鹰鸽博弈保持保持转向转向保持保持 0，0 3，1转向转向 1，32，2鸽鸽鹰鹰制度、规则、制度、规则、行为及文化行为及文化第二类决策矛盾：达成第二类决策矛盾：达成均衡的方式不
24、止一种，均衡的方式不止一种，策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得33现实生活中无效率均衡的例子现实生活中无效率均衡的例子-QWERTY的键位设计的键位设计第三类决策矛盾：习惯已经根深蒂固了第三类决策矛盾：习惯已经根深蒂固了标准的键位设计（第三行以标准的键位设计（第三行以QWERTY开始）是由打字机的发开始）是由打字机的发明者为了防止按键卡死而修正的。对于机械打字机来说，当两明者为了防止按键卡死而修正的。对于机械打字机来说，当两个位置接近的按键同时按下的时候，会导致用来敲打色带的铅个位置接近的按键同时按下的时候，会导致用来敲打色带的铅字杠杆之间发生纠结，因此发
25、明者设计键位的原则是将那些经字杠杆之间发生纠结，因此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。但按键卡死在现代来说并不常连在一起使用的字母分开排列。但按键卡死在现代来说并不是一个问题。是一个问题。20实际实际30年代，年代，August Dvorak和和William Dealey通过对英语中通过对英语中单词运用的仔细研究，设计了一种新的键盘单词运用的仔细研究，设计了一种新的键盘- Dvorak键盘，人们键盘，人们确信这种键盘比使用确信这种键盘比使用QWERTY键盘打字效率显著提高。键盘打字效率显著提高。为什么为什么QWERTY键盘现在仍然是标准？键盘现在仍然是标准？34寻找
26、纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法公共财产的悲剧公共财产的悲剧12少吃少吃多吃多吃少吃少吃 2，20，3多吃多吃 3，01，135寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法智猪博弈智猪博弈按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大大猪猪为什么中小企业不会花钱去开发新产品？为什么中小企业不会花钱去开发新产品？36协调博弈协调博弈12A B A1，10，0B 0，01，1帕累托协调博弈帕累托协调博弈12A B A2，20，0B 0，01，1帕累托上策均衡帕累托上策均衡375 5， 5 53 3， 0 00 0， 3 3
27、3 3， 3 3鹿鹿兔子兔子猎人猎人2 2鹿鹿兔子兔子猎猎人人1 1猎鹿博弈猎鹿博弈风险上策均衡（兔子，兔子）风险上策均衡（兔子，兔子）设猎人设猎人2选抓兔子的概率为选抓兔子的概率为p，则猎人，则猎人1选抓鹿的期望得益选抓鹿的期望得益:5(1-p)选抓兔子的期望得益选抓兔子的期望得益:3(1-p)+3p由由 5(1-p)2/5考虑其他博弈方可能发生考虑其他博弈方可能发生错误等时，帕累托上策均错误等时，帕累托上策均衡并不一定是最优选择，衡并不一定是最优选择，需要考虑：风险上策均衡。需要考虑：风险上策均衡。38 三个主要的广播电视台：三个主要的广播电视台：A、B、C。所有这三个电视台都。所有这三个
28、电视台都可以选择讲晚间新闻现场直播时间定在晚上可以选择讲晚间新闻现场直播时间定在晚上6点或是推迟到点或是推迟到7点，每个电视台的目标都是使他的收视率最大化。点，每个电视台的目标都是使他的收视率最大化。A B6点7点6点14,24,328,30,277点30,16,2413,12,50A B6点7点6点16,24,3030,16,247点30,23,1414, 24,326点7点C39缔约（缔约（contract）缔约不仅仅用于防止策略的不确定，还可以缓解缔约不仅仅用于防止策略的不确定，还可以缓解共同利益和个体利益之间的冲突。共同利益和个体利益之间的冲突。即缔约为各参即缔约为各参与者提供了一种
29、防止无效率协调的方法与者提供了一种防止无效率协调的方法。12I N I 8，8 -4，4N 10，-2 0，012I N I 8，8 -4，4N 7，1 0，040让我们集中考虑让我们集中考虑z1+z2x1+y2，z1+z2x2+y1，且，且z1+z20的情况。这意味着各参与人的收益总和在采的情况。这意味着各参与人的收益总和在采取取(I,I)时达到最大化。时达到最大化。(I,I)组合是这个基本博弈唯组合是这个基本博弈唯一的一个有效率的结果。一的一个有效率的结果。问题：假设问题：假设(I,I)是最好的结果，各参与人是否可以是最好的结果，各参与人是否可以缔约，执行规定的缔约，执行规定的(I,I)
30、组合？组合？ 12I N I z1，z2 y1，x2 N x1，y2 0，0基本博弈基本博弈41只要只要(I,I)是一个纳什均衡，采取是一个纳什均衡，采取(I,I)的协定就是自我实施的协定就是自我实施合同。而这只有当合同。而这只有当z1x1和和z2x2的情况下才成立。的情况下才成立。但是，如果其中有一个不成立，那么各个参与人就无法但是，如果其中有一个不成立，那么各个参与人就无法依靠合同的自我实施去维持依靠合同的自我实施去维持(I,I)的结果，他们需要第三的结果，他们需要第三方的加入，法庭就是作为这样一种第三方存在的。方的加入，法庭就是作为这样一种第三方存在的。如果一方选择了如果一方选择了N，
31、法庭的涉入可以在他们之间，强制，法庭的涉入可以在他们之间，强制进行货币收益的进行货币收益的转移支付转移支付。12I N I z1，z2 y1，x2 N x1，y2 0，042假设参与人知道转移的情况，那么法庭的干预就改变了假设参与人知道转移的情况，那么法庭的干预就改变了参与人之间的博弈。这个新的博弈把转移的数字加到基参与人之间的博弈。这个新的博弈把转移的数字加到基本博弈中，显示各参与人的实际收益。本博弈中，显示各参与人的实际收益。这个博弈称为这个博弈称为引发博弈引发博弈(induced game)。12I N Iz1，z2 y1+, x2-N x1+ , y2 - ，- 12I N I z1，
32、z2 y1，x2 N x1，y2 0，043设计适当的合同，可以很容易引发有效率的设计适当的合同，可以很容易引发有效率的(I,I)结果结果。只要符合只要符合z1x1+和和z2 x2-的的和和都满足这个条件。都满足这个条件。-具具体体和和的值自由决定。的值自由决定。12I N I z1，z2 y1+, x2-N x1+ , y2 - ，- 12I N I z1，z2 y1，x2 N x1，y2 0，012I N I 8，8 -4，4N 10，-2 0，012I N I 8，8 -4，4N 7，1 0，0=-3=044但是，上例的最基本的条件是，法庭必须能够区分基本但是，上例的最基本的条件是，法庭
33、必须能够区分基本博弈中所有不同的结果。例如，法庭必须能够核实每个博弈中所有不同的结果。例如，法庭必须能够核实每个参与人在博弈中，是选择了参与人在博弈中，是选择了I还是选择了还是选择了N。我们称这个。我们称这个信息条件为信息条件为完全可证实性（完全可证实性（full verifiability）。结论：在完全可证实的条件下，存在一个合同，随着它结论：在完全可证实的条件下，存在一个合同，随着它的执行可以获得有效率的结果。的执行可以获得有效率的结果。不幸的是，完全可证实往往是特例，而不是通例。通常不幸的是，完全可证实往往是特例，而不是通例。通常证据都不足以解释基本博弈的结果。法庭也许只能确定证据都不
34、足以解释基本博弈的结果。法庭也许只能确定最终结果的好坏。好的结果意味着双方都进行了投入，最终结果的好坏。好的结果意味着双方都进行了投入，坏的结果表示至少有一人没有投入。坏的结果表示至少有一人没有投入。有限可证实性（有限可证实性（limited verifiability）：法庭无法完美地：法庭无法完美地对参与人的生产行为进行证实的情况。对参与人的生产行为进行证实的情况。45在有限可证实的情况下，对博弈矩阵中的每一个单元格在有限可证实的情况下，对博弈矩阵中的每一个单元格，规定不同的外部实施收益转移，是不可能的。即法庭，规定不同的外部实施收益转移，是不可能的。即法庭无法区分无法区分(I,N),(
35、N,I)和和(N,N)。合同必须对所有这些结果规。合同必须对所有这些结果规定相同的收益转移。从博弈论的角度看，这个合同中的定相同的收益转移。从博弈论的角度看，这个合同中的外部实施部分外部实施部分只包含一个只包含一个。(见下图见下图)12I N I z1，z2 y1+ , x2- N x1+ , y2 - ，- 46在有限可证实的情况下，要维持在有限可证实的情况下，要维持(I,I)的结果很难，甚至是的结果很难，甚至是不可能的。例如虽然提高不可能的。例如虽然提高可以降低参与人可以降低参与人2选择选择N的动机的动机，但是又提高了参与人，但是又提高了参与人1选择选择N的动机。因此的动机。因此的选择必
36、须的选择必须平衡双方的动机。需要满足：平衡双方的动机。需要满足：z1x1+ 和和 z2x2- 整理简化以后可得：整理简化以后可得：x2-z2x1+x2时，存在一个时，存在一个同时满足这两同时满足这两个不等式。个不等式。12I N I z1，z2 y1+ , x2- N x1+ , y2 - ，- 47下图所示的基本博弈为例设下图所示的基本博弈为例设 =-3，得出的右下的引，得出的右下的引发博弈，其中发博弈，其中(I,I)是纳什均衡。是纳什均衡。1212I I N N I I 8 8，8 8 -4-4，4 4N N 1010，- -2 2 0 0，0 012I N I 8，8 -7，7N 7，1
37、 -3，3下图所示的基本博弈在有限可证实的情况下，下图所示的基本博弈在有限可证实的情况下，(I,I)(I,I)不不可能被执行。可能被执行。12I N I 10，10 -4，12N 12，-4 0，048(2)(2)法庭实施违约赔偿情况下的缔约。法庭实施违约赔偿情况下的缔约。法庭并不总是根据参与人起草的合同进行执法庭并不总是根据参与人起草的合同进行执行。事实上，美国法庭更可能根据某些法律行。事实上，美国法庭更可能根据某些法律原则，而不是根据合同的规定实施转移。原则，而不是根据合同的规定实施转移。在此，我们将对美国的商业环境下，对于赔在此，我们将对美国的商业环境下，对于赔偿的三个法律原则进行概括。
38、偿的三个法律原则进行概括。49在在预期利益赔偿的法律原则预期利益赔偿的法律原则下，法庭要求被告转移给原告，下，法庭要求被告转移给原告，使得使得原告获得在合同实现的情况下的收益。原告获得在合同实现的情况下的收益。根据基本博弈，参与人根据基本博弈，参与人1的期望收益是的期望收益是z1，参与人，参与人2的期望收益是的期望收益是z2。因。因此，如果参与人此，如果参与人1违约，他被强制付给参与人违约，他被强制付给参与人2的钱数，必须使得参与的钱数，必须使得参与人获得人获得z2的收益。这意味着的收益。这意味着 =y2-z2。类似地，如果参与人。类似地，如果参与人2违约，他付违约，他付给参与人给参与人1的转
39、移是的转移是=z1-y1。在引发博弈中，如果当且仅当在引发博弈中，如果当且仅当z1x1+y2z2和和z2x2+y1z1时，时，(I,I)是纳什是纳什均衡。不等式可以整理得：均衡。不等式可以整理得：z1+z2x1+y2 和和 z1+z2x2+y1它们正好是当它们正好是当(I,I)有效率时所满足的条件。有效率时所满足的条件。结论：在预期利益赔偿原则下，当且仅当结论：在预期利益赔偿原则下，当且仅当(I,I)是有效率的时候，是有效率的时候，(I,I)是是可执行的。可执行的。12I N I z1，z2 z1, x2+y1-z1N x1+y2 z2，z2 0，012I N I z1，z2 y1+, x2-
40、N x1+ , y2 - ，- 50第二种违约补偿非常适用于第二种违约补偿非常适用于zi无法观察的情况。无法观察的情况。在在信赖利益损害赔偿原则信赖利益损害赔偿原则下，法庭实施的转移，使得原告下，法庭实施的转移，使得原告能够获得他在没有签署合同情况下的收益。能够获得他在没有签署合同情况下的收益。根据左下图，信赖利益损害赔偿意味着根据左下图，信赖利益损害赔偿意味着=y2和和=-y1。引。引发博弈如右下图所示。发博弈如右下图所示。注意，当且仅当注意，当且仅当z1x1+y2 和和z2x2+y1时，时，(I，I)是引发博弈是引发博弈的纳什均衡。的纳什均衡。12I N I z1，z2 0, x2+y1
41、N x1+y2，0 0，012I N I z1，z2 y1+, x2-N x1+ , y2 - ，- 51违约情况下普遍采用的第三种法律原则指的是违约情况下普遍采用的第三种法律原则指的是回复原状赔回复原状赔偿偿，这种原则是通过取消被告因违约而牟取的，相对于无，这种原则是通过取消被告因违约而牟取的，相对于无合同情况下所增加的不当得利而得名。合同情况下所增加的不当得利而得名。回复原状赔偿意味着回复原状赔偿意味着=-x1，=x2。所得到的引发博弈形。所得到的引发博弈形式如右下图所示。式如右下图所示。注意，当且仅当注意，当且仅当z10，z20时，时，(I,I)是引发博弈的纳什均是引发博弈的纳什均衡。衡
42、。12I N I z1，z2 x2+y1，0N 0，x1+y2 0，012I N I z1，z2 y1+, x2-N x1+ , y2 - ，- 521212I I N N I I 4 4，4 4 -4-4，9 9N N 2 2，-4 -4 0 0，0 0在预期利益赔偿的法律原则下，在预期利益赔偿的法律原则下，(I,I) (I,I) 能够被执行。能够被执行。12I N I 4，4 4，1N -6，4 0，0基本博弈基本博弈引发引发博弈博弈531212I I N N I I 4 4，4 4 -4-4，9 9N N 2 2，-4 -4 0 0，0 0在恢复原状赔偿的法律原则下，在恢复原状赔偿的法律
43、原则下，(I,I) (I,I) 能够被执行。能够被执行。12I N I 4，4 5，0N 0，-2 0，0基本博弈基本博弈引发引发博弈博弈541212I I N N I I 4 4，4 4 -4-4，9 9N N 2 2，-4 -4 0 0，0 0在信赖利益损害赔偿原则的法律原则下，在信赖利益损害赔偿原则的法律原则下，(I,I) (I,I) 不能不能够被执行。够被执行。12I N I 4，4 0，5N -2，0 0，0基本博弈基本博弈引发引发博弈博弈55 两方严格竞争博弈（两方严格竞争博弈（two-player, strictly competitive game）是指具有如下性质的两方博是指
44、具有如下性质的两方博弈，对于任意两个策略组合弈，对于任意两个策略组合s, s S，当且仅当，当且仅当u2(s)u1(s)。零和博弈零和博弈是其中的一种是其中的一种 3 ，20 ，46 ， 11 ，3A B参与人参与人1 参与人参与人2 A B-1-1， 1 11 1， -1-11 1， -1-1-1-1， 1 1正正面面反反面面猜硬币方猜硬币方盖盖硬硬币币方方正正面面反反面面56 对于策略对于策略来说，如果来说，如果是是的的解，那么它就是一个解，那么它就是一个安全策略安全策略，其中，其中参与参与人人i采取策略采取策略si最差的得益，参与人最差的得益，参与人i的安全得益水平为的
45、安全得益水平为结论结论：如果一个两方博弈是严格竞争的，并且有一个纳什：如果一个两方博弈是严格竞争的，并且有一个纳什均衡均衡s*=(s1*,s2*) S，那么，那么s1*是参与人是参与人1的一个安全策略，的一个安全策略， s2*是参与人是参与人2的一个安全策略。的一个安全策略。 3 ，20 ，46 ， 11 ，3A B参与人参与人1 参与人参与人2 A B ismax min( ,)jjiiiijsSsSu s smin( ,)jjiijsSu s s isSmax min( ,)jjiiiijsSsSu s s57纳什均衡与重复剔除严格劣策略的关系纳什均衡与重复剔除严格劣策略的关系命题命题
46、2.12.1：没有被剔除的唯一的策略组合是纳什均：没有被剔除的唯一的策略组合是纳什均衡衡. . 命题命题2.22.2：如果策略是一个纳什均衡，它们在重复如果策略是一个纳什均衡，它们在重复剔除严格劣策略后留下剔除严格劣策略后留下. . 上述两个命题保证在进行纳什均衡分析之前上述两个命题保证在进行纳什均衡分析之前先通过剔除严格劣策略简化博弈是可行的。先通过剔除严格劣策略简化博弈是可行的。581.1 节习题与练习节习题与练习1.2 2，01，14，23，41，22，31，30，23，0TMBL C R591.3 设此博弈的纯策略纳什均衡是对于参与人1来说同理，对于参与人2因此，此博弈的纯策略纳什均衡
47、是且满足12( *,*)ss122111101*1*122*max( max, max)max(1*,0)1*sssssssss 21*1*ss 12( *,*)ss1212*1,0*,*1ssss60 例例1 定位博弈定位博弈例例2 合伙人博弈合伙人博弈-策略互补策略互补例例3 犯罪与治安模型犯罪与治安模型例例4 古诺双头垄断模型（古诺双头垄断模型（Cournot Model of Duopoly）例例5 贝特兰德双头垄断模型（贝特兰德双头垄断模型（Bertrand Model of Duopoly）例例6 最后要价仲裁最后要价仲裁 (Final-offer Arbitratio
48、n) 例例7 公共财产问题公共财产问题1.2 应用举例应用举例61 例例1 1 定位博弈定位博弈帕特和克里斯为一家很大的软饮料公司工作，他们帕特和克里斯为一家很大的软饮料公司工作，他们的工作是在人们喜欢的一个海滩上销售这家公司的的工作是在人们喜欢的一个海滩上销售这家公司的灌装苏打饮料，他们在同一个海滩上工作，而且公灌装苏打饮料，他们在同一个海滩上工作，而且公司规定，必须卖一样的价格，并且承诺每卖一听饮司规定，必须卖一样的价格，并且承诺每卖一听饮料给他们料给他们2525美分美分的佣金。帕特和克里斯需要作出的的佣金。帕特和克里斯需要作出的决定是：决定是：每天早晨要把售货棚设在哪里？每天早晨要把售
49、货棚设在哪里？13245678962每个区域中都会有每个区域中都会有50个人个人想要买苏打水。想要买苏打水。如果一个售货员可以为其中区域中的所有顾客服务，如果一个售货员可以为其中区域中的所有顾客服务，他将赚的他将赚的12.5美元。美元。顾客们都会到最近的售货摊去买顾客们都会到最近的售货摊去买。132456789利润利润=43.75利润利润=68.756312345156.25, 56.2512.5,10018.75 , 93.7525, 87.531.25 , 81.252100, 12.556.25, 56.2525, 87.531.25, 81.2537.5, 75393.75, 18.7
50、587.5, 2556.25, 56.2537.5, 7543.75, 68.75487.5, 2581.25, 31.2575, 37.556.25, 56.2550 , 62.5581.25, 31.2575, 37.568.75, 43.7562.5, 5056.25, 56.25675, 37.568.75, 43.7562.5, 5056.25, 56.2550 , 62.5768.75, 43.7562.5, 5056.25, 56.2550 , 62.543.75, 68.75862.5, 5056.25, 56.2550 , 62.543.75, 68.7537.5, 7595

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：博弈论经典PPT课件.ppt
链接地址：https://www.163wenku.com/p-2645300.html

三亚风情

内容提供者

实名认证

联系作者