第七章-竞争型决策分析-博弈论-(《决策理论与方法》课件).pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第七章-竞争型决策分析-博弈论-(《决策理论与方法》课件).pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策理论与方法 第七 竞争 决策 分析 博弈论 理论 方法 课件
- 资源描述:
-
1、第七章 竞争型决策分析 博弈论第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论一、竞争型决策分析与博弈论一、竞争型决策分析与博弈论 在现实生活中我们经常会遇到一些具有竞争性质的决策问题,在这些竞争中是存在竞争对手的,每个决策主体的行为后果都要受到对手的影响,并且这些决策者之间的利益是相互冲突的,这类特殊的决策问题就是竞争型决策。博弈论是研究理性的决策者之间的冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。此外,博弈论研究的决策问题是包括开始、过程和结果的整个决策过程,也是广义上的竞争型决策分析。二、博弈现象二、博弈现象(
2、一)(一)“囚徒困境囚徒困境”“囚徒困境”博弈是博弈理论中的典型实例。“囚徒困境”讲的是警方拘捕两个同案犯罪嫌疑人(囚徒)后,为防其相互间串供,而将两人分别拘押、隔离审问时,两疑犯所面临的认罪策略选择的问题。摆在两疑犯面前的选择有两种:坦白或不坦白。按照我们通常的政策,坦白从宽,抗拒从严。所以,若两人均坦白,则可从轻处理,分别判刑5年;若两人中有一人坦白而另一人拒不坦白,则坦白者可免于处罚,而拒不坦白者,将从重惩处被判10年;当然,若两人均不交代,而警方手中又无足够的证据可以指控犯罪嫌疑人,那他们只可能被按妨碍公务罪被判1年。该博弈问题的最终结果必然是两博弈方都选择坦白,收益均为-5。当然这里
3、有个前提,即两人均没有条件串供,否则无论是对这两个囚徒总体来讲,还是对他们个人来讲,最佳的结果都不是同时坦白得到-5,而是都不坦白所得到的-1。(二)(二)“齐威王与田忌赛马齐威王与田忌赛马”春秋战国时期齐威王经常约手下大将田忌与他赛马。赛马的规则是这样的:每次双方各出三匹马,一对一比赛三场,每一场的败者要输一千金给胜者。齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由于齐威王的上、中、下三匹马都分别比田忌的上、中,下三匹马略胜一筹,因此田忌每次都是连输三场,要输掉三千金。实际上,田忌的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样,田忌的中马则比齐威王的下马要好一些,
4、田忌每次都连输三场是有些冤枉的。后来田忌的谋士孙膑知道这一情况后,给田忌出了个主意,即让田忌不要用自己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必败无疑,但后两场田忌却都能取胜,二胜一负,田忌反而能赢齐威王一千金。第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论三、博弈的要素三、博弈的要素 (二)博弈方可选择的全部行为或策略的集合(二)博弈方可选择的全部行为或策略的集合 即每个博弈方在进行决策时(同时或先后,一次或多次)可以选择的方法、做法等。策略有纯策略和混合策略之分。记博弈方i的策略为 ,为博弈方
5、i可选择的策略组成的策略集合,又称策略空间,则 。n个局中人各选择一个策略形成的向量 ,称为策略组合。),(1nsssisiSiiSs 参与者、策略和支付是博弈必不可少的三个基本要素。又称博弈方或局中人,是指博弈中独立决策、独立承担结果的决策主体。一般地,记博弈方为 i,(一)博弈的参与者(一)博弈的参与者,2,1nN即共有n个博弈方。(三)博弈方的支付(三)博弈方的支付 每个博弈方从各种策略组合中获得的收益或效用,它是策略组合s的函数,所以也被称为支付函数。记博弈方i的支付函数为 。)(sui第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论 (四)博弈方的信息(四)博弈方的信息 信
6、息是博弈方有关博弈的知识。博弈方应尽可能多地收集有关博弈的信息,从而在采取策略进行决策时掌握主动。(五)博弈的次序(五)博弈的次序 很多时候各博弈方的决策又必须有先后之分,并且,在一些博弈中每个博弈方还要作不止一次的决策选择,这就免不了有一个次序问题。因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。(六)结果和均衡(六)结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情形。而均衡是指所有博弈方的最优策略的组合,记为其中,为第i个博弈方在均衡情况下的最优策略。),(*2*1*nssss*is四、博弈的分类四、博弈的分类(一)单人博弈、两人博弈和多人博弈
7、(一)单人博弈、两人博弈和多人博弈 按博弈中参与人数目的多少,将博弈分为单人博弈、两人博弈和多人博弈。单人博弈即只存在一个博弈方的博弈。两人博弈就是存在两个各自独立决策,但策略和利益具有相互依存与制约关系的博弈方的决策问题。多人博弈是指有三个或三个以上博弈方参加的博弈。第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论(二)有限博弈和无限博弈(二)有限博弈和无限博弈 根据各博弈方可选策略数量的多少,将博弈分为有限博弈和无限博弈。有限博弈是指各个博弈方的可选策略都是有限的博弈。无限博弈是指至少有某些博弈方的策略是无限多个的博弈。(三)零和博弈、常和博弈和变和博弈(三)零和博弈、常和博弈和
8、变和博弈 按参加博弈的各个博弈方从博弈中所获得的利益的总和,可将博弈划分为零和博弈、常和博弈和变和博弈。零和博弈是所有博弈方的得益总和始终为0的博弈。常和博弈是所有博弈方的得益总和始终为某一非零常数的博弈。零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。(四)静态博弈和动态博弈(四)静态博弈和动态博弈 按参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。静态博弈是指所有博弈方同时或可看作同时选择策略的博弈。动态博弈指的是参与人的行动有先后顺序,而且后行动者能够观察到先行动者所选择的行动的博弈。(五)完全信息博弈和不完全信息博弈(五)完全信息博弈和不完全信息博弈 根据参与人所掌握的信息可
9、以把博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指每个参与人对其他参与人的策略空间及支付函数有准确认识的博弈。不完全信息博弈是指至少部分博弈方不完全了解其他博弈方支付情况的博弈。(六)混合划分(六)混合划分 把参与人行动顺序和掌握的信息结合起来划分,可以得到四种类型的博弈,即:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与它们相对应的四种均衡是:纳什均衡,子博弈完美纳什均衡,贝叶斯纳什均衡,及完美贝叶斯纳什均衡。第二节第二节 完全信息静态博弈完全信息静态博弈一、博弈的标准式表述一、博弈的标准式表述 定义定义7.17.1 在一个n人博弈的标准式表述中,参与
10、者的策略空间分别为 ,收益函数分别为 则 表示此博弈。nSS,1nuu,1,;,11nnuuSSG二、纳什均衡二、纳什均衡 定义定义7.27.2 在博弈 中,如果策略组合 中任一博弈方i的策略 都是对其余博弈方的策略组合的最佳对策,也即:,;,11nnuuSSG),(1nss is),(),(111111niijiiniiiisssssusssssu对任意 都成立,则称 为G的一个“纳什均衡”。iijSs),(1nss 纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对于对手的策略有唯一的最佳反应,即 为严格纳什均衡,当且仅当对所有i,所有其他 ,均有:
11、isiijSs),(),(111111niijiiniiiisssssusssssu三、两人有限零和博弈三、两人有限零和博弈(一)两人有限零和博弈模型(一)两人有限零和博弈模型 两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个局中人得失之和总是等于零。第二节第二节 完全信息静态博弈完全信息静态博弈如果我们用 和 表示两人有限零和博弈的两个局中人,并设他们的策略集分别为 m21Sn21S,。局中人 的支付矩阵可记作:mnmnA1111 根据局中人 的支付矩阵A,结合博弈的一般式表述 ,我们可将这种博弈记作 。,;,11nnuuSSG,ASSG;(二)最优
12、纯策略与纳什均衡(二)最优纯策略与纳什均衡定义定义7.37.3 对于博弈 ,如果 ,ASSG;vjiijijijjimaxminminmax 则称 分别为局中人 和 的最优纯策略,称局势()为博弈G的鞍点,v称博弈 的博弈值。j,ij,i不难验证鞍点()是博弈 的纳什均衡,鞍点又称纯策略纳什均衡。j,i,ASSG;两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素 ,使对于一切 ,总有:jiami,2,1nj,2,1jijiijaaa第二节第二节 完全信息静态博弈完全信息静态博弈(三)最优混合策略与纳什均衡(三)最优混合策略与纳什均衡 局中人只能以一定的概率在其策略集中随机选择每个策
13、略,这种在纯策略空间上的概率分布为混合策略。设博弈 ,令 分别为局中人 和 在各自的策略集 和 中选择策略 和 的概率,则称,ASSG;m21Sn21Siiyx,SSij)(1mxxx011imiixx且)(1nyyy011jnjjyy且 分别为局中人 和 的一个混合策略。称 为局中人 的期望获得,为 的期望获得,而()为博弈的混合局势。又记 minjjiijyxxyE11)()(xyEy,x1,2,1,0),(|11miiimmxmixxxxxS1,2,1,0),(|11njjjnnynjyyyyyS分别为局中人 和 的混合策略集合。定义定义7.47.4 如果)y,E(xxy)(Emaxmi
14、n)xy(EminmaxmnnmSxSySySx则称 为局中人 和 的最优混合策略,称()为 G的最优混合局势,称 为博弈方 的期望所得。y,xy,x 最优混合局势 构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得将不会优于最优混合局势下的所得。yx,第二节第二节 完全信息静态博弈完全信息静态博弈(四)最优混合策略的求解方法(四)最优混合策略的求解方法 博弈 有混合意义下的解的充要条件是:存在 满足下列两个不等式组:,ASSG;及数,n*Sy mSxmixxnjxiimiiij2101211,njyymiyjjnjjij2101211,(1)(2)为了求解上述不等式组,可
15、将它们变为线性规划而求出博弈G的最优混合策略。不妨设 (否则令 ,则 一定可大于零)。令 ,则不等式组(1)等价于下面的线形规划:0dijijiixx miixS1minmixnjximiiij2102111,(3)同理,令,问题(2)就变为线形规划(4):njjyS1maxnjymiyjnjjij2102111,(4)第二节第二节 完全信息静态博弈完全信息静态博弈四、应用举例四、应用举例图图7-47-4市场进入阻挠博弈市场进入阻挠博弈 例例7-37-3 市场进入阻扰博弈。一种市场上存在一个垄断企业,另一个企业希望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有
16、两种策略可以选择:“进入”与“不进入”;垄断者也有两种策略:“容忍”与“反击”。他们的支付函数用以下双变量矩阵表示(见图7-4)。例例7-47-4 产量决策的古诺模型。古诺模型是博弈论中最经典的例子。古诺首先提出了这一模型。由于他采用了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡非常相似,因此纳什均衡也称古诺一纳什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。生产同质产品的两个企业同时选择各自的产量 ,市场需求决定价格 。单位成本均为常数c。求解其中的纳什均衡。)2,1(iqi)(21qqap 例例7-57-5 公共地悲剧模型。假设有n个人共同拥有的
展开阅读全文