博弈论讲义课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《博弈论讲义课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 讲义 课件
- 资源描述:
-
1、博弈论博弈论(Game TheoryGame Theory)第二章第二章 完全信息静态博弈完全信息静态博弈一一 博弈的基本概念及策略式表述博弈的基本概念及策略式表述二二 占优策略均衡占优策略均衡三三 重复剔除的占优均衡重复剔除的占优均衡四四 纳什均衡纳什均衡五五 混合策略均衡混合策略均衡六六 纳什均衡存在性及相关讨论纳什均衡存在性及相关讨论完全信息静态博弈完全信息:每个参与人对所有其他参与人的特征(包括策略空间、支付函数等)完全了解静态:所有参与人同时选择行动且只选择一次。同时:只要每个参与人在选择自己的行动时不知道其他参与人的选择,就是同时行动博弈分析的目的是预测均衡结果第二章 完全信息静态
2、信息博弈-纳什均衡一 博弈的基本概念及战略表述二 占优战略均衡三 重复剔除的占优均衡四 纳什均衡五 混合策略均衡 六 纳什均衡存在性及相关讨论小游戏两个同学一组,拿出纸和笔,在左和之两个同学一组,拿出纸和笔,在左和之间右做出你的选择。间右做出你的选择。游戏规则:如果两人同时选右,两人各游戏规则:如果两人同时选右,两人各得得8 8分;如果两人都选左,各得分;如果两人都选左,各得2 2分。如分。如果一人选左,一人选右,选左的人得果一人选左,一人选右,选左的人得1010分,选右的人得分,选右的人得0 0分。分。囚徒困境 假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房
3、间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。如何描述这个博弈?他们将如何选择?房地产开发项目房地产开发项目-假设有假设有A A、B B两家开发商两家开发商市场需求:可能大,也可能小市场需求:可能大,也可能小投入:投入:1 1亿亿案例案例v假定市场上有两栋楼
4、出售:假定市场上有两栋楼出售:需求大时,需求大时,每栋售价每栋售价1.41.4亿亿,需求小时,需求小时,售价售价7 7千万千万;v如果市场上只有一栋楼如果市场上只有一栋楼需求大时,需求大时,可卖可卖1.81.8亿亿需求小时,需求小时,可卖可卖1.11.1亿亿一、博弈的基本概念及策略表述博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;参与人:博弈论中选择行动以最大化自己效用的决策主体;行动:参与人的决策变量行动:参与人的决策变量策略:参与人选择行动的规则策略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的信息:参与人在博弈中的知识,特别是有关其他
5、参与人的特征和行动的知识特征和行动的知识支付函数:参与人从博弈中获得的效用水平支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优策略的组合均衡:所有参与人的最优策略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。用博弈规则决定均衡。111、参与人(Players):在博弈中独立决策、独立承担博弈结果的个人或组织。也称局中人。参与人的目的是通过选择行动或策略(策略)以最大化自己的支付(效用)水平。特殊的虚拟参与人自然,其实质是决定外生的
6、环境参数的概率分布的一种机制。i=1,n代表参与人;N代表自然。122、行动(Actions):是参与人在某个时点的决策变量。如开发、不开发就为两种行动。一般地,以一般地,以a ai i表示第表示第i i个参与人的一个特个参与人的一个特定行动,定行动,A Ai i=a ai i 表示可供表示可供i i选择的所有行选择的所有行动的集合动的集合(也称也称行动空间行动空间)。行动可以是离。行动可以是离散的,也可以是连续的。散的,也可以是连续的。在在n n人博弈中,人博弈中,n n个参与人的行动的有序集个参与人的行动的有序集a=(aa=(a1 1,a,a2 2,a,ai i,a,an n)称为一个称为
7、一个行动组合行动组合。133、信息(Information):信息是参与人有关博弈的知识,特别是有关自然的选择、其他参与人的特征和行动的知识。完全信息:每一个参与人对所有其他参与人完全信息:每一个参与人对所有其他参与人(包括自然包括自然)的特征、策略空间及支付函数有的特征、策略空间及支付函数有准确的知识。否则,就是不完全信息。准确的知识。否则,就是不完全信息。共同知识:指的是所有参与人知道,而且所共同知识:指的是所有参与人知道,而且所有参与人知道所有参与人知道有参与人知道所有参与人知道的知识。的知识。共同知识是一个非常强的假定。共同知识是一个非常强的假定。144、策略(Strategies):
8、也译为战略。是参与人在给定信息下的行动规则,它规定参与人在什么时候选择什么行动。策略告诉参与人如何对其他参与人的行动作出反应,因而策略是参与人的相机行动方案。s si i表示第表示第i i个参与人的一个特定策略,个参与人的一个特定策略,S Si i=s si i 代表第代表第i i个参与人的所有可选择的策略的集合个参与人的所有可选择的策略的集合(策略空间策略空间)。如果每个参与人选择一个策略,如果每个参与人选择一个策略,n n维向量维向量s=(ss=(s1 1,s,si i,s,sn n)称为一个称为一个策略组合策略组合。策略与行动的区别策略与行动的区别策略必须是完备的策略必须是完备的155、
9、支付(Payoff):指在特定策略组合下参与人的确定效用水平或损益水平,或者期望效用水平、期望损益水平。其单位依具体情况而定。u ui i表示第表示第i i个参与人的支付,个参与人的支付,u=(uu=(u1 1,u,ui i,u,un n)表表示示n n个参与人的个参与人的支付组合支付组合。在博弈中,一个参与人的支付不仅取决于自己的在博弈中,一个参与人的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选策略选择,而且取决于所有其他参与人的策略选择,所以择,所以u ui i是所有参与人的策略选择的函数:是所有参与人的策略选择的函数:u ui i=u=ui i(s(s1 1,s,si
10、i,s,sn n)166、结果(Outcome):结果是博弈分析者所感兴趣的所有东西,如均衡策略组合,均衡行动组合,均衡支付组合等。是个比较宽泛且界定不严格的概念。177、均衡(Equilibrium):均衡是所有参与人的最优策略的组合,记为:s*=(s1*,si*,sn*)。其中,si*是第i个参与人在均衡情况下的最优策略,即在给定其他人的策略选择下,使ui或E(ui)最大化的策略。s si i*满足如下条件:满足如下条件:u ui i(s(si i*,s,s-i-i*)u ui i(s(si i,s,s-i-i*)s si i s si i*,i=1,2,ni=1,2,n其中,其中,s s
11、-i-i*=(s=(s1 1*,s,si-1i-1*,s,si+1i+1*,s,sn n*),),表示除参与表示除参与人人i i之外其他所有参与人的最优策略组合。之外其他所有参与人的最优策略组合。18 指一组给定对手行为前提下对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。纳什均衡纳什均衡通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。一、博弈的基本概念及策略表述博弈的策略式表述:代表战略式表述博弈。,用数:、
12、每个参与人的支付函,间:、每个参与人的战略空、博弈的参与人集合:战略式表述给出:nnniiiuuSSGnisssuniSni,;),2,1),(3;,2,12);,2,1(,1111如:在两寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;博弈的战略式表述为:这里,分别为第i个企业的产量和利润),(),(;0,021221121qqqqqqGiiq和一、博弈的基本概念及策略表述有限博弈1、参与人的个数是有限的;2、每个参与人可选的策略是有限的。两个人有限博弈的策略表述可以用矩阵形式表述:下面看看如何用博弈的策略式来描述囚徒困境 -8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白
13、抵赖坦白抵赖-8大于-100大于-1(坦白,坦白)是纳什均衡(坦白,坦白)是纳什均衡案例-囚徒困境一、博弈的基本概念及策略表述下面看看如何用博弈的策略式来描述房地产开发博弈归纳起来有归纳起来有8 8种可能:种可能:需求大,你开发,他不开发;你利润8千万,他利润0。需求大,你不开发,他开发;你利润0,他利润8千万。需求大,你开发,他也开发;你和他利润各为4千万。需求大,你不开发,他也不开发;你和他利润各为0。需求小,你开发,他不开发;你利润1千万,他利润0。需求小,你不开发,他开发;你利润0,他利润1千万。需求小,你开发,他也开发;你和他的利润各为-3千万需求小,你不开发,他也不开发;你和他利润
14、各为0。40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发开发商B需求大的情况需求大的情况博弈的策略式表述-3000-3000,-3000-3000 10001000,0 00 0,100010000 0,0 0不开发开发商A开发不开发开发需求小的情况需求小的情况 开发商B博弈的策略式表述再想想在开始的小实验中你们是如何分析的?练习:市场进入有两个销售同样产品的销售商A和B打算进入某一区域性市场。由于这个区域市场对产品的需求是有限的,当他们都同时进入该区域市场时,他们各自占有的市场规模都偏小,从而造成1个单位的亏损;但是
15、,当只有一个销售商进入该区域性市场时,则获得1个单位的利润;当然,不进入市场时的利润为零。假如A和B同时进行决策或者他们在进行各自的决策时并不知道另一方的选择,B进入不进入A进入1,11,0不进入0,10,0表3.1 市场进入的静态博弈练习:智猪博弈有两头非常聪明的猪,一大一小,共同生活在一个猪圈里。在猪圈的一端放有一个猪食槽,在另一端安装有一个按钮,它控制着猪食的供应量,只要按一下,就会出现10个单位食物,但要付出2个单位的成本。每只猪都有按与不按两种选择。两只猪一起去按,然后一起回槽边进食,由于大猪吃得快可吃下8个单位的食物,小猪只能吃到2个单位食物。若大猪去按,小猪在槽边等候,则大猪由于
16、来回跑耽误时间只吃得6单位食物,小猪吃得4单位。若小猪去按,小猪只吃得1单位,大猪吃9单位两只猪都不去按,则什么也吃不到6,04,49,-10,0等待小猪大猪按等待按4大于10大于-1纳什均衡:大猪按,小猪等待各得四个单位(4,4)多劳者不多得智猪博弈 大猪 小猪 博弈股份公司中大股东股份公司中大股东 小股东小股东 监督监督纳什均衡:大股东担当监督经理的责任,小股东搭便车村中的富人村中的富人 穷人穷人 修路修路纳什均衡:大户修路改革中得到好处多的改革中得到好处多的 少的少的 改革改革股市的大户股市的大户 小户小户 炒股炒股纳什均衡:大户搜集信息,小户跟大户性别战2,10,00,01,2芭蕾女男
17、足球芭蕾足球纳什均衡:足球,足球;芭蕾,芭蕾先动优势斗鸡博弈(懦夫博弈)两个司机驾车相向行驶,每个人可以在相撞前转向一边而避免相撞,但这将使其被称作“懦夫”,如果两人都向前,车毁人亡;若一人转向而另一人选择继续向前,则向前的司机将被称作“勇士”。-3,-3 2,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进斗鸡博弈村子里有两户富户,有两种可能:一家修,另一家就不修;一家不修,另一家就得修。冷战期间美苏抢占地盘:一方抢占一块地盘,另一方就占另一块。夫妻吵架,一方厉害,另一方就出去躲躲。注意:在混合战略纳什均衡条件下,也可能两败俱伤。协调博弈20,20 0,00,05,5一般用户
18、供应商先进一般先进第二章 完全信息静态信息博弈-纳什均衡n一 博弈的基本概念及策略表述n二 占优策略均衡n三 重复剔除的占优均衡n四 纳什均衡n五 纳什均衡应用举例二 占优策略均衡 案例-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖-8大于-100大于-1-8大于-100大于-1抵赖是A的严格劣策略抵赖是B的严格劣策略 类似的囚犯困境 排队排队 闯红灯闯红灯 价格战价格战二 占优策略均衡占优策略:不论其他人选择什么策略,参与人的最优策略是唯一的,这样的最优策略称为“占优策略”(dominant strategy)。被称为劣战略对应的,所有向量。所有参与人的战略
19、组成之外的表示由除,(优战略,个参与人的(严格)占是第*,111*),()(),iiiiiiiiiiniiiissssssussuisssssis二 占优策略均衡占优策略均衡定义:在博弈的策略表达式中,如果对于所有的i,Si*是i的占优策略,下列策略组合称为占优策略均衡:),(*1*nsss46一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与但在一些特殊的博弈中,一个参与人的最优策略可能可以不依赖于其他参与人人的最优策略可能可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择的策略选
20、择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的什么策略,他的最优策略是唯一的,这样的最优策略被称为最优策略被称为“占优策略占优策略”。47如果博弈中,某个参与人有占优策略,如果博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称那么该参与人的其他可选择策略就被称为为“劣策略劣策略”。在一个博弈里在一个博弈里,如果所有参与人都有占如果所有参与人都有占优策略存在,那么占优策略均衡是可以优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理预测到的唯一的均衡,因为没有一个理性的参与人会选择劣策略。所以在囚徒性的参与人会选择劣策略。所以在囚徒困境博弈里,
21、困境博弈里,坦白,坦白坦白,坦白 是占优策略是占优策略均衡。均衡。二 占优战略均衡第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地下达提高下属的任务定额,弄得所有的人都人心惶惶。投弹手尤塞里安不想成为胜利前夕的最后一批牺牲品,千方百计逃避任务。他的上级问:“假如,我的士兵都象你这样想,这仗还怎么打?”,可尤塞里安回答到:“那我若不这么想,岂不成了一个大傻瓜?”二 占优策略均衡注意:如果所有人都有(严格)占优策略存在,那么占优策略均衡就是可以预测的唯一均衡。占优策略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,不要求理性是共同知识)。
22、为什么?二 占优策略均衡40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的策略式表述A严格劣策略B严格劣策略 5,14,49,-10,0等待小猪大猪按等待按智猪博弈等待是小猪的严格占优策略大猪有无严格占优策略?4大于10大于-1下面参与者有占优策略吗?性别战2,10,00,01,2芭蕾女男足球芭蕾足球斗鸡博弈-3,-3 2
23、,00,20,0退BA进退进独木桥协调博弈20,20 0,00,05,5一般用户供应商先进一般先进第二章 完全信息静态信息博弈-纳什均衡n一 博弈的基本概念及策略表述n二 占优策略均衡n三 重复剔除的占优均衡n四 纳什均衡n五 纳什均衡应用举例三 重复剔除的占优均衡重复剔除严格劣策略:思路:首先找到某个参与人的劣策略(假定存在),把这个劣策略剔除掉,重新构造一个不包含已剔除策略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣策略,一直重复这个过程,直到只剩下唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。三 重复剔除的占优均衡注意:与占优策略均衡
展开阅读全文