第十一章博弈模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十一章博弈模型课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一章 博弈模型课件 第十一 博弈 模型 课件
- 资源描述:
-
1、第十一章第十一章 博弈模型博弈模型11.1 进攻与撤退的抉择进攻与撤退的抉择11.2 让报童订购更多的报纸让报童订购更多的报纸11.3 “一口价一口价”的战略的战略 11.4 不患寡而患不均不患寡而患不均 11.5 效益的合理分配效益的合理分配 11.6 加权投票中权力的度量加权投票中权力的度量 单一决策主体单一决策主体决策变量决策变量目标函数目标函数约束条件约束条件决策主体的决策决策主体的决策行为发生直接相行为发生直接相互作用互作用(相互影响相互影响)博弈模型博弈模型非合作博弈非合作博弈合作博弈合作博弈三要素三要素博弈模型博弈模型(Game Theory)多个决策主体多个决策主体优化模型优化
2、模型(Optimization)决策问题(Decision Problem)静态、动态静态、动态信息完全、不完全信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛军事、政治、经济、企业管理和社会科学中应用广泛 1944年年6月初,盟军在诺曼底登陆成功月初,盟军在诺曼底登陆成功.到到8月初的形势:月初的形势:背背景景11.1 进攻与撤退的抉择进攻与撤退的抉择双方应该如何决策双方应该如何决策?强 化强 化缺口缺口盟军盟军(预备队预备队)撤退撤退进攻进攻德军德军盟军盟军(加加)盟军盟军(英英)盟军盟军(美一美一)盟 军盟 军(美三美三)东进东进原地原地待命待命模型假设模型假设 博弈参与者
3、为两方(盟军和德军)博弈参与者为两方(盟军和德军)盟军有盟军有3种使用其预备队的行动:强化缺口,原地种使用其预备队的行动:强化缺口,原地待命,东进;德军有待命,东进;德军有2种行动:向西进攻或向东撤退种行动:向西进攻或向东撤退.博弈双方博弈双方完全理性完全理性,目的都是使战斗中己方获得,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多的净胜场次(胜利场次减去失败场次)尽可能多.盟军胜盟军胜1场场盟军败盟军败2场场东进东进无战斗无战斗盟军胜盟军胜2场场原地待命原地待命无战斗无战斗盟军胜盟军胜1场场强化缺口强化缺口向东撤退向东撤退向西进攻向西进攻盟军盟军德军德军完全信息完全信息静
4、态博弈静态博弈 共同知识共同知识(以上信息双方共有以上信息双方共有)双方同时做出决策双方同时做出决策博弈模型博弈模型 博弈参与者集合博弈参与者集合N=1,2(1为盟军,为盟军,2为德军为德军)用用u1(a1,a2)表示对盟军产生的结果,即净胜场次,表示对盟军产生的结果,即净胜场次,称为盟军的称为盟军的效用函数效用函数.盟军胜盟军胜1场场盟军败盟军败2场场东进东进无战斗无战斗盟军胜盟军胜2场场原地待命原地待命无战斗无战斗盟军胜盟军胜1场场强化缺口强化缺口向东撤退向东撤退向西进攻向西进攻盟军盟军德军德军12020123ijmM 盟军行动盟军行动a1 A1=1,2,3(强化缺口强化缺口/原地待命原地
5、待命/东进东进);德军行动德军行动a2 A2=1,2(进攻进攻/撤退撤退)。(行动:即纯战略行动:即纯战略)支付矩阵支付矩阵(Payoff Matrix)完全竞争完全竞争:零和博弈零和博弈 (常数和博弈常数和博弈)u2(a1,a2)对应对应-M博弈的解博弈的解的概念:的概念:纳什均衡纳什均衡(NE:Nash Equilibrium)不存在不存在(纯纯)NE.2,1),(),(,3,2,1),(),(22*12*2*121*211*2*11aaauaauaaauaau(纯战略纯战略)纳什均衡纳什均衡Nash:1994年获诺贝尔经济学奖年获诺贝尔经济学奖NE:单向改变战略不能提高自己效用,单向改变
6、战略不能提高自己效用,即每一方的战略即每一方的战略对于他方的战略而言都是最优的对于他方的战略而言都是最优的,称为称为最优反应最优反应.12020123ijmM(纯纯)NE:a*=(a1*,a2*)=(2,2)1,12,21,22,21,11,1M非常数和非常数和博弈博弈(双矩双矩阵表示阵表示)混合战略(策略:混合战略(策略:Strategy)盟军的盟军的混合战略混合战略集集 期望收益期望收益盟军盟军德军德军 S1=p=(p1,p2,p3)|311,10iiipp德军的德军的混合战略混合战略集集 S2=q=(q1,q2)|211,10iiiqqTSppMq1maxTSqpMq2min完全信息静态
7、博弈完全信息静态博弈有限博弈矩阵博弈有限博弈矩阵博弈(2人人)零和博弈零和博弈常数和博弈常数和博弈),(),(),(1231211qpUqpUqmppMqqpUijjijiT模型求解模型求解理性推理:理性推理:不管自己怎么做,另一方总是希望尽量不管自己怎么做,另一方总是希望尽量使自己得分尽量低使自己得分尽量低.(二人零和博弈,完全竞争)(二人零和博弈,完全竞争)盟军盟军德军德军TSppMq1maxTSqpMq2min线性线性规划规划 从一个给定的战略中期望得到的赢得,总是从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!采用该策略时他们可能得到的最坏的赢得!盟军可以用
8、盟军可以用min pM来衡量策略来衡量策略p的好坏的好坏 max U1(p)=min pM min U2(q)=max MqT 德军可以用德军可以用max MqT来衡量策略来衡量策略q的好坏的好坏(p*,q*):混合混合(策略策略)纳什均衡纳什均衡(Mixed NE)p2*=3/5,p3*=2/5q1*=1/5,q2*=4/5最优值均为最优值均为2/5占优占优(dominate):盟军的行动:盟军的行动2占优于占优于1 (前面的非常数和博弈(前面的非常数和博弈M类似)类似)混合策略似乎不太可行混合策略似乎不太可行!但但概率概率可作为可作为参考参考.-现实现实:盟军让预备队原地待命(行动:盟军让
9、预备队原地待命(行动2),而德军),而德军没有选择撤退(行动没有选择撤退(行动2),结果德军大败),结果德军大败.模型评述模型评述 博弈规则博弈规则至关重要的,如参与人决策的时间顺序、至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等决策时拥有哪些信息等.110100M多人多人(或非常数和或非常数和)博弈问题,一般不能用上面的线性博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解规划方法求解,而通过纳什均衡的定义求解.小结:博弈模型的基本要素小结:博弈模型的基本要素 参与人参与人 理性假设理性假设 行动顺序(静态、动态)行动顺序(静态、动态)信息结构(完全、不完全)信息
10、结构(完全、不完全)行动空间(及战略空间)行动空间(及战略空间)效用函数效用函数 参与者完全理性参与者完全理性(最大化效用最大化效用)其他因素其他因素纳什均衡纳什均衡单向改变战略不能提高自己效用单向改变战略不能提高自己效用11.2 让报童订购更多的报纸让报童订购更多的报纸 报报童童模模型型回回顾顾订购价订购价w,零售价,零售价p,处理价,处理价v(pwv0)需求量:密度函数需求量:密度函数f(x)、分布函数、分布函数F(x),F(0)=0订购订购Q份报纸,期望销售量为份报纸,期望销售量为 QQQQQdxxFQQFQdxxFxxFdxxQfdxxxfQS0000)()(1()(|)()()()(
11、期望存货量期望存货量QdxxFQSQQI0)()()(期望利润期望利润 QvwQSvpwQQvIQpSQG)()()()()()(最优订购量最优订购量Qr vpwpQFr)(Qr(w)11.2 让报童订购更多的报纸让报童订购更多的报纸 问问题题假设报社报纸成本价为假设报社报纸成本价为c,wcv)()(MaxwQcwrcwvpwpFcw1)(w*完全信息动态博弈:常称完全信息动态博弈:常称Stackelberg Game(两阶段两阶段)子博弈完美均衡子博弈完美均衡:(w*,Qr(w)vpcpQF)(*一般一般w*c Qr(w*)wbv)bpwpvpcp)()(bpvpvcbbwwb)()()()
12、()()()()()()()(*bUbUvpvbbUbUbUvpbpbUQvcQSvpbUbUsrssrrsr回收协议模型回收协议模型 模型二模型二 回收数量协议回收数量协议 报社回收报社回收 达到协调达到协调报童回收报童回收,报童利润,报童利润,报社利润报社利润;利润任意分配都可达到利润任意分配都可达到 按批发价回收,比例为按批发价回收,比例为 QQQQQdxxFdxxfxQdxxQfQI)1()1()1(01)()()()()(QdxxFQIQIQI)1(012)()()()(报童利润报童利润QQQrdxxFvpdxxFQwpwQQvIQwIQpSQwU)1(0)1(21)()()()()
13、()()(),(0),(rQrQQwU0)1()1)()(1)(rrQFvwQFwpvpcpQF)(*)1()1)()/()(1)(*QFvwvpcpwp)1()1)()()()(*QFvpvcvcvpvwwq回收协议模型回收协议模型 模型评述模型评述 协议参数的确定:协议参数的确定:不能单方决定不能单方决定双方谈判(合作博弈)双方谈判(合作博弈)还有很多其他类型的协议,也可以达到协调还有很多其他类型的协议,也可以达到协调一种更简单的协议一种更简单的协议批发价批发价w成本成本c收取一定加盟费收取一定加盟费如何评价比较协议的优缺点?如何评价比较协议的优缺点?是否能达到协调是否能达到协调是否能任意
14、分配利润是否能任意分配利润协议执行成本有多高协议执行成本有多高11.3 “一口价一口价”的战的战略略 背景背景 为了节省为了节省“讨价还价讨价还价”时间,考虑时间,考虑“一口价一口价”模式模式.双方同时报价双方同时报价:若买价:若买价卖价,则以均价成交卖价,则以均价成交;否则不成交否则不成交.问题问题 双方应如何报价?双方应如何报价?双方总能成交吗?(效率估计)双方总能成交吗?(效率估计)“讨价还价讨价还价”很浪费买卖双方的宝贵时间很浪费买卖双方的宝贵时间.模型假设与建立模型假设与建立 卖方知道物品对自己的价值,但买方不知道卖方知道物品对自己的价值,但买方不知道.买方知道物品对自己的价值,但卖
15、方不知道买方知道物品对自己的价值,但卖方不知道.双方都知道(如猜出)对方价值的分布信息双方都知道(如猜出)对方价值的分布信息.卖方价值卖方价值vs,买方价值买方价值vb,均服从均服从U0,1(均匀分布均匀分布)卖方报价卖方报价ps,买方报价买方报价pb,pb ps时成交价时成交价p(pb+ps)/2成交效用:卖方成交效用:卖方U1=p-vs,买方买方U2=vb p;不成交不成交:0双方完全理性双方完全理性(最大化自己的期望效用最大化自己的期望效用).以上为双方的共同知识以上为双方的共同知识.卖方报价卖方报价ps ps(vs)买方报价买方报价pb pb(vb)双方战略双方战略战略组合战略组合(p
16、s(vs),pb(vb)何时构成均衡?何时构成均衡?定义在定义在0,1区间上、取值也区间上、取值也在在0,1区间上的非减函数区间上的非减函数.不完全信息静态博弈(静态贝叶斯博弈)不完全信息静态博弈(静态贝叶斯博弈)贝叶斯纳什均衡贝叶斯纳什均衡单向改变战略不能单向改变战略不能提高自己效用提高自己效用.信息非对称(不完全信息)信息非对称(不完全信息)模型假设与建立模型假设与建立均衡条件均衡条件具体战略具体战略(函数函数)形式不同,均衡就可能不同形式不同,均衡就可能不同.单一价格战略单一价格战略卖方:卖方:买方:买方:双方战略互为最优反应,所以构成双方战略互为最优反应,所以构成贝叶斯纳什均衡贝叶斯纳
17、什均衡!)(Pr*2)(|)(maxsbbssbbbbsppvpvpvpvpEps)(Pr*2)(|)(maxssbssbssbbpvppvppvpEpvbxvxvxvpssss,1,)(xvxvxvpbbbb,0,)(模型假设与建立模型假设与建立单一价格战略效率为单一价格战略效率为x(1-x)/0.50.5x0.5效率最大效率最大(1/2)对给定的对给定的(vs,vb),当,当vsxj=1-xi时,时,i(x)xi-i(xi-xj)=i-(2i-1)xi关于关于xi的系数非正的系数非正(过分(过分“愧疚愧疚”)效用函数效用函数财富总额为财富总额为1接受提议:甲乙所得接受提议:甲乙所得x1=1
18、-s,x2=s;否则:;否则:x1=x2=0 ijixxxxxxxUjiiijiii3,2,10,max0,max),(210ii2/1i模型求解模型求解如果不接受,则如果不接受,则x1=x2=0;U1(s)=U2(s)=0.若若s1/2,则则x2 x1乙的最优反应乙的最优反应乙的最优反应(给定乙的最优反应(给定s)如果接受,则如果接受,则x1=1-s,x2=s.若若s1/2,则则x2x1U2(s)00,max0,max),(21jiiijiiixxxxxxxU1/20)12()(22sssU2222)21()21()(ssssU s)21/()(222s当当 s 接受接受;否则,不接受否则,
19、不接受)(2s2/1)(02s易知易知(s1/2,两者一致两者一致)2/12模型求解模型求解Case 1:甲知道乙的甲知道乙的2 若若s1/2,则则x2 x1甲的决策甲的决策s=1/2时达到最大值时达到最大值1/2甲的决策甲的决策(只需考虑乙接受情形只需考虑乙接受情形)12(1)(11sssU 若若s1/2,则则x2 x1但但 s)(2sssssU)12(1)21(1)(1111)21/()(222*ss2/11均衡均衡:(s*,接受接受)s*严格小于严格小于50%;是乙的是乙的“愤怒愤怒”系数系数2的增函数的增函数.模型求解:甲的决策模型求解:甲的决策Case 2:甲不知道乙的甲不知道乙的2
20、,但知道但知道2知道分布知道分布F(2)若若s1/2,则则x2 x1甲的决策甲的决策 若若s1/2,则则x2 x1U1(s)=1-s-1(2s-1)同前同前期望效用期望效用乙接受概率乙接受概率s*1)(min0)(maxFF)(,1)()(),21/()(,0sssssssFssp)(,)12(1)()(),21/()12(1)(,0)(11111ssssssssFssssEU)21/()12(1 11)()(ssFsMaxsss模型解释模型解释 甲永远不会提出大于甲永远不会提出大于/的方案的方案s 乙拒绝过小的方案乙拒绝过小的方案s很好地解释了实际中的最后通牒博弈很好地解释了实际中的最后通牒
21、博弈 乙接受概率随乙接受概率随s增加不减增加不减参考文献参考文献11.5 效益的合理分配效益的合理分配11321xxx457323121xxxxxx例例甲乙丙三人合作经商,若甲乙合作获利甲乙丙三人合作经商,若甲乙合作获利7元,元,甲丙合作获利甲丙合作获利5元,乙丙合作获利元,乙丙合作获利4元,元,三人合作获利三人合作获利11元元.又知每人单干获利又知每人单干获利1元元.问三人合作时如何分配获利?问三人合作时如何分配获利?记甲乙丙三人分配为记甲乙丙三人分配为),(321xxxx 解不唯一解不唯一(5,3,3)(4,4,3)(5,4,2)1,321xxx)(1Ivxniiniivxi,2,1),(
22、2121210sssvsvssvv),()()()(,2,1nI集合(1)Shapley合作对策合作对策满足实函数,子集)(svIs I,v n人合作对策,人合作对策,v特征函数特征函数),(21nxxxxn人从人从v(I)得到的分配,满足得到的分配,满足v(s)子集子集s的获利的获利!)!1()!()(nssnswniisvsvswxiSsi,),()()(21公理化方法公理化方法 s 子集子集 s中的元素数目,中的元素数目,Si 包含包含i的所有子集的所有子集)(sw由由 s 决定的决定的“贡献贡献”的权重的权重 Shapley值值)()(isvsv i 对合作对合作s 的的“贡献贡献”)
23、(siShapley合作对策合作对策三人三人(I=1,2,3)经商中甲的分配经商中甲的分配x1的计算的计算 1/3 1/6 1/6 1/3)1()()(svsvsw)(sws)1()(svsv)1(sv)(sv1S1 1 2 1 3 I1 7 5 11 0 1 1 4 1 6 4 7 1/3 1 2/3 7/3x1=13/3类似可得类似可得 x2=23/6,x3=17/6)1()()(11svsvswxSs1 2 2 3合作对策的应用合作对策的应用 污水处理费用的合理分担污水处理费用的合理分担20km38km河流河流三城镇地理位置示意图三城镇地理位置示意图123 污水处理,排入河流污水处理,排
24、入河流.三城镇可单独建处理厂,三城镇可单独建处理厂,或联合建厂或联合建厂(用管道将污水用管道将污水由上游城镇送往下游城镇由上游城镇送往下游城镇).Q1=5Q3=5Q2=3Q污水量,污水量,L管道长度管道长度建厂费用建厂费用P1=73Q0.712管道费用管道费用P2=0.66Q0.51L230)3(,160)2(,230573)1(712.0CCC35020566.0)35(73)2,1(51.0712.0C36538366.0)53(73)3,2(51.0712.0C46358566.0)55(73)3,1(51.0712.0C460)3()1(CC污水处理的污水处理的5 种方案种方案1)单独
25、建厂)单独建厂620)3()2()1(1CCCD总投资总投资2)1,2合作合作3)2,3合作合作4)1,3合作合作580)3()2,1(2CCD总总投资投资595)3,2()1(3CCD总投资总投资合作不会实现合作不会实现55638)35(66.020566.0)535(73)3,2,1(51.051.0712.05CD5)三城合)三城合作总投资作总投资D5最小最小,应联合建厂应联合建厂 建厂费:建厂费:d1=73(5+3+5)0.712=453 12 管道费:管道费:d2=0.66 50.51 20=30 23 管道费:管道费:d3=0.66 (5+3)0.51 38=73D5城城3建议:建
展开阅读全文