混合策略课件(-35张).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《混合策略课件(-35张).ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 混合 策略 课件 35
- 资源描述:
-
1、2022-12-28张醒洲,大连1混合策略找到不确定情况下的最优反应 2022-12-28张醒洲,大连2定义 在一个n人博弈的标准式表述中,参与人的策略 空间为 ,收益函数为 ,我们用 表示此博弈。纳什均衡 博弈的标准式和纳什均衡1,nSSnuu,1nnuuS,;,SG112022-12-28张醒洲,大连3举例:猜硬币 模型 两个参与人 1,2 每个参与人的策略 空间为H,T 收益 零和 试着找到纳什均衡 参与人2参与人 1 正面 背面正面-1,1 1,-1背面 1,-1-1,1 两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面
2、),则参与人2将赢得参与人1的硬币;否则,参与人1将赢得参与人2的硬币。猜硬币 如果参与人的策略一致(正面,正面)或(反面,反 面)则参与人1会偏向于改变策略;但是如果两者策略不一致(正面,反面)或(反面,正 面)则参与人2偏向于改变策略。参与人 2正面背面正面-1,1 1,-1参与人 1背面 1,-1-1,1 没有一组策略满足(NE)2022-12-28张醒洲,大连5石头-剪刀-布博弈 此博弈也不存在纳什均衡 无论参与人1选择哪个纯策略,参与人都可以打败他。参与人 2石头剪刀布石头0,01,00,1参与人 1剪刀0,10,01,0布1,00,10,02022-12-28张醒洲,大连6猜对方策
3、略 猜硬币博弈一个非常突出的特点是每个参与人都试图猜中对方的策略。任何这一类都没有纳什均衡 至少不存在1.1.C节所定义的纳什均衡 因为这一类博弈的解包含了一个参与人对其他参与人行为的不 确定。现在我们介绍混合策略2022-12-28张醒洲,大连7纯策略,混合策略 考虑标准式博弈G=S1,Sn;u1,un 此后我们定义Si 中的策略为参与人 i 的纯策略 在本节的完全信息同时行动博弈中,一个参与人的纯策 略就是他可以选择的不同行动;例如,在猜硬币的博弈中,Si 包含两个纯策略:正面 和背面。参与人i的一个混合策略是在其策略空间Si中的(一些或全部)策略的概率分布。2022-12-28张醒洲,大
4、连8概率和信念 随机事件事件有明确定义事件有明确定义.我们可以区分不同的事件我们可以区分不同的事件.在进行观察或试验前在进行观察或试验前,我们不能肯定的说一个具体的事我们不能肯定的说一个具体的事件会出现件会出现.我们可以判断哪些事件有可能出现我们可以判断哪些事件有可能出现,并且能并且能判断每一个事件出现的可能性大小判断每一个事件出现的可能性大小.概率事件的概率是对一次随机试验中该事件出现的可能性事件的概率是对一次随机试验中该事件出现的可能性的度量的度量如果对可能性的度量以某种客观规律或物质属性为基如果对可能性的度量以某种客观规律或物质属性为基础础,我们就用我们就用“概率概率”一词一词如果对可能
5、性的度量以个人经验、主观判断为基础,如果对可能性的度量以个人经验、主观判断为基础,就用就用“主观概率主观概率”、“信念信念”、“置信度置信度”等术语等术语2022-12-28张醒洲,大连9概率分布 样本空间:=1,2,n,试验中可能出现的所有基本结果i的集合 事件由基本结果组成,是样本空间的子集。如果在试验中事件A中的一个结果出现了,就说事件A发生。概率分布就是将总概率P()1分解到所有可能的样本点或事件上的一种方式2022-12-28张醒洲,大连10概率的公理化定义 概率测度 样本空间上的一个概率测度是的子集的一个函数P(),它满足三条公理:公理(1)0P(E)1,对任一事件E 公理(2)P
6、()1 公理(3)对任何一列互不相容的事件E1,E2,.,即EiEj=(空集),ij,有 我们称P(E)为事件E的概率。11P(E)P(E)iiii2022-12-28张醒洲,大连11混合粗略:猜硬币 参与人i的一个混合策略是在其策略空间Si中的策略的概率分布 举例:猜硬币 S2 包含两个纯策略即正面和反面,因此参与人2的一个混合策略为概率分布(q,1-q),其中q 为正面朝上的概率,1-q 是背面朝上的概率,并且 0 q 1.参与人 2参与人 1正面 q背面 1-q正面-1,1 1,-1背面 1,-1-1,1混合策略(0,1)是背面朝上的纯策略;类似地,混合策略(1,0)是正面朝上的纯策略。
7、2022-12-28张醒洲,大连12混合策略:举例 参与人2 的一个混合策略为概率分布(q,r,1-q-r),其中 q表示出左的概 率,r 表示出中的概率,1-q r 表示出右的概率。和前面一样,0 q 1,并且还应满足 0 r 1 和 0 q+r 1。混合策略(1/3,1/3,1/3)表示参与人出左、中、右的概率相同,而 (1/2,1/2,0)表示出左、中的概率相同,但不可能出右。参与人 2左中中右 上1,01,20,1参与人 1 下0,30,12,0 图 1.1.1 at Pager 6参与人的一个纯策略只 是其混合策略的一个特 例,例如参与人2出左的 纯策略可表示为混合策 略(1,0.0
8、)。2022-12-28张醒洲,大连13混合混合策略策略:定义定义 更为一般地,假定参与人 i有K个纯策略:Si=si1,siK.参与人 i的一个混合策略是一个概率分布(pi1,piK),其中 piK表示对所有k=1,K,参与人i选择策略 sik的概率,由于 pik是一个概率,对所有k=1,K,有 0pik 1且 pi1+piK=1。我们用 pi表示基于Si 的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用 si表示 Si 内任意一个纯策略。定义 对标准式博弈 ,假设S i=si1,siK 。那么,参与人i的一个混合策略为概率分布 pi=(pi1,piK),其中对所有 k=1,
9、K,0pik 1,且 pi1+piK=1。nnuuS,;,SG112022-12-28张醒洲,大连14参与人 j的混合策略解释 当参与人 i不确定参与人 j会如何行动时,他可以把参与人 j的混合策略作为参与人 j行动的一个解释。参与人 2参与人 1正面 q背面 1-q正面-1,1 1,-1背面 1,-1-1,1例如:猜硬币 假设参与人1相信参与人会以q 的概率出正面,以1-q 的概率出背面;也就是说,1 相信2的混合策略是(q,1-q)。2022-12-28张醒洲,大连15猜猜硬币另一面的颜色 这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、3.123 现在从
10、中任取一枚放在桌面,结果你看到白色。请猜一下,这枚硬币的背面是什么颜色?统计频数 红色 人 白色 人 共 人 计算频率 红色%白色%2022-12-28张醒洲,大连16猜猜哪个硬币被标记了1/21/31/31/21/21/21/21/21/3NC2C1C3 这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、3号硬币123 现在从中任取一枚放在桌面,结果你看到白色。请猜一下,这是几号硬币?2022-12-28张醒洲,大连17猜猜哪个硬币被标记了 提示:根据条件“看到一面白色”,只考虑前两枚硬币(拿走两面全是红色的第三枚硬币).区分第一枚硬币的两个面,尽管它们同色同
展开阅读全文