随机演化博弈的算法研究及其在复杂网络中的应用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《随机演化博弈的算法研究及其在复杂网络中的应用课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 演化 博弈 算法 研究 及其 复杂 网络 中的 应用 课件
- 资源描述:
-
1、随机演化博弈的算法研究随机演化博弈的算法研究及其在复杂网络中的应用及其在复杂网络中的应用 汇报提纲2进化博弈的进化博弈的基本内容基本内容我们的我们的研究工作研究工作随机进化博弈所面临的随机进化博弈所面临的理论困难理论困难在在计算机网络计算机网络中的应用中的应用在在复杂网络复杂网络中的应用中的应用我们的我们的未来研究工作未来研究工作演化博弈论的产生背景1990-Present1980-19901950-19511944 1944, J. von. Neumann和和Oskar. Morgenstern奠定了奠定了经典博弈理论的基础经典博弈理论的基础。1950-1951, J. Nash提出了非合
2、作博弈的提出了非合作博弈的纳纳什均衡什均衡的概念。的概念。二十世纪八十年代,博弈论成为二十世纪八十年代,博弈论成为经济学领经济学领域当中的通用理论工具,域当中的通用理论工具,例如:分析不同例如:分析不同厂商的合作、联盟、竞争与冲突;工业组厂商的合作、联盟、竞争与冲突;工业组织的形成;经济契约的签订;拍卖机制的织的形成;经济契约的签订;拍卖机制的设计;不对称信息的市场分析等等。设计;不对称信息的市场分析等等。标准式博弈 标准式博弈由三种元素组成:标准式博弈由三种元素组成:参与人参与人、纯策略纯策略、收益函数收益函数纯策略纯策略;混合策略混合策略是在纯策略上的概率分布。是在纯策略上的概率分布。纳什
3、均衡纳什均衡:如果博弈中的任意一个参与人选择的纯策略,都是对其他人:如果博弈中的任意一个参与人选择的纯策略,都是对其他人选择的纯策略的最优反应,那么这样的纯策略组合为一个标准式博弈的选择的纯策略的最优反应,那么这样的纯策略组合为一个标准式博弈的纯策略纳什均衡:纯策略纳什均衡:*,(,)(,).iiiiiiiissussus s严格占优策略严格占优策略:任意给定其他博弈参与人的纯策略选择组合,如果某:任意给定其他博弈参与人的纯策略选择组合,如果某一个特定的纯策略满足如下条件,则称这个纯策略为严格占优策略:一个特定的纯策略满足如下条件,则称这个纯策略为严格占优策略:*,(,)( ,)iiiiiii
4、iisss u s su s s演化博弈论的产生背景二十世纪八十年代之后,研究工作围二十世纪八十年代之后,研究工作围绕着修正经典博弈论中的绕着修正经典博弈论中的完全理性假完全理性假设设展开研究,并试图为展开研究,并试图为纳什均衡纳什均衡的概的概念寻找念寻找动态结构下的解释动态结构下的解释。研究表明:。研究表明:经典博弈论在应用中遇到困难,主要经典博弈论在应用中遇到困难,主要是存在三种缺陷:是存在三种缺陷:假设缺陷假设缺陷、方法缺方法缺陷陷、实证缺陷实证缺陷。为了解决经典博弈论的以上三种缺陷,为了解决经典博弈论的以上三种缺陷,从从二十世纪九十年代发展了二十世纪九十年代发展了演化博弈演化博弈论的论
5、的研究工作。研究工作。演化博弈论的产生背景 假设缺陷假设缺陷:完全理性假设,即假定参与人完全了解其对手:完全理性假设,即假定参与人完全了解其对手的策略集合以及使用每个策略的概率,同时也了解博弈规的策略集合以及使用每个策略的概率,同时也了解博弈规则与收益结构。参与人也具有通过精确计算推理得到最优则与收益结构。参与人也具有通过精确计算推理得到最优策略的能力。但现实中的参与人只具有策略的能力。但现实中的参与人只具有有限理性有限理性(Bounded Rationality)。 方法缺陷方法缺陷:经典博弈论关注的重点是如何求解博弈的平衡:经典博弈论关注的重点是如何求解博弈的平衡结构,但不能解释博弈的各参
6、与方是如何通过参与博弈而结构,但不能解释博弈的各参与方是如何通过参与博弈而趋向于这些均衡状态的趋向于这些均衡状态的(H.P. Young)。 实证缺陷实证缺陷:多数解析型博弈论的预测都是基于理想的假设:多数解析型博弈论的预测都是基于理想的假设和精确的数学推导,需要实证的经验规律来充实经典博弈和精确的数学推导,需要实证的经验规律来充实经典博弈论论(Colin Camerer)。演化博弈论的研究意义 演化博弈研究具有普遍意义的演化博弈研究具有普遍意义的有限理性有限理性的参与人:的参与人:惰性惰性、近近视视、遗传遗传、突变突变、变异。变异。Kandori, Mailath和和Rob (1993) 演
7、化博弈不仅关注博弈的演化博弈不仅关注博弈的稳定结构稳定结构,还通过引入,还通过引入不同的动态不同的动态机制机制研究博弈系统的研究博弈系统的稳定结构稳定结构和和演化过程演化过程之间的关系;之间的关系; 演化博弈模型可以和演化博弈模型可以和个人学习机制个人学习机制相结合,可以探讨相结合,可以探讨微观层微观层面上参与人的互动面上参与人的互动和和宏观层面上群体的均衡现象宏观层面上群体的均衡现象之间的关系之间的关系; 演化博弈的假设条件与建模方法更加有利于进行演化博弈的假设条件与建模方法更加有利于进行模拟实验模拟实验来来获得获得实证数据实证数据。演化博弈论的文献综述 溯源溯源1798,Malthus的的
8、“人口论人口论”;1887,Darwin的的“物种起源物种起源”; 当代演化博弈论当代演化博弈论在生物学上的起源在生物学上的起源 Lewontin (1961) 物种与生存环境物种与生存环境 Smith与与Price(1973)生物之间的有限战争生物之间的有限战争 Smith(1982) 专著专著; Taylor和和Jonker(1978)个体相互作用个体相互作用内涵的转变内涵的转变策略策略内涵的转变内涵的转变均衡均衡内涵的转变内涵的转变演化稳定策略(演化稳定策略(ESSESS) 用用J(p, q)来表示一个物种的策略来表示一个物种的策略p遇到策略遇到策略q时时的收益函数。的收益函数。 策略策
9、略p* 被称为是一个被称为是一个ESS,如果,如果 J(p*, p* ) J(p, p* )或者当或者当J(p*, p* ) = J(p, p* )时,时, J(p*, p ) J(p, p )。)。 ESS可以是纯策略,也可以是混合策略。可以是纯策略,也可以是混合策略。微分方程微分方程的稳定性的稳定性马氏链马氏链的稳定性的稳定性相关研究的文献综述 确定性确定性的演化博弈模型(的演化博弈模型(微分方程微分方程):): Friedman(1991,1998); Hofbauer和和Sigmund(1988, 1998); Weibull(1995). 随机性随机性的演化博弈模型:的演化博弈模型:
10、 扰动的生灭过程:扰动的生灭过程:Fudenberg和和Imhof(2006); Fudenberg等人等人(2006)。 扰动的拟生灭过程:扰动的拟生灭过程:Tadja和和Touzene(2003); Q.L. Li(2008)。 扰动图的马氏链:扰动图的马氏链:Young(1993)相关研究的文献综述 探讨探讨演化稳定策略的定义和求解方法演化稳定策略的定义和求解方法,以及,以及演化演化稳定策略与纳什均衡策略之间关系稳定策略与纳什均衡策略之间关系:Friedman(1991,1998); Hofbauer和和Sigmund(1988, 1998); Samuelson(1997); Weib
11、ull(1995). 演化博弈和学习机制的交叉研究演化博弈和学习机制的交叉研究:Fudenberg和和Levine(1997); Foster和和Young(2003); Milgrom和和Robert(1991); Young(1998, 2000,2 002).Nash均衡均衡ESSQuan-Lin LiConstructive Computation in Stochastic Models with Applications:The RG-FactorizationsSpringerChapter 11 Sensitivity Analysis and Evolutionary Gam
12、es我们的研究工作 针对策略状态空间是离散的、群体的人口规模是有限的、决策具有随机性针对策略状态空间是离散的、群体的人口规模是有限的、决策具有随机性的演化博弈模型。的演化博弈模型。 对两个群体的演化博弈问题,研究了两类模型:对两个群体的演化博弈问题,研究了两类模型:两个群体两个群体间接相关间接相关,博弈只在每个群体内部进行,但是两个群体通过策略,博弈只在每个群体内部进行,但是两个群体通过策略相关性因子互相影响;相关性因子互相影响;两个群体两个群体直接相关直接相关,博弈的双方每次分别从两个不同的群体中随机抽取。,博弈的双方每次分别从两个不同的群体中随机抽取。 针对任意多个群体的演化博弈问题,研究
13、了三类模型:针对任意多个群体的演化博弈问题,研究了三类模型:间接相关、直接相间接相关、直接相关、混合相关关、混合相关。 多个群体演化博弈问题的建模及其求解演化稳定策略,为演化博弈论在经多个群体演化博弈问题的建模及其求解演化稳定策略,为演化博弈论在经济学、运筹学领域的广泛应用提供了一定的理论基础;同时,通过一系列济学、运筹学领域的广泛应用提供了一定的理论基础;同时,通过一系列数值算例,定性与定量相结合地研究不同建模参数对演化稳定策略分布的数值算例,定性与定量相结合地研究不同建模参数对演化稳定策略分布的影响,为设计实验、提供实验数据的实证支持打下了基础。影响,为设计实验、提供实验数据的实证支持打下
14、了基础。演化博弈的基本要素123有限人口-无限人口:离散的策略-连续的策略:参与人的匹配方式:单对模型、总体统计模型、随机匹配模型同质群体的对称二人博弈;不同质群体的非对称二人博弈。自然选择机制(复制子动态);模仿机制;强化学习机制;最优反应机制;几种机制的混合:虚拟行动。对称的(对称的( )演化博弈)演化博弈 假设前提:假设假设1:参与人采用近似近似最优反应机制规定的决策模式,即参与人对市场的认知程度是有局限性的;假设假设2:参与人的决策是“近视”的,其决策基于参与人对当前市场结构的认识;假设假设3:参与人的决策具有不确定性,统称为“变异”。模型描述:两个互相独立的群体P1、P2,人口规模分
15、别为M, N. 设每一个参与人只具有两个纯策略,则两个群体的策略集分别为:11112,Sss22122,Sss和:群体P1、P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵为:12,abacAAcdbd2 2对称的(对称的( )演化博弈)演化博弈 给出参与人的期望收益函数给出参与人的期望收益函数:2 211( )( )( ( ),saz tb Mz tfz tM12( )( )( ( ).scz td Mz tfz tM定义参与人选择其第一类策略的转移率为定义参与人选择其第一类策略的转移率为:1112( )max( )( ),0,0,1,.1.ssififiiM1211( )max( )( )
16、,0,1,2,.ssififiiM *01*1*QN *00 ,1 ,2 ,; lim.Nkk2 2两个独立群体的演化博弈 假设前提:假设假设1:参与人采用近似近似最优反应机制规定的决策模式,即参与人对市场的认知程度是有局限性的;假设假设2:参与人的决策是“近视”的,其决策基于参与人对当前市场结构的认识;假设假设3:参与人的决策具有不确定性,统称为“变异”。模型描述:两个互相独立的群体P1、P2,人口规模分别为M, N. 设每一个参与人只具有两个纯策略,则两个群体的策略集分别为:11112,Sss22122,Sss和:群体P1、P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵为:1122121
17、122,ababAAcdcd两个独立群体的演化博弈 给出参与人的期望收益函数给出参与人的期望收益函数:1111 111( )( )( ( ),sa z tb Mz tfz tM1211 111( )( )( ( ).sc z td Mz tfz tM2122222( )( )( ( );sa z tb Nz tfz tN2222222( )( )( ( ).sc z tdNz tfz tN定义参与人选择其第一类策略的转移率为定义参与人选择其第一类策略的转移率为:11121111( )max( )( ),0,0,1,.1.ssififiiM12111111( )max( )( ),0,1,2,.
18、ssififiiM21222222( )max( )( ),0,0,1,.1.ssjfjfjjN22212222( )max( )( ),0,1,2,. .ssjfjfjjN定义拟生灭过程的状态空间为定义拟生灭过程的状态空间为:(0,0),(0,1),.(0,);(1,0),(1,1),.(1,);.;(,0),(,1),.(,)NNMMM N 两个独立群体的演化博弈 拟生灭过程的无穷小生成元为:拟生灭过程的无穷小生成元为:001011121022221022221011121021( )( )( )( )( )( )( )( ).( )( )( )( )( )( )( )( )MMMMMMM
19、MAAAAAAAAQAAAAAAAA其中:其中:1101( )( )( ),( )mmmAm1121( )( )( ).( )nnnAn两个独立群体的演化博弈21221221122121( ,0)(0)(1)( ,1)(1)(2)( ,2)(2)( ),(1)( ,1)(1)()( ,)ka ka ka kANa k NNNa k N 11221( , )( )( )( )( ),0,0.a k lkkllkMlN 两个独立群体的演化博弈1( ),MMUA111102( )( )( );kkkkkUAAUA110( ) .kkkRAU011( )( ),( ),.,( ),( ),MM 011
20、( )( ),( ),.,( ),( ).NNkkkkk 0011( )( )( )( )( ).( ),0.kkvRRRkM 0( )v0U000( )0( )1vUve令令如果将这个拟生灭过程的极限平稳分布记作:如果将这个拟生灭过程的极限平稳分布记作:其中其中那么那么为马氏链为马氏链的平稳概率向量,并满足的平稳概率向量,并满足.演化稳定策略的计算 *0lim,0kkkN策略相关两个互动群体的演化博弈模型描述模型描述:两个相对独立的群体两个相对独立的群体P1、P2,人口规模分别为,人口规模分别为M, N. 设每一设每一个参与人只具有两个纯策略,则两个群体的策略集分别为:个参与人只具有两个纯策
21、略,则两个群体的策略集分别为:11112,Sss22122,Sss和:和:群体群体P1、P2 内部的博弈方式是内部的博弈方式是“随机匹配随机匹配”,阶段博弈矩阵,阶段博弈矩阵为:为:1122121122,ababAAcdcd策略相关性因子为策略相关性因子为:1122( , )( , ),( , ),( , ),( , ),0,0D i jD i j D i jD i j D i jiMjN 引入策略相关性因子后,参与人策略的转移率定义为引入策略相关性因子后,参与人策略的转移率定义为:111( , )( )( , ),0,0;i jiD i jiMjN 111( , )( )( , ),0,0i
22、 jiD i jiMjN 222( , )( )( , ),0,0;i jjD i jiMjN 222( , )( )( , ),0,0i jjD i jiMjN 策略相关性两个互动群体的演化博弈 无穷小生成元为:无穷小生成元为:001011121022221022221011121021( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )MMMMMMMMAAAAAAAAQAAAAAAAA1101( ,0)( ,1)( );( , )mmmAm n1121( ,0)( ,1)( ).( , )nnnAn n其中其中策略相关性两个互动群体的演化博弈21
展开阅读全文