最优化理论-动态规划讲解课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最优化理论-动态规划讲解课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 理论 动态 规划 讲解 课件
- 资源描述:
-
1、动态规划v动态规划问题实例v动态规划的基本概念与原理v动态规划应用举例引 言动态规划是解决多阶段决策过程最优化的一种方法。该方法是由美国数学家贝尔曼(R. E. Bellman)等人在20世纪50年代初提出的。并成功地解决了生产管理、工程技术等方面的许多问题,从而建立了运筹学的一个新的分支,即动态规划。Bellman在1957年出版了Dynamic Programming一书,是动态规划领域中的第一本著作。1 动态规划问题实例例1 给定一个线路网络,AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143要从A向F铺设一条输油管道,各点间连线上的数字表示
2、距离,问应选择什么路线,可使总距离最短?动态规划是解决多阶段决策问题的一种方法。所谓多阶段决策问题是指这样的决策问题:其过程可分为若干个相互联系的阶段,每一阶段都对应着一组可供选择的决策,每一决策的选定即依赖于当前面临的状态,又影响以后总体的效果。ABCDE状态A状态B状态C状态D状态E状态F决策A决策D决策E当每一阶段的决策选定以后,就构成一个决策序列,称为一个决策B决策C策略,它对应着一个确定的效果。多阶段决策问题就是寻找使此效果最好的策略。2 动态规划的基本概念与原理一。基本概念阶段:是指问题需要做出决策的步数。阶段总数常记为n,相应的是n个阶段的决策问题。阶段的序号常记为k,称为阶段变
3、量,k=1,2, ,n. k即可以是顺序编号也可以是逆序编号,常用顺序编号。状态:各阶段开始时的客观条件,第k阶段的状态常用状态变量 表示,状态变量取值的集合成为状态集合,用表示。kskS例如,例1中,.,2121BBSASAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143第1阶段第2阶段第3阶段第4阶段第5阶段状态1状态2状态3状态4状态5状态6决策:是指从某阶段的某个状态出发,在若干个不同方案中做出的选择。表示决策的变量,称为决策变量,用 表示)(kksu例如: 表示走到C阶段,当处于C2 路口时,下一步奔D1.123)(DCu 时的允许决策集
4、合记为 ,例如:ks)(kksD,)(32112CCCBD状态转移方程:是从上一阶段的某一状态值转变为下一阶段某一状态值的转移规律,用 ),(1kkkkusTs表示。决策变量允许的取值范围称为允许决策集合,第k阶段状态为 v策略(Strategy) 由过程的第一阶段开始到最后一阶段为止称为问题的全过程,由各阶段的决策构成的策略序列称为全过程策略,记为P1n。111122( )( ),(),()nnnPsx sx sx sAB1B2C1C2C3C4D1D2D3E1E2E3F1F2G531368766835338422123335526643k=1k=2k=3k=4k=5k=611123456(
5、)( ),( 2),( 3),(2),( 2),( 1)nPsx A x Bx Cx Dx Ex F策策略略状状态态指标函数:分阶段指标函数和过程指标函数。阶段指标函数是指第k阶段从状态 出发,采取决策 时的效益,用ksku),(kkkusv表示。而过程指标函数从第k阶段的某状态出发,采取子策略,1nkkknuuup时所得到的阶段效益之和:nkjjjjknkknusvpsV),(),(最优指标函数:表示从第k阶段状态为 时采用最佳策略ks*knp到过程终止时的最佳效益。记为),(),()()(*knkknsDpknkknkkpsVoptpsVsfkknkn其中 opt 可根据具体情况取max
6、或min。基本方程:此为逐段递推求和的依据,一般为:0)(1 , 1,)(),()(1111)(nnkkkkksDukksfnnksfusvoptsfkkk式中opt 可根据题意取 max 或 min.例如,例1的基本方程为:0)(1 , 2 , 3 , 4 , 5)(),(min)(6611sfksfusdsfkkkkkukkk动态规划最优化原理:动态规划最优化原理:不管该最优策略上某状态以前的状态和决策如何,对该状态而言,余下的诸决策必定构成最优子策略。即即最优策略的任意后部子策略也是最优的。最优策略的任意后部子策略也是最优的。ABC11,11,()(,),()()knknkkknkkkk
7、nnxxkkkkkxxx sxsfsopt Fsopt dxxsfsI.将多阶段的决策过程划分为不同阶段,恰当地选取状态变量、决策变量并定义最优指标函数,正确写出基本的递推关系和恰当的边界条件。II.求解时从边界条件开始,逆过程进行方向逐段递推寻优,在对每一个子问题进行求解时,都要使用前面已求出的子问题的最优结果,最后一个子问题的最优解就是整个问题的最优解。III.动态规划方法每一阶段最优决策选取是从全局考虑的,与该阶段的最优决策一般是不同的。动态规划应用举例例1 最短路线问题AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143逆序递推方程:0)(1
8、 , 2 , 3 , 4 , 5)(),(min)(6611sfksfusdsfkkkkkukkk(1)k=5 时,状态,215EES它们到F 点的距离即为最短路。, 4)(15Ef; 3)(25Ef,)(1*5FEu.)(2*5FEuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(2)k=4 时,状态,3214DDDS它们到F 点需经过中途点E,需一一分析从E 到 F的最短路:先说从D1到F 的最短路有两种选择:经过 E1, E2, 比较最短。.)
9、(2*5FEu,)(1*5FEuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143)(),(),(),(min)(252141511414EfEDdEfEDdDf. 735 , 43min这说明由 D1 到F 的最短距离为7,其路径为.11FED相应的决策为:.)(11*4EDu.)(2*5FEu,)(1*5FEu)(),(),(),(min)(252241512424EfEDdEfEDdDf. 532 , 46min这说明由 D2 到F 的最短距离为5,其路径为.22FED相应的决策为:.)(22*4EDuAB1B2C1C2C3C4D1D2D3E
10、1E2F452368775845348435623143.)(2*5FEu,)(1*5FEu.)(11*4EDuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143)(),(),(),(min)(252341513434EfEDdEfEDdDf. 533, 41min即 D3 到F 的最短距离为5,其路径为.22FED相应的决策为:.)(13*4EDu.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu(3)k=3 时,状态)(),(),(),(min)(242131411313DfDCdDfDCdCf.1258, 75min
11、这说明由 C1 到F 的最短距离为12,相应的决策为.)(11*3DCuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu,43213CCCCS AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143)(),(),(),(min)(242231412323DfDCdDfDCdCf.1055 , 74min即由 C2 到F 的最短距离为10,相应的决策为.)(22*3DCu)(),(),(),(min)(34333
12、2423333DfDCdDfDCdCf. 854 , 53min.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu.)(11*3DCu即由 C3 到F 的最短距离为8,相应的决策为.)(23*3DCu)(),(),(),(min)(343432424343DfDCdDfDCdCf. 954 , 58min即由 C4 到F 的最短距离为9,相应的决策为.)(34*3DCuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13
13、*4EDu.)(11*3DCu.)(22*3DCuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(4)k=2时,状态,212BBS)(),(),(),(),(),(min)(33312232121311212CfCBdCfCBdCfCBdBf.1386 ,103 ,122min这说明由 B1 到F 的最短距离为13,相应的决策为.)(21*2CBu.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu.)(11*3DCu.)(22*3DCu.)(23*3DCu.)(34*3DCu)(),(),(),()
14、,(),(min)(43422333222322222CfCBdCfCBdCfCBdBf.1597 , 87 ,108min即由 B2到F 的最短距离为15,相应的决策为.)(32*2CBuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu.)(11*3DCu.)(22*3DCu.)(23*3DCu.)(34*3DCu.)(21*2CBuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(1)k=1 时,只有
15、一个状态点A, 则)(),(),(),(min)(222112111BfBAdBfBAdAf.17155 ,134min即由 A到F 的最短距离为17,相应的决策为.)(1*1BAu.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu.)(11*3DCu.)(22*3DCu.)(23*3DCu.)(34*3DCu.)(32*2CBu.)(21*2CBu,)(21*2CBu,)(22*3DCu,)(22*4EDu.)(2*5FEu所以最优路线为:FEDCBA2221AB1B2C1C2C3C4D1D2D3E1E2F45236877584534843562
16、3143.)(2*5FEu,)(1*5FEu.)(11*4EDu.)(22*4EDu.)(13*4EDu.)(11*3DCu.)(22*3DCu.)(23*3DCu.)(34*3DCu.)(32*2CBu.)(21*2CBu再按计算顺序反推可得最优决策序列:,)(1*1BAu.)(1*1BAu顺序递推方程:初始条件0)(5 , 4 , 3 , 2 , 1)(),(min)(10111sfksfusdsfkkkkkukkkAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143例1:1阶段2阶段3阶段4阶段5阶段行走方向AB1B2C1C2C3C4D1D2D
17、3E1E2F452368775845348435623143K=1 时)(),()()(10111121sfABdBfsf注意到:0)()(010Afsf所以ABu)(1*1)(),()()(10212121sfABdBfsf, 4)(11Bf, 5)(21BfABu)(2*1K=2 时642)(),()()(111121232BfBCdCfsf11*2)(BCuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143ABu)(2*1ABu)(1*1)(),(),(),(min)()(21222111222232BfBCdBfBCdCfsf758 , 4
18、3min12*2)(BCu)(),(),(),(min)()(21232111323232BfBCdBfBCdCfsf13*2)(BCu,1257)(),()()(212424232BfBCdCfsf24*2)(BCuK=3 时)(),(),(),(min)()(22212121131343CfCDdCfCDdDfsf1174 , 65minAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143ABu)(2*1ABu)(1*1,1057 , 46min11*2)(BCu12*2)(BCu6)(12Cf7)(22CfAB1B2C1C2C3C4D1D2D3
19、E1E2F452368775845348435623143ABu)(2*1ABu)(1*112*2)(BCu11*2)(BCu13*2)(BCu24*2)(BCu,)(11*3CDu21*3)(CDu或类似地,可算出:12)(23Df22*3)(CDu14)(33Df33*3)(CDu6)(12Cf7)(22Cf12)(42Cf10)(32Cf14)(14Ef11*4)(DEu14)(24Ef22*4)(DEu17)(5Ff2*5)(EFu最优策略:2*5)(EFu22*4)(DEuAB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143ABu)(2*1
20、ABu)(1*111*2)(BCu12*2)(BCu13*2)(BCu24*2)(BCu,)(11*3CDu或21*3)(CDu22*3)(CDu33*3)(CDu12)(23Df14)(33Df11)(13Df22*3)(CDu12*2)(BCuABu)(1*1最短路径:FEDCBA2221最短路长:17)(5Ff注:顺序解法与逆序解法无本质区别,一般来说,当初始状态给定时用逆序解法,当终止状态给定时用顺序解法。若问题给定了一个初始状态与一个终止状态,则两种方法均可使用。1.分析问题。识别问题的多阶段特征,按照时间或者空间的先后顺序将过程适当地分为满足递推关系的若干阶段,对非时序的静态问题需
21、要人为地赋予“时段”的概念;2.正确选择具有以下两个特征的状态变量状态变量及其取值范围 (1)可知性。过程演变的各阶段状态变量取值能直接或者间接地被确定。 (2)能确切描述过程的演变,且满足无后效性3.确定决策变量及其取值范围4.根据状态变量和决策变量的含义,正确写出状态转移方程sk+1 =T(sk, xk) 5.根据问题,明确指标函数Fkn,最优指标函数fk(sk) 及k阶段指标dk(sk,xk) 的含义,并正确列出最优指标函数的递推关系及边界条件6.检查所建立的动态规划模型是否正确表达了原问题的要求和各种限制条件例2 资源分配问题(离散型) 例:例:设有6百万元资金用于4个工厂的扩建,已知
22、每个工厂的利润增长额同投资额的大小有关,见下表。问应如何确定对这四个工厂的投资额,使总利润增长额最大? 投资额 (j)工厂(i)0 100 200 300 400 500 600 10 20 42 60 75 85 90 20 25 45 57 65 70 73 30 18 39 61 78 90 95 40 28 47 65 74 80 85 表1 利润增长额 )(jixg(百元)解解:把对四个工厂的投资依次看成4个阶段的决策过程, 确定对第k个工厂的投资额看成第k个阶段的决策,k=1,2,3,4。图示如下:工厂1工厂2工厂3工厂46001s投资x1投资x2投资x3投资x4状态2s112xs
23、s223xss334xss3s4s5s状态状态状态变量 :可用于第k, k+1,n个工厂的投资额。ks决策变量 :第 k 阶段对第 k 个工厂的投资额。kx允许决策集 :kD,100, 0kksD)(44xg)(33xg)(11xg)(22xg状态转移方程:,1kkkxss. 4 , 3 , 2 , 1k其中6001s阶段指标函数 :第 k 阶段投资 元时所产生的利润。(见上表))(kkxgkx最优指标函数 :第 k 阶段状态为 且采取最佳投资策略,从第 k 个工厂以及以后的最大总利润。)(kksfks 逆序法基本递推方程: 0)(1 , 2 , 3 , 4)()(max)(5510sfksf
24、xgsfkkkksxkkkk工厂1工厂2工厂3工厂46001s投资x1投资x2投资x3投资x4状态2s112xss223xss334xss3s4s5s状态状态)(44xg)(33xg)(11xg)(22xg 投资额 (j)工厂(i)0 100 200 300 400 500 600 40 28 47 65 74 80 85 表1 利润增长额 )(jixg(百元)解:(1)k=4时考虑:若到最后一个,第4个工厂投资时,还有资金 ,若投资于第4个工厂的资金为 ,则最大利润为4s4x工厂1工厂2工厂3工厂46001s投资x1投资x2投资x3投资x4状态2s112xss223xss334xss3s4s
25、5s状态状态)(44xg)(33xg)(11xg)(22xg 投资额 (j)工厂(i)0 100 200 300 400 500 600 40 28 47 65 74 80 85 表1 利润增长额 )(jixg(百元))()(max)(554404444sfxgsfsx(注意到此时 =0) )(55sf)(max44044xgsx 自然问:现在还有多少钱?即 =? 4s =0,100,200,300,400,500,600都有可能。 4s下面分情况讨论:工厂1工厂2工厂3工厂46001s投资x1投资x2投资x3投资x4状态2s112xss223xss334xss3s4s5s状态状态)(44xg
展开阅读全文