第七章--动态规划课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第七章--动态规划课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 动态 规划 课件
- 资源描述:
-
1、管管 理理 运运 筹筹 学学运筹学运筹学赵明霞赵明霞山西大学经济与管理学院山西大学经济与管理学院管管 理理 运运 筹筹 学学2023-2-162第七章第七章 动态规划动态规划1.1.多阶段决策过程最优化问题多阶段决策过程最优化问题2.2.基本概念、基本原理基本概念、基本原理3.3.动态规划建模与求解动态规划建模与求解4.4.动态规划的应用动态规划的应用管管 理理 运运 筹筹 学学2023-2-163第一节多阶段决策过程最优化问题举例第一节多阶段决策过程最优化问题举例例例1 最短路径问题最短路径问题 下图表示从起点下图表示从起点A到终点到终点E之间各点的距离。求之间各点的距离。求A到到E的最短路
2、径。的最短路径。BACBDBCDEC4123123123221647248386756110643751管管 理理 运运 筹筹 学学2023-2-164用穷举法的计算量用穷举法的计算量:如果从如果从A A到到E E的站点有的站点有k k个,除个,除A A、E E之外每站有之外每站有3 3个位置则个位置则总共有总共有3 3k-1k-12 2条路径;条路径;计算各路径长度总共要进行计算各路径长度总共要进行 (k+1)3(k+1)3k-1k-12 2次加法以及次加法以及3 3k-k-1 12-12-1次比较。随着次比较。随着 k k 的值增加时,需要进行的加法和比较的的值增加时,需要进行的加法和比较
3、的次数将迅速增加;次数将迅速增加;例如当例如当 k=20k=20时,加法次数为时,加法次数为 4.25508339662274.255083396622710101515 次,次,比较比较 1.37260754729771.372607547297710101414 次。若用次。若用1 1亿次亿次/秒的计算机计算秒的计算机计算需要约需要约508508天。天。管管 理理 运运 筹筹 学学2023-2-165逆序解法逆序解法顺序解法顺序解法第二节基本概念、基本方程与最优化原理第二节基本概念、基本方程与最优化原理管管 理理 运运 筹筹 学学2023-2-166 1、阶段阶段k:表示决策顺序的离散的量
4、,阶段可以按时间或空间划分。:表示决策顺序的离散的量,阶段可以按时间或空间划分。2、状态状态sk:每个阶段开始时所处的自然状态或客观条件。状态可以是:每个阶段开始时所处的自然状态或客观条件。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。数量,也可以是字符,数量状态可以是连续的,也可以是离散的。3、决策决策xk:从某一状态向下一状态过渡时所做的选择。决策是所在状:从某一状态向下一状态过渡时所做的选择。决策是所在状态的函数,记为态的函数,记为xk(sk)D k(sk)。4、策略策略Pk,n(sk):从第:从第k阶段开始到最后第阶段开始到最后第n阶段的决策序列,称阶段的决策序列
5、,称k子策略。子策略。P1,n(s1)即为全过程策略。即为全过程策略。5、状态转移方程状态转移方程 sk+1=Tk(sk,xk):某一状态以及该状态下的决策,与下:某一状态以及该状态下的决策,与下一状态之间的函数关系。一状态之间的函数关系。6、指标函数指标函数rk(sk,uk):衡量策略优劣的数量指标;:衡量策略优劣的数量指标;最优指标函数最优指标函数fk(sk),f1(s1)。一、逆序解法一、逆序解法管管 理理 运运 筹筹 学学2023-2-167 对于可加性指标函数,上式可以写为对于可加性指标函数,上式可以写为 上式中上式中“opt”表示表示“max”或或“min”。对于可乘性指标函数,上
6、。对于可乘性指标函数,上式可以写为式可以写为 以上式子称为以上式子称为动态规划最优指标的递推方程动态规划最优指标的递推方程,是动态规划的基本,是动态规划的基本方程。方程。终端条件终端条件:为了使以上的递推方程有递推的起点,必须要设定最:为了使以上的递推方程有递推的起点,必须要设定最优指标的终端条件,一般最后一个状态优指标的终端条件,一般最后一个状态n+1下最优指标下最优指标fn+1(sn+1)=0。0)(1,1,)(),()(1111)(nnkkkkksDxkksfnnksfxsrsfoptkkk0)(1,1,)(),()(1111)(nnkkkkksDxkksfnnksfxsrsfoptkk
7、k基本方程基本方程管管 理理 运运 筹筹 学学2023-2-168最优化原理最优化原理作为整个过程的最优策略具有如下性质:作为整个过程的最优策略具有如下性质:不管在此最优策略上的某个状态以前的状不管在此最优策略上的某个状态以前的状态和决策如何,对该状态来说,以后的所有决态和决策如何,对该状态来说,以后的所有决策必定构成最优子策略。就是说,策必定构成最优子策略。就是说,最优策略的最优策略的任意子策略都是最优的。任意子策略都是最优的。管管 理理 运运 筹筹 学学2023-2-169二、顺序解法二、顺序解法状态转移方程状态转移方程 sk=Tk(sk+1,xk)最优指标函数最优指标函数 fk(sk+1
8、),fn(sn+1)基本方程基本方程0)(,2,1)(),()(1011)(1sfnksfxsrsfkkkkksDxkkoptkkk0)(,2,1)(),()(1011)(1sfnksfxsrsfkkkkksDxkkoptkkk管管 理理 运运 筹筹 学学2023-2-1610一、基本步骤一、基本步骤1应将实际问题恰当地分割成应将实际问题恰当地分割成n个子问题个子问题(n个阶段个阶段)。通常是根据时间通常是根据时间或空间而划分的,或者在经由静态的数学规划模型转换为动态规划模或空间而划分的,或者在经由静态的数学规划模型转换为动态规划模型时,常取静态规划中变量的个数型时,常取静态规划中变量的个数n
9、,即,即k=n。2正确地定义状态变量正确地定义状态变量sk,使它既能正确地描述过程的状态,又能,使它既能正确地描述过程的状态,又能满足无后效性满足无后效性动态规划中的状态与一般控制系统中和通常所说的状动态规划中的状态与一般控制系统中和通常所说的状态的概念是有所不同的,必须具备以下三个态的概念是有所不同的,必须具备以下三个特征特征:(1)(1)要能够正确地描述受控过程的变化特征。要能够正确地描述受控过程的变化特征。(2)(2)要满足无后效性。即如果在某个阶段状态已经给定,那么在该阶要满足无后效性。即如果在某个阶段状态已经给定,那么在该阶段以后,过程的发展不受前面各段状态的影响。段以后,过程的发展
10、不受前面各段状态的影响。(3)(3)要满足可知性。即所规定的各段状态变量的值,可以直接或间接要满足可知性。即所规定的各段状态变量的值,可以直接或间接地测算得到。一般在动态规划模型中,状态变量大都选取那种可以进地测算得到。一般在动态规划模型中,状态变量大都选取那种可以进行累计的量。行累计的量。第三节第三节 动态规划建模与求解动态规划建模与求解管管 理理 运运 筹筹 学学2023-2-16113 3正确地定义决策变量及各阶段的允许决策集合正确地定义决策变量及各阶段的允许决策集合U Uk k(s sk k),根据经验,一般将问题中待求的量,选作动态规划模型中的根据经验,一般将问题中待求的量,选作动态
11、规划模型中的决策变量。决策变量。4.4.能够能够正确地写出状态转移方程正确地写出状态转移方程,至少要能正确反映状态,至少要能正确反映状态转移规律。转移规律。5 5正确地构造出目标与变量的函数关系正确地构造出目标与变量的函数关系目标函数。目标函数。6 6写出动态规划函数写出动态规划函数基本方程基本方程管管 理理 运运 筹筹 学学2023-2-1612例例1 1:1 1、以上求从、以上求从A A到到E E的最短路径问题,可以转化为四个性质完的最短路径问题,可以转化为四个性质完全相同,但规模较小的子问题,即分别从全相同,但规模较小的子问题,即分别从D Di i 、C Ci i、B Bi i、A A到
12、到E E的最短路径问题。的最短路径问题。第四阶段:两个始点第四阶段:两个始点D D1 1和和D D2 2,终点只有一个;,终点只有一个;分析得知:从分析得知:从D D1 1和和D D2 2到到E E的最短路径唯一。的最短路径唯一。阶段阶段4本阶段始点本阶段始点(状态)(状态)本阶段各终点(决策)本阶段各终点(决策)到到E的最短距离的最短距离本阶段最优终点本阶段最优终点(最优决策(最优决策)E D1 D2 10*6 10 6 E E二、离散变量二、离散变量-分段穷举算法分段穷举算法管管 理理 运运 筹筹 学学2023-2-1613 第三阶段:有三个始点第三阶段:有三个始点C1,C2,C3,终点有
13、,终点有D1,D2,对始点,对始点和终点进行分析和讨论分别求和终点进行分析和讨论分别求C1,C2,C3到到D1,D2 的最短的最短路径问题:路径问题:分析得知:如果经过分析得知:如果经过C1,则最短路为则最短路为C1-D2-E;如果经过如果经过C2,则最短路为则最短路为C2-D2-E;如果经过如果经过C3,则最短路为,则最短路为C3-D1-E。阶段阶段3本阶段始点本阶段始点(状态)(状态)本阶段各终点(决策)本阶段各终点(决策)到到E的最短距离的最短距离本阶段最优终点本阶段最优终点(最优决策(最优决策)D1 D2 C1 C2 C3 8+10=18 7+10=17 1+10=11 6+6=12
14、5+6=11 6+6=12 12 11 11 D2 D2 D1管管 理理 运运 筹筹 学学2023-2-1614第二阶段:有第二阶段:有4个始点个始点B1,B2,B3,B4,终点有,终点有C1,C2,C3。对始点。对始点和终点进行分析和讨论分别求和终点进行分析和讨论分别求B1,B2,B3,B4到到C1,C2,C3 的最短的最短路径问题:路径问题:分析得知:如果经过分析得知:如果经过B1,则走,则走B1-C2-D2-E;如果经过如果经过B2,则走,则走B2-C3-D1-E;如果经过如果经过B3,则走,则走B3-C3-D1-E;如果经过如果经过B4,则走,则走B4-C3-D1-E。阶段阶段2本阶段
15、始点本阶段始点(状态)(状态)本阶段各终点(决策)本阶段各终点(决策)到到E的最的最短距离短距离本阶段最优终本阶段最优终点(最优决策点(最优决策)C1 C2 C3 B1 B2 B3 B4 2+12=14 4+12=16 4+12=16 7+12=19 1+11=12 7+11=18 8+11=19 5+11=16 6+11=17 2+11=13 3+11=14 1+11=12 12 13 14 12 C2 C3 C3 C3管管 理理 运运 筹筹 学学2023-2-1615第一阶段:只有第一阶段:只有1个始点个始点A,终点有,终点有B1,B2,B3,B4。对始点和终。对始点和终点进行分析和讨论分
16、别求点进行分析和讨论分别求A到到B1,B2,B3,B4的最短路径问题:的最短路径问题:最后,可以得到:从最后,可以得到:从A到到E的最短路径为的最短路径为A B4 C3 D1 E 阶段阶段1本阶段始本阶段始点点(状态状态)本阶段各终点(决策)本阶段各终点(决策)到到E的最的最短距离短距离本阶段最优终本阶段最优终点点(最优决策最优决策)B1 B2 B3 B4 A4+12=16 3+13=163+14=172+12=14 14 B4管管 理理 运运 筹筹 学学2023-2-1616 以上计算过程及结果,可用图以上计算过程及结果,可用图2表示,可以看到,以上方表示,可以看到,以上方法不仅得到了从法不
17、仅得到了从A到到D的最短路径,同时,也得到了从图中的最短路径,同时,也得到了从图中任一点到任一点到E的最短路径。的最短路径。以上过程,仅用了以上过程,仅用了22次加法,计算效率远高于穷举法。次加法,计算效率远高于穷举法。BACBDBCDEC412312312332164724838675161060106121111121314144B127512管管 理理 运运 筹筹 学学2023-2-1617教材例教材例2三、连续变量三、连续变量管管 理理 运运 筹筹 学学2023-2-1618最短路径问题(例最短路径问题(例1 1)资源分配问题(投资问题)资源分配问题(投资问题)背包问题背包问题生产经营
18、问题生产经营问题系统可靠性问题系统可靠性问题设备更新问题设备更新问题机器负荷分配问题机器负荷分配问题货郎担问题货郎担问题第四节第四节 动态规划的应用动态规划的应用管管 理理 运运 筹筹 学学2023-2-1619 例例3.某公司拟将某种设备某公司拟将某种设备5台,分配给所属的甲、乙、丙三个工台,分配给所属的甲、乙、丙三个工厂。各工厂获得此设备后,预测可创造的利润如表所示,问这厂。各工厂获得此设备后,预测可创造的利润如表所示,问这5台设备应如何分配给这台设备应如何分配给这3个工厂,使得所创造的总利润为最大?个工厂,使得所创造的总利润为最大?工工 厂厂盈盈 利利设备台数设备台数 甲甲 厂厂 乙乙
19、厂厂 丙丙 厂厂 0 0 0 0 1 3 5 4 2 7 10 6 3 9 11 11 4 12 11 12 5 13 11 12资源分配问题资源分配问题管管 理理 运运 筹筹 学学2023-2-1620解:将问题按工厂分为三个阶段,甲、乙、丙三个厂分别编号为解:将问题按工厂分为三个阶段,甲、乙、丙三个厂分别编号为1、2、3厂。设厂。设 sk=分配给第分配给第k个厂至第个厂至第3个厂的设备台数(个厂的设备台数(k=1、2、3)。)。xk=分配给第分配给第k个厂设备台数。个厂设备台数。已知已知s1=5,并有并有 从从sk 与与xk 的定义,可知的定义,可知以下以下我们从第三阶段开始计算。我们从第
20、三阶段开始计算。222223),(xsxsTs33xs 111112),(xsxsTs管管 理理 运运 筹筹 学学2023-2-1621 第三阶段第三阶段:显然将显然将s3(s3=0,1,2,3,4,5)台设备都分配给第台设备都分配给第3工厂时,工厂时,也就是也就是s3=x3时,第时,第3阶段的指标值(即第阶段的指标值(即第3厂的盈利)厂的盈利)为最大,即为最大,即 由于第由于第3阶段是最后的阶段,故有阶段是最后的阶段,故有 其中其中x3可取值为可取值为0,1,2,3,4,5。其数值计算见表。其数值计算见表106。).,(),(max)(333333333ssrxsrsfx),(),(max3
21、333333ssrxsrx管管 理理 运运 筹筹 学学2023-2-1622012345000014 4126623111134121245121253x3s),(333xsr)(33sf3*x管管 理理 运运 筹筹 学学2023-2-1623 其中其中x*3表示取表示取3子过程上最优指标值子过程上最优指标值f3(s3)时的时的x3决策,决策,例如在表中可知当例如在表中可知当s3=4时,有时,有r3(4,4)=12,有有f3(4)=12此时此时x*3=4,即当,即当s3=4 时,此时取时,此时取x3=4(把(把4台设备分配给第台设备分配给第3厂)是最优决策,此时阶段指标值厂)是最优决策,此时阶
22、段指标值(盈利)为(盈利)为12,最优,最优3子过程最优指标值也为子过程最优指标值也为12。管管 理理 运运 筹筹 学学2023-2-1624第二阶段:第二阶段:当把当把s2=0,1,2,3,4,5台设备分配给第台设备分配给第2工厂和第工厂和第3工厂时,则对每个工厂时,则对每个s2值,有一种最优分配方案,值,有一种最优分配方案,使最大盈利即最优使最大盈利即最优2子过程最优指标函数值为子过程最优指标函数值为)(),(max)(33222222sfxsrsfx因为因为s3=s2-x2上式也可写成上式也可写成)(),(max)(223222222xsfxsrsfx管管 理理 运运 筹筹 学学2023
23、-2-16250123450 00104 51206 54 1023011 56 110 1424012 114110 161,25012 512 1161141102122x2s)(),(223222xsfxsr)(22sf2*x00050104101156101110管管 理理 运运 筹筹 学学2023-2-1626第一阶段:第一阶段:把把 台设备分配给第台设备分配给第1,第,第2,第,第3厂时,最大盈利为厂时,最大盈利为其中可取值其中可取值0,1,2,3,4,5。数值计算见表。数值计算见表 )5(11ss),5(),5(max)5(111111xfxrfx1x0123455 316 9+
24、10 12+5 13+0 21 0,21x1s)5(),5(1211xfxr210147)(1xf1*x管管 理理 运运 筹筹 学学2023-2-1627然后按计算表格的顺序推算,可知最优分配方案有两个:然后按计算表格的顺序推算,可知最优分配方案有两个:1.由于由于x*1=0,根据,根据s2=s1-x*1=5,查表,查表107可知可知x*2=2,再,再由由s3=s2-x*2=3,求得,求得x*3=s3=3。即分配给甲厂。即分配给甲厂0台,乙厂台,乙厂2台,台,丙厂丙厂3台。台。2.由于由于x*1=2,根据,根据s2=s1-x*1=3,查表,查表107可可知知x*2=2,再由再由s3=s2-x*
展开阅读全文