运筹与优化-动态规划课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《运筹与优化-动态规划课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹 优化 动态 规划 课件
- 资源描述:
-
1、最短路径问题最短路径问题资源分配问题资源分配问题背包问题背包问题机器负荷分配问题机器负荷分配问题l动态规划是一种研究多阶段决策问题的理论和动态规划是一种研究多阶段决策问题的理论和 方方 法。动态规划又称为多阶段规划法。动态规划又称为多阶段规划.l多阶段决策问题多阶段决策问题:决策过程是一种在多个相互联决策过程是一种在多个相互联 系的阶段分别作出决策以形成序列决策的过程,系的阶段分别作出决策以形成序列决策的过程,而这些决策都是根据总体最优化这一共同目标而这些决策都是根据总体最优化这一共同目标 来选取的。来选取的。要点:阶段,状态,决策,状态转移方程,要点:阶段,状态,决策,状态转移方程,k-后部
2、子过程。后部子过程。状态状态 决策决策 状态状态 决策决策 状态状态 状态状态 决策决策 状态状态 阶段阶段1阶段阶段2阶段阶段n2511214106104131112396581052C1C3D1AB1B3B2D2EC2例例1 最短路径问题最短路径问题:求从求从A到到E的最短路径的最短路径.如果用枚举法,则从如果用枚举法,则从A到到E共有共有332 1=18条不同的路条不同的路径,逐个计算每条路径的长度,总共需作径,逐个计算每条路径的长度,总共需作418=72次加法次加法计算;对计算;对18条路径的长度做两两比较,找出其中最短的一条路径的长度做两两比较,找出其中最短的一条,总共要条,总共要
3、进行进行181=17次比较次比较.最短路径:最短路径:AB2C1D1E,最短距离,最短距离19。1.阶段与阶段变量阶段与阶段变量 把所给问题的过程把所给问题的过程,恰当地分为若干个相互联系恰当地分为若干个相互联系的阶段的阶段,以便能按一定的次序去求解以便能按一定的次序去求解.描述阶段的变量描述阶段的变量称为阶段变量称为阶段变量,用用k表示表示.(k=1,2,n)2.状态与状态变量状态与状态变量 状态是系统在变化过程中某个阶段的初始形态表状态是系统在变化过程中某个阶段的初始形态表征征.描述状态的变量称为状态变量描述状态的变量称为状态变量,用用sk表示第表示第k阶段的阶段的初始状态初始状态.第第k
4、阶段所有可能状态构成的集合称为该阶阶段所有可能状态构成的集合称为该阶段的段的(可达可达)状态集合状态集合,记为记为Sk.最短路问题中,各个节点就是状态最短路问题中,各个节点就是状态生产库存问题中,库存量是状态生产库存问题中,库存量是状态物资分配问题中,剩余的物资量是状态物资分配问题中,剩余的物资量是状态 无后效性:无后效性:如果某阶段状态给定后如果某阶段状态给定后,则在这阶段则在这阶段以后过程的发展不受这阶段以前各阶段状态的影响以后过程的发展不受这阶段以前各阶段状态的影响.3.决策与决策变量决策与决策变量 决策是指在某个阶段状态给定以后决策是指在某个阶段状态给定以后,从该状态演从该状态演变至下
5、一阶段某状态的选择变至下一阶段某状态的选择.描述决策的变量称为决描述决策的变量称为决策变量策变量,用用uk(sk)表示第表示第k阶段处于状态阶段处于状态sk时的决策变时的决策变量量.用用Dk(sk)表示第表示第k阶段从状态阶段从状态sk出发的允许决策集出发的允许决策集合合.uk(sk)Dk(sk)最短路问题中,走哪条路最短路问题中,走哪条路生产库存问题中,各阶段的产品生产量生产库存问题中,各阶段的产品生产量物资分配问题中,分配给每个地区的物资量物资分配问题中,分配给每个地区的物资量 4.策略与策略与(后部后部)子策略子策略 策略是一个按顺序排列的决策组成的集合策略是一个按顺序排列的决策组成的集
6、合.由过程的第一阶段开始到终点为止的每阶段的由过程的第一阶段开始到终点为止的每阶段的决策所组成的决策序列称为全过程策略决策所组成的决策序列称为全过程策略,简称策略简称策略.记为记为 p1,n(s1)=u1(s1),u2(s2),un(sn)由过程的第由过程的第k阶段开始到终止状态为止的过程阶段开始到终止状态为止的过程,其相应的决策序列称为其相应的决策序列称为k子过程策略子过程策略,简称子策略简称子策略.记为记为 pk,n(sk)=uk(sk),uk+1(sk+1),un(sn)可供选择的策略范围称为允许策略集合可供选择的策略范围称为允许策略集合,用用P表表示示.从从P中找出达到最优效果的策略称
7、为最优策略中找出达到最优效果的策略称为最优策略.5.状态转移与状态转移方程状态转移与状态转移方程 过程由这一阶段的一个状态转变到下一阶段过程由这一阶段的一个状态转变到下一阶段的另一个状态称为状态转移的另一个状态称为状态转移.描述状态转移关系的描述状态转移关系的方程称为状态转移方程方程称为状态转移方程.由状态由状态sk转移到转移到sk+1的状态的状态转移方程转移方程.记为记为 sk+1=Tk(sk,uk)Tk称为状态转移函数称为状态转移函数.6.指标函数和最优值函数指标函数和最优值函数 用来衡量所实现过程优劣的一种数量指标用来衡量所实现过程优劣的一种数量指标,称称为指标函数为指标函数.表示为表示
8、为 Vk,n=Vk,n(sk,uk,sk+1,uk+1,sn+1),k=1,2,n动态规划的指标函数应具有可分离性、递推关系,动态规划的指标函数应具有可分离性、递推关系,即即 Vk,n(sk,uk,sk+1,uk+1,sn+1)=ksk,uk,Vk+1,n(sk+1,uk+1,sn+1)常见的指标函数的形式是常见的指标函数的形式是:1).Vk,n(sk,uk,sn+1)=nj=k vj(sj,uj)=vk(sk,uk)+Vk+1,n(sk+1,uk+1,sn+1)2).Vk,n(sk,uk,sn+1)=nj=k vj(sj,uj)=vk(sk,uk)Vk+1,n(sk+1,uk+1,sn+1)
9、其中其中vj(sj,uj)表示第表示第j阶段的指标阶段的指标.指标函数指标函数1),2)可统一表示为可统一表示为:其中记号其中记号“*”可都表示为可都表示为“+”或都表示为或都表示为“”.指标函数的最优值指标函数的最优值,称为最优值函数称为最优值函数,记为记为fk(sk).它表示从第它表示从第k阶段的状态阶段的状态sk开始到第开始到第n阶段的终止状阶段的终止状态的过程态的过程,采取最优策略所得到的指标函数值采取最优策略所得到的指标函数值.即即其中其中“opt”是最优化是最优化(optimization)的缩写的缩写,可依题意取可依题意取min或或max.),()(1,),(nkknkuukks
10、usVoptsfnk),(),(),(111,nnnkkkkkknkusvusvusvV 最短路线有一个重要特性:如果最短路线有一个重要特性:如果L是允许策略集是允许策略集合合P中从始点中从始点A到终点到终点E的最短路线的最短路线,M是是L中的一点中的一点,则则从从M沿沿L到到E的路是从的路是从M到到E的最短路线的最短路线.寻找最短路线的方法寻找最短路线的方法,可以从最后一段开始可以从最后一段开始,由后由后向前逐步递推向前逐步递推,求出各点到后一点的最短路线求出各点到后一点的最短路线,最后求最后求得始点到终点的最短路线得始点到终点的最短路线.所以所以,动态规划的方法是从动态规划的方法是从终点逐
11、段向始点方向寻找最短路线的一种方法终点逐段向始点方向寻找最短路线的一种方法.如图如图所示所示:行进方向行进方向 始点始点 1 2 3 n 终点终点 寻优途径寻优途径2511214106104131112396581052C1C3D1AB1B3B2D2EC2例例1、最短路径问题、最短路径问题求从求从A到到E的最短路径的最短路径2511214106104131112396581052C1C3D1AB1B3B2D2EC2f5(E)=02511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D1)=5f5(E)=0505)E(f)ED(d)D(f5114EDu
12、)(:14最优决策2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f4(D1)=5202)()()(5224EfEDdDfEDu)(:24最优决策2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C1)=8f4(D1)=5.:;)(:82953min)(),()(),(min)(111132421141113EDCDCuDfDCDfDCCf最短路线最优决策2511214106104131112396581052C1C3D1AB1B3B2D2EC
13、2f4(D2)=2f5(E)=0f3(C2)=7f4(D1)=5f3(C1)=8.:;)(:72556min)(),()(),(min)(222232422141223EDCDCuDfDCDfDCCf最短路线最优决策2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f3(C1)=8f3(C2)=7.:;)(:1221058min)(),()(),(min)(232332423141333EDCDCuDfDCDfDCCf最短路线最优决策2511214106104131112396581052
14、C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B1)=20f3(C2)=7f3(C1)=8.:201210714812min)(),()(),()(),(min)(11133312321131112EDCBCfCBCfCBCfCBBf最短路线112)(:CBu最优决策2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B2)=14f3(C2)=7f3(C1)=8f2(B1)=211233322322131222:1412471
15、086min)(),()(),()(),(min)(CBCfCBCfCBCfCBBf最优决策122)(CBu即2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f2(B1)=21f2(B2)=142333332323131332:191211712813min)(),()(),()(),(min)(CBCfCBCfCBCfCBBf最优决策232)(CBu即2511214106104131112396581052C1C3D1AB1B3B2D2
16、EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=2123232221211:19191145212min)(),()(),()(),(min)(BABfBABfBABfBAAf最优决策21)(BAu即2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态状态 最优决策最优
17、决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态A (A,B2)B22511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态A (A,B2)B2 (B2,C1)C12511214106104131112396581052C1C3
18、D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态A (A,B2)B2 (B2,C1)C1 (C1,D1)D12511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2
19、(B2)=14f2(B1)=21状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态A (A,B2)B2 (B2,C1)C1 (C1,D1)D1 (D1,E)E从从A到到E的最短路径为的最短路径为19,最短路线为,最短路线为AB 2C1 D1 E k阶段与阶段与k+1阶段之间的递推关系阶段之间的递推关系:称为动态规划的基本方程称为动态规划的基本方程.例例1中中opt=min,vk(sk,uk(sk)=dk(sk,uk(sk).用动态规划解题的基本思路用动态规划解题的基本思路,是将一个是将一个n阶段的决阶段的决策问题化为依次求解
20、策问题化为依次求解n个具有递推关系的单阶段决策个具有递推关系的单阶段决策问题问题,从而简化计算过程从而简化计算过程.这一思路体现了动态规划方这一思路体现了动态规划方法的如下基本特征法的如下基本特征:多阶段性,无后效性,递归性,总体优化性多阶段性,无后效性,递归性,总体优化性.)1.8(.1,2,1,0)(:)()(,()(1111)(nnksfsfsusvoptsfnnkkkkkksDukkkkk边界条件 逆序解法逆序解法:从问题的最后一个阶段开始从问题的最后一个阶段开始,逆多阶段逆多阶段决策的实际过程反向寻优决策的实际过程反向寻优.如图所示如图所示:行进方向行进方向 始点始点 1 2 3 n
21、 终点终点 寻优途径寻优途径 顺序解法顺序解法:从问题的最初阶段开始从问题的最初阶段开始,顺多阶段决策顺多阶段决策的实际过程同向寻优的实际过程同向寻优.如图所示如图所示:行进方向行进方向 始点始点 1 2 3 n 终点终点 寻优途径寻优途径(两种解法可表示行进方向的不同或对始点终点看法的颠倒两种解法可表示行进方向的不同或对始点终点看法的颠倒)给实际问题建立动态规划模型的基本步骤给实际问题建立动态规划模型的基本步骤:(1).将问题的过程恰当地划分为若干个阶段将问题的过程恰当地划分为若干个阶段;(2).正确选择状态变量正确选择状态变量sk(第第k阶段的初始状态阶段的初始状态),使它既使它既 能描述
22、过程的演变能描述过程的演变,又能满足无后效性又能满足无后效性;(3).确定决策变量确定决策变量uk及每阶段的允许决策集合及每阶段的允许决策集合Dk(sk);(4).正确写出状态转移方程正确写出状态转移方程;(5).正确写出指标函数正确写出指标函数Vk,n,它应满足下面三个性质,它应满足下面三个性质:a)是定义在全过程和所有后部子过程上的函数是定义在全过程和所有后部子过程上的函数;b)要具有可分离性要具有可分离性,且满足递推关系且满足递推关系,即即 Vk,n(sk,uk,sn+1)=ksk,uk,Vk+1,n(sk+1,uk+1,sn+1)c)函数函数k(sk,uk,Vk+1,n)对于变量对于变
23、量Vk+1,n 要严格单调要严格单调.指标函数指标函数:动态规划逆序解法的基本方程为动态规划逆序解法的基本方程为:式中状态转移方程式中状态转移方程sk+1=Tk(sk,uk).(8.2)中通常中通常“*”取取“+”时时=0;取;取“”时时=1.),(*),(),(),(),(111,1111,nkknkkkknnnkkkkkknksusVusvusvusvusvV)2.8(.1,2,1,)()(),()(1111)(nnksfsfusvoptsfnnkkkkksDukkkkk 动态规划顺序解法的基本方程为动态规划顺序解法的基本方程为:式中状态转移方程式中状态转移方程sk=Tk(sk+1,uk)
24、.(8.3)中通常中通常“*”取取“+”时时=0;取;取“”时时=1.)3.8(.,2,1,)()(),()(1011)(11nksfsfusvoptsfkkkkksDukkkkk 附注:附注:若将状态变量若将状态变量sk表示表示k阶段末的结束状阶段末的结束状态,则态,则 动态规划顺序解法的基本方程为动态规划顺序解法的基本方程为:)3.8(.,2,1,)()(),()(0011)(nksfsfusvoptsfkkkkksDukkkkk作为整个过程的最优策作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何略具有这样的性质,无论过去的状态和决策如何,对对前面决策所形成的状态而言前面决策
25、所形成的状态而言,余下的诸决策必构成最余下的诸决策必构成最优策略优策略.(简言之简言之,一个最优策略的子策略总是最优的一个最优策略的子策略总是最优的)设阶段数为设阶段数为n的多阶段的多阶段决策过程决策过程,其阶段编号为其阶段编号为k=0,1,2,。允许策略允许策略 是最优策略的充要是最优策略的充要条件是对任一个条件是对任一个k,0kn-1和和s0S0有有),(110*1,0nnuuup式式(8.4)中中 ,它是由给它是由给定的初始状态定的初始状态s0和子策略和子策略p0,k-1所确定的所确定的k段状态段状态.允许策略允许策略p*0,n-1 是最优策略是最优策略,则对任意的则对任意的k,0kn-
展开阅读全文