管理运筹学课件—动态规划.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理运筹学课件—动态规划.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 运筹学 课件 动态 规划
- 资源描述:
-
1、1第九章 动态规划动态规划的基本原理动态规划方法的基本步骤动态规划方法应用举例本章以下内容2最优化原理(贝尔曼最优化原理)作为一个全过程的最优策略具有这样的性质:对于最优策略过程中的任意状态而言,无论其过去的状态和决策如何,余下的诸决策必构成一个最优子策略。该原理的具体解释是,若某一全过程最优策略为:动态规划的基本原理动态规划的基本原理)(),(,),(),()(221111nnkksususususp 则对上述策略中所隐含的任一状态而言,第k子过程上对应于该状态的最优策略必然 包含在上述全过程最优策略p1*中,即为)(,),(),()(11nnkkkkkksusususp33.3.动态规划方
2、法的基本步骤动态规划方法的基本步骤 1应将实际问题恰当地分割成n个子问题(n个阶段)。通常是根据时间或空间而划分的,或者在经由静态的数学规划模型转换为动态规划模型时,常取静态规划中变量的个数n,即k=n。2正确地定义状态变量sk,使它既能正确地描述过程的状态,又能满足无后效性动态规划中的状态与一般控制系统中和通常所说的状态的概念是有所不同的,动态规划中的状态变量必须具备以下三个特征:43.3.动态规划方法的基本步骤动态规划方法的基本步骤 (1)要能够正确地描述受控过程的变化特征。(2)要满足无后效性。即如果在某个阶段状态已经给定,那么在该阶段以后,过程的发展不受前面各段状态的影响。(3)要满足
3、可知性。即所规定的各段状态变量的值,可以直接或间接地测算得到。在与静态规划模型的对应关系上,通常根据经验,线性与非线性规划中约束条件的个数,相当于动态规划中状态变量sk的维数而前者约束条件所表示的内容,常就是状态变量sk所代表的内容。53.3.动态规划方法的基本步骤动态规划方法的基本步骤 3正确地定义决策变量及各阶段的允许决策集合Uk(sk),根据经验,一般将问题中待求的量,选作动态规划模型中的决策变量。或者在把静态规划模型(如线性与非线性规划)转换为动态规划模型时,常取前者的变量xj为后者的决策变量uk。4.能够正确地写出状态转移方程,至少要能正确反映状态转移规律。如果给定第k阶段状态变量s
4、k的值,则该段的决策变量uk一经确定,第k+1段的状态变量sk+1的值也就完全确定,即有sk+1=Tk(sk,uk)63.3.动态规划方法的基本步骤动态规划方法的基本步骤 5根据题意,正确地构造出目标与变量的函数关系目标函数,目标函数应满足下列性质:(1)可分性,即对于所有k后部子过程,其目标函数仅取决于状态sk及其以后的决策 uk,uk+1,un,就是说它是定义在全过程和所有后部子过程上的数量函数。(2)要满足递推关系,即 (3)函数 对其变元Rk+1来说要严格单调。),(,),(111111,nkkkkknkkkknkssRussususR),(,111nkkkkkssRus7 6写出动态
5、规划函数基本方程例如常见的指标函数是取各段指标和的形式 其中 表示第i阶段的指标,它显然是满足上述三个性质的。所以上式可以写成:3.3.动态规划方法的基本步骤动态规划方法的基本步骤nkiiiikkusgsR),()(),(iiiusg),(),(111nkkkkkkssRusgR8 1.动态规划的四大要素 状态变量及其可能集合 xk Xk 决策变量及其允许集合 uk Uk 状态转移方程 xk+1=Tk(xk,uk)阶段效应 rk(xk,uk)4.4.动态规划方法应用举例动态规划方法应用举例9 2.动态规划基本方程 fn+1(xn+1)=0 (边界条件)fk(xk)=opt urk(xk,uk)
6、+fk+1(xk+1)k=n,14.4.动态规划方法应用举例动态规划方法应用举例10求 最 短 路 径11BACBDBCDEC212312312511214106104131211396581052 阶段1 阶段2 阶段3 阶段4 阶段5 求 最 短 路 径例5.512 将问题分成五个阶段,第k阶段到达的具体地点用状态变量xk表示,例如:x2=B3表示第二阶段到达位置B3,等等。这里状态变量取字符值而不是数值。将决策定义为到达下一站所选择的路径,例如目前的状态是x2=B3,这时决策允许集合包含三个决策,它们是D2(x2)=D2(B3)=B3C1,B3C2,B3C3求 最 短 路 径13最优指标
7、函数fk(xk)表示从目前状态到E的最短路径。终端条件为f5(x5)=f5(E)=0其含义是从E到E的最短路径为0。第四阶段的递推方程为:fxvxdfxdDx4444455444()min(,)()()从 f5(x5)到 f4(x4)的 递 推 过 程 用 下 表 表 示:x4D4(x4)x5v4(x4,d4)v4(x4,d4)+f5(x5)f4(x4)最优决策 d4*D1D1E E55+0=5*5D1ED2D2E E22+0=2*2D2E求 最 短 路 径14其中*表示最优值,在上表中,由于决策允许集合D4(x4)中的决策是唯一的,因此这个值就是最优值。由此得到f4(x4)的表达式。由于这是
8、一个离散的函数,取值用列表表示:f4(x4)的表达式 x4 f4(x4)最优决策 d4*D1 5 D1E D2 2 D2E 求 最 短 路 径15第三阶段的递推方程为:)(),(min)(44333)(33333xfdxvxfxDd 求 最 短 路 径16由此得到f3(x3)的表达式:x3 f3(x3)最 优 决 策d3*C1 8 C1D1 C2 7 C2D2 C3 12 C3D2 第 二 阶 段 的 递 推 方 程 为:)(),(min)(33222)(22222xfdxvxfxDd从f3(x3)到f2(x2)的递推过程用表格表示如下:求 最 短 路 径17x2 D2(x2)x3 v2(x2
9、,d2)v2(x2,d2)+f3(x3)f2(x2)最优决策 d2*B1 B1C1 B1C2 B1C3 C1 C2 C3 12 14 10 12+8=20*14+7=21 10+12=22 20 B1C1 B2 B2C1 B2C2 B2C3 C1 C2 C3 6 10 4 6+8=14*10+7=17 4+12=16 14 B2C1 B3 B3C1 B3C2 B3C3 C1 C2 C3 13 12 11 13+8=21 12+7=19*11+12=23 19 B3C2 求 最 短 路 径18由此得到f2(x2)的表达式:x2 f2(x2)最优决策d2*B1 20 B1C1 B2 14 B2C1
10、 B3 19 B3C2 求 最 短 路 径19第一阶段的递推方程为:)(),(min)(22111)(11111xfdxvxfxDd 从f2(x2)到f1(x1)的递推过程用表格表示如下:x1 D1(x1)x2 v1(x1,d1)v1(x1,d1)+f2(x2)f1(x1)最优决策 d1*A A B1 A B2 AB3 B1 B2 B3 2 5 1 2+20=22 5+14=19*1+19=20 19 A B 2 求 最 短 路 径20由此得到f1(x1)的表达式x1 f1(x1)最优决策 d1*A 19 A B2 从表达式f1(x1)可以看出,从A到E 的最短路径长度为 19。由f1(x1)
11、向 f4(x4)回朔,得到最短路径为:A B2 C1 D1 E求 最 短 路 径例:例:某公司从甲地向丁地运送物资,运送过程中先后需要经过乙、丙两个中转站,其中乙中转站某公司从甲地向丁地运送物资,运送过程中先后需要经过乙、丙两个中转站,其中乙中转站可以选择乙可以选择乙 1 1 和乙和乙 2 2 两个可选地点,丙中转站可以选择丙两个可选地点,丙中转站可以选择丙 1 1、丙、丙2 2 和丙和丙 3 3 三个可选地点,各三个可选地点,各相邻两地之间的距离如表所示,则甲地到丁地之间的最短距离为相邻两地之间的距离如表所示,则甲地到丁地之间的最短距离为:A A、64 64 B B、74 74 C C、76
12、 76 D D、6868【答案答案】:B B地点地点-距离距离-地点地点乙乙1 1乙乙2 2丙丙1 1丙丙2 2丙丙3 3丁丁甲甲26263030乙乙1 1181828283232乙乙2 2303032322626丙丙1 13030丙丙2 22828丙丙3 3222222资资 源源 分分 配配 问问 题题23 例5.6:有资金4万元,投资A、B、C三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C的投资效益(万吨)和投入资金(万元)关系见下表:项目投入资金ABC1 万元15 万吨13 万吨11 万吨2 万元28 万吨29 万吨30 万吨3 万元40 万吨43 万吨45 万吨
13、4 万元51 万吨55 万吨58 万吨求对三个项目的最优投资分配,使总投资效益最大。资资 源源 分分 配配 问问 题题241.阶段k:每投资一个项目作为一个阶段;2.状态变量xk:投资第k个项目前的资金数;3.决策变量dk:第k个项目的投资;4.决策允许集合:0dkxk5.状态转移方程:xk+1=xk-dk6.阶段指标:vk(xk,dk)见表中所示;7.递推方程:fk(xk)=maxvk(xk,dk)+fk+1(xk+1)8.终端条件:f4(x4)=0资资 源源 分分 配配 问问 题题25k=4,f4(x4)=0k=3,0d3x3,x4=x3-d3x3D3(x3)x4v3(x3,d3)v3(x
14、3,d3)+f4(x4)f3(x3)d3*00000+0=0000100+0=01101111+0=11*1110200+0=0111111+0=112203030+0=30*3020300+0=0121111+0=11213030+0=303304545+0=45*4530400+0=0131111+0=11223030+0=30314545+0=454405858+0=58*584资资 源源 分分 配配 问问 题题26k=2,0d2x2,x3=x2-d2x2D2(x2)x3v2(x2,d2)v2(x2,d2)+f3(x3)f2(x2)d2*00000+0=0000100+11=111101
15、313+0=13*1310200+30=30*111313+11=242202929+0=293000300+45=45*121313+30=43212929+11=403304343+0=434500400+58=58131313+45=58222929+30=59*314343+11=544405555+0=55592资资 源源 分分 配配 问问 题题27k=1,0d1x1,x2=x1-d1x1D1(x1)x2v1(x1,d1)v1(x1,d1)+f2(x2)f1(x1)d1*0400+59=59131515+45=60*222828+30=58314040+13=534405151+0=
16、51601最优解为 x1=4,d1*=1,x2=x1-d1=3,d2*=0,x3=x2-d2*=3,d3=3,x4=x3-d3=0,即项目 A 投资 1 万元,项目 B 投资 0 万元,项目 C 投资 3 万元,最大效益为 60 万吨。资资 源源 分分 配配 问问 题题28背 包 问 题29 设有n种物品,每一种物品数量无限。第i种物品每件重量为wi,每件价值ci。现有一只可装载重量为 W 的背包,求各种物品应各取多少件放入背包,使背包中物品的价值最高。这个问题可以用整数规划模型来描述。设第i种物品取xi件(i=1,2,n,xi为非负整数),背包中物品的价值为z,则 背 包 问 题30则 Ma
展开阅读全文