动态规划(普及组-)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《动态规划(普及组-)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 普及 课件
- 资源描述:
-
1、动态规划(普及组)绍兴柯桥中学吴建锋认识动态规划n动态规划在运筹学等领域都得到很大的运用,它是求解最优化分阶段决策问题的一种数学方法,大约产生于50年代。1951年美国数学家Bellman等人根据一类多阶段决策问题的特点,把多阶段决策问题变换为一系列互相联系的单阶段问题,然后逐个加以解决。与此同时,他提出了解决这类问题的“最优性原理”,研究了许多实际问题,从而创建了解决最优化问题的一种新的方法动态规划。多阶段决策过程123n“动态”的内涵n在分阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前的状态,又随即引起状态的改变(转移),一个决策序列就是在变化的状态中产生出来的
2、,所以有“动态”的含义。因此,把处理它的方法称为动态规划方法。问题1:求最短路径长度n假如有下图所示的交通示意图,有向边上的数值表示边的长度,求A到D的最短路径的长度。ABCD13192815解法1:从初始阶段出发的顺推求解n1、用fi表示A到结点i的最短距离 n2、我们可以求得fA=13,fB19(第一阶段)n3、第二阶段求解过程如下:nfB+28=41 fD的候选最优解nfC+15=34 fD的候选最优解 n4、保存较优解:fD=minfB+28,fC+15 解法2:目标阶段出发的逆推求解n1、如果用fi表示编号为i的结点到终点d的最短距离,那么动态规划分阶段求解的过程如下所示:n(1)f
3、D:=0 初始化n(2)fB:=28+fD;fC:=15+fD 第一阶段求解n(3)fA:=min13+fB,19+fC 状态转移方程的体现,第二阶段求解什么叫状态转移方程n对于当前阶段的某个状态,必定有有上个阶段的子问题的某一批状态通过对应的决策变换而来,这些子问题的一批状态通过对应的决策应用,就导致了状态转移,新的状态就是当前阶段的某个状态。由于这个新状态的子状态可能不止一个,所以决策后的对应局部解也可能不止一个,在这些解中取一个最优解,就是当前阶段当前状态的最优解,这个求最优解的过程可用一个表达式来描述,这个表达式就是状态转移方程。状态转移方程应用举例n在下列交通路线中,求节点1到节点1
4、0 的最短路径的长度。14326598710132191517324527111381916251120分阶段决策的手工计算n第一阶段:nf2=f1+13=13;f3=f1+21=21;f4=f1+9=9n第二阶段:nf5=minf2+15,f3+17,f4+24=28;nf6=minf2+3,f3+5,f4+27=16n第三阶段:nf7=minf5+11,f6+8=24;nf8=minf5+13,f6+19=35;nf9=minf6+16=32n 目标阶段求解n第四阶段:nf10=minf7+25,f8+11,f9+20=46具体化的状态转移方程n1、f5=minfj+x,,f6=minfk
5、+y,n2、fj+x中的fj就是上阶段子问题各状态的最优解;而x则是某个子状态转移到当前状态产生的决策效应(或者是代价)一般化的状态转移方程n实际编程实现时,状态转移方程往往是一个通用计算式,在这个通用计算式中往往会包含各种子状态、子状态对应子问题的最优解、决策等参数。动态规划的算法设计n如果用i表示当前需求解的阶段号(有时为了描述的方便,i也可表示当前阶段的前一个阶段),j表示当前阶段各个状态(或者说是阶段的各个节点编号),k表示前一阶段各个子状态能选择的策略,用fI,j表示起点1到第i阶段编号为j的结点(也可理解为状态)的最短距离,那么上面问题用动态规划求解的大致程序结构如下:n穷举所有的
6、阶段(for i:=1 to 4 do)n 穷举当前阶段i所有可能的状态jn 穷举j状态所有对应的子状态的所有可选择的策略kn FI,j:=minfi-1,j1+xj1,k|j1表示状态j所有可能的子状态程序代码实现n输入数据:n2 3 4 0n5 6 0n7 8 9 0n10 0n0 13 21 9 maxint maxint maxint maxint maxint maxintnmaxint 0 maxint maxint 15 3 maxint maxint maxint maxintnmaxint maxint 0 maxint 17 5 maxint maxint maxint m
7、axintnmaxint maxint maxint 0 24 27 maxint maxint maxint maxintn数据结构nAI,j=k表示第i阶段的第j个决策点(后继节点)是k;nDI,j=k表示i和j节点之间的直接联边长度是k,如果是maxint则表示没有直接联边。如果是0则表示节点本身。程序框架nfor i:=1 to 4 donbeginn j:=1;n repeatn j2:=aI,j;n k:=1;n repeatn j1:=ai-1,k;n if dj1,j2maxint then fI,j2:=minfI,j2,fi-1,j1+dj1,j2n inc(k);n un
8、til ai-1,k=0;n inc(j);n until aI,j=0;nend;一些关键的要素n1、阶段n每个阶段的处理是相同的。n2、状态n每个抽象化的节点所共有的特性值。n3、决策n所选择的处理。分析动态规划n1、何时可考虑动态规划n2、阶段、状态、决策如何提炼n3、如何抽象出状态转移方程问题2:数字三角形n下图所示为一个数字三角形,其中三角形中的数值为不超过100的整数,现规定从最顶层往下走到底层,每一步可沿左斜线向下或右斜线向下走。n 7n 3 8n 8 1 0n 2 7 4 4n4 5 2 6 5n 假设三角形行数=100,编程计算从最顶层走到最底层的一条路径,使得沿着该路径所经
9、过的数字之和最大,输出最大值。输入和输出ntrigon.inn7n3 8n8 1 0n2 7 4 4n4 5 2 6 5ntrigon.outn30为什么可用动态规划n 7n 3 8n 8 1 0n 2 7 4 4n4 5 2 6 5算法设计n1、阶段就是行号n2、状态就是每行上的某个数字(位置号表示)n3、决策就是向右(还是向左)的走法。状态转移方程n若用fI,j表示起点到i阶段第j个数字的最优解,用j1表示j对应的子状态,xj1,k表示j1子状态变换到j状态中的第k个决策所产生的决策效应,则可写出状态转移方程如下:nfI,j=maxfi-1,j1+xj1,k|j1和k最多取二个值结合数据结
10、构调整方程n根据输入数据特点,考虑用aI,j保存第i行第j个位置上的数字,那么前面方程中j1可取的值为j-1和j,所以状态转移方程可细化为:nfI,j=maxfi-1,j+aI,j,fi-1,j+1+aI,jn 其中1=i=n,1=j=i,初始化时f1,1=7。写出核心程序段nfillchar(f,sizeof(f),0);nf1,1:=a1,1;nfor i:=2 to n do 枚举阶段n for j:=1 to I do 枚举状态n for k:=j-1 to j do 枚举决策n if fI,jfi-1,k+aI,j then fI,j:=fi-1,k+aI,j;n这样最后求得的fn,
11、n是否是本问题的最优解?问题3:彩石运输n阿强是一个汽车运输工,他正在给一项装饰工程运输所需的彩色石头。这些石头的颜色各异,价格也各不相同。有一天阿强突发奇想,他想在一堆彩石中有选择地把彩石装上他的卡车,使得卡车上装载的石头总价值是所有装载方案中最大的。现在有一堆彩石堆放在阿强面前,他知道任何两块石头的颜色都是不同的,但两块颜色不同的石头的重量和价格可能相同。n 阿强的卡车总共可装载的重量是W,而且他知道总的彩石的块数,请你帮助阿强确定一个方案,满足阿强的奇想。n 输入文件stone.in的第一行是二个整数,依次表示卡车的载重量W和总的彩石块数n,下面共有n行,每行包含二个用空格分隔的整数,依
展开阅读全文