动态规划专题讲义解读课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《动态规划专题讲义解读课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 专题 讲义 解读 课件
- 资源描述:
-
1、动态规划专题讲义解读动态规划专题讲义解读|本文只是个人对动态规划的一些见解本文只是个人对动态规划的一些见解,理论性并不一定能保证正确理论性并不一定能保证正确,有不足有不足和缺漏之处请谅解和及时地指出和缺漏之处请谅解和及时地指出.|是信息学竞赛中选手必须熟练掌握的一种算法是信息学竞赛中选手必须熟练掌握的一种算法,他以其多元性广他以其多元性广受出题者的喜爱受出题者的喜爱.|什么是动态规划什么是动态规划|状态状态 阶段阶段 决策决策|一种确立状态的方法一种确立状态的方法|两种简单的动规武器两种简单的动规武器|三种特殊的动态规划三种特殊的动态规划|在学习动态规划之前你一定学过搜索在学习动态规划之前你一
2、定学过搜索.那么搜索与动态规划有什么关系那么搜索与动态规划有什么关系呢呢?我们来下面的一个例子我们来下面的一个例子.|给你一个数字三角形给你一个数字三角形,形式如下形式如下:1 2 3 4 5 67 8 9 10找出从第一层到最后一层的一条找出从第一层到最后一层的一条路路,使得所经过的权值之和最小或使得所经过的权值之和最小或者最大者最大.|无论对与新手还是老手,这都是再熟悉不过的题了,很容易地,我们写无论对与新手还是老手,这都是再熟悉不过的题了,很容易地,我们写出状态转移方程:出状态转移方程:f(i,j)=ai,j+minf(i-1,j)+f(i-1,j+1)|对于动态规划算法解决这个问题,我
3、们根据状态转移方程和状态转移方对于动态规划算法解决这个问题,我们根据状态转移方程和状态转移方向,比较容易地写出动态规划的循环表示方法。但是,当状态和转移非向,比较容易地写出动态规划的循环表示方法。但是,当状态和转移非常复杂的时候,也许写出循环式的动态规划就不是那么简单了。常复杂的时候,也许写出循环式的动态规划就不是那么简单了。|解决方法:解决方法:|我们尝试从正面的思路去分析问题,如上例,不难得出一个非常简单我们尝试从正面的思路去分析问题,如上例,不难得出一个非常简单的递归过程的递归过程:|f1:=f(i-1,j+1);f2:=f(i-1,j);|if f1f2 then f:=f1+ai,j
4、 else f:=f2+ai,j;|显而易见,这个算法就是最简单的搜索算法。时间复杂度为显而易见,这个算法就是最简单的搜索算法。时间复杂度为2n,明显,明显是会超时的。分析一下搜索的过程,实际上,很多调用都是不必要的,是会超时的。分析一下搜索的过程,实际上,很多调用都是不必要的,也就是把产生过的最优状态,又产生了一次。为了避免浪费,很显然,也就是把产生过的最优状态,又产生了一次。为了避免浪费,很显然,我们存放一个我们存放一个opt数组:数组:|Opti,j-每产生一个每产生一个f(i,j),将,将f(i,j)的值放入的值放入opt中,以后再中,以后再次调用到次调用到f(i,j)的时候,直接从的
5、时候,直接从opti,j来取就可以了。来取就可以了。|于是动态规划的状态转移方程被直观地表示出来了,这样节省了思维于是动态规划的状态转移方程被直观地表示出来了,这样节省了思维的难度,减少了编程的技巧,而运行时间只是相差常数的复杂度,而的难度,减少了编程的技巧,而运行时间只是相差常数的复杂度,而且在相当多的情况下,递归算法能更好地避免浪费,在比赛中是非常且在相当多的情况下,递归算法能更好地避免浪费,在比赛中是非常实用的实用的.记忆化的功效|可以看出动态规划的实质就是可以看出动态规划的实质就是|这也就是为什么我们常说动态规划必须满足重叠子问题的原因这也就是为什么我们常说动态规划必须满足重叠子问题的
6、原因.记忆化记忆化,正符合了这个要求正符合了这个要求.|或许有一种对动态规划的简单称法或许有一种对动态规划的简单称法,叫分阶段决策叫分阶段决策.其实我认为这个称法并其实我认为这个称法并不是很能让人理解不是很能让人理解.那么下面我们来看看阶段那么下面我们来看看阶段,状态状态,决策这三者间得关系决策这三者间得关系吧吧.|状态是表现出动态规划核心思想的一个东西状态是表现出动态规划核心思想的一个东西.而分阶段决策这个东西有而分阶段决策这个东西有似乎没有提到状态似乎没有提到状态,这是不科学的这是不科学的.|阶段阶段,有些题目并不一定表现出一定的阶段性有些题目并不一定表现出一定的阶段性.数字三角形的阶段就
7、是每数字三角形的阶段就是每一层一层.这里我们引入一个概念这里我们引入一个概念-以前状态以前状态.但阶段不是以前状态但阶段不是以前状态,状态是状态是阶段的表现形式阶段的表现形式.数字三角形的以前状态就是当前层的前一层数字三角形的以前状态就是当前层的前一层.|那什么是决策呢那什么是决策呢?我们看看下面一张图就知道了我们看看下面一张图就知道了.显然,从上图可以看出,当前状态通过决策,回到了以前状态.可见决策其实就是状态之间的桥梁。而以前状态也就决定了当前状态的情况。数字三角形的决策就是选择相邻的两个以前状态的最优值。|我们一般在动规的时候所用到的一些数组,也就是用来存储每个状态我们一般在动规的时候所
8、用到的一些数组,也就是用来存储每个状态的最优值的。的最优值的。|我们就从动态规划的要诀,也就是核心部分我们就从动态规划的要诀,也就是核心部分“状态状态”开始,来逐步了开始,来逐步了解动态规划。解动态规划。|拦截导弹(拦截导弹(Noip2002Noip2002)|某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种导弹拦截系统导弹拦截系统 有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高但是以后每一发炮弹都不能高 于前一发的高度。于前一发的高度。某天,
9、雷达捕捉到敌某天,雷达捕捉到敌国的导弹来袭。由于该系统还在试用阶段,所以国的导弹来袭。由于该系统还在试用阶段,所以 只有一套系统,因此只有一套系统,因此有可能不能拦截所有的导弹。输入导弹依次飞来的高度,计算这套系有可能不能拦截所有的导弹。输入导弹依次飞来的高度,计算这套系统最多能拦截多少导弹。统最多能拦截多少导弹。|状态的表示状态的表示fi,表示当第,表示当第i个导弹必须选择时,前个导弹必须选择时,前i个导弹最多能拦个导弹最多能拦截多少。截多少。|每个导弹有一定的高度,当前状态就是以第每个导弹有一定的高度,当前状态就是以第i个导弹为最后一个打的导个导弹为最后一个打的导弹。以前状态就是在这个导弹
10、以前打的那个导弹。弹。以前状态就是在这个导弹以前打的那个导弹。|显然这是十分能够体现状态间的联系的题目。显然这是十分能够体现状态间的联系的题目。|给出两个字符串序列。求出这样的一个最长的公共子串:子串中的每给出两个字符串序列。求出这样的一个最长的公共子串:子串中的每个字符都能在两个原串中找到,而且每个字符的顺序和原串中的顺序个字符都能在两个原串中找到,而且每个字符的顺序和原串中的顺序一致。一致。|交错匹配(最长公共子串的改编)交错匹配(最长公共子串的改编)给你两排数字给你两排数字,只能将两排中数字相同的两个位置相连只能将两排中数字相同的两个位置相连,而每次相连必须有而每次相连必须有两个匹配形成
11、一次交错两个匹配形成一次交错,交错的连线不能再和别的交错连线有交点交错的连线不能再和别的交错连线有交点.问这问这两排数字最多能形成多少个交错匹配两排数字最多能形成多少个交错匹配.2 3 3 2 4 1 5 1 3 5 103 1 2 3 2 4 12 1 5 5 3 状态的表示状态的表示fi,jfi,j表示前表示前i i个第一排的数字和前个第一排的数字和前j j个第二排的数字搭配个第二排的数字搭配的最优值。的最优值。当前的状态就是当前你枚举到的一组交错的后面两个位置当前的状态就是当前你枚举到的一组交错的后面两个位置.例如上图中当例如上图中当前状态是前状态是3 3和和1(1(第一组交错第一组交错
12、),),枚举他的以前状态就有枚举他的以前状态就有1 3.1 3.这样在这样在1 31 3之前之前会有一个最优值存在会有一个最优值存在,因此可以由此得到因此可以由此得到3 13 1的最优值的最优值.|买车票买车票(Ural1031)(Ural1031)Ekaterinburg Ekaterinburg城到城到SverdlovskSverdlovsk城有直线形的铁路线。城有直线形的铁路线。两城之间还有其他一些停靠站两城之间还有其他一些停靠站,总站数为总站数为N N。各站按照离各站按照离EkaterinburgEkaterinburg城的距离编号。城的距离编号。EkaterinburgEkateri
13、nburg城编号为城编号为1 1,SverdlovskSverdlovsk城编号为城编号为N N。某两站之间车票价格由这两站的距离某两站之间车票价格由这两站的距离X X决定决定.当当0X=L10X=L1时,票价为时,票价为C1C1元元.当当L1X=L2L1X=L2时,票价为时,票价为C2C2元元.当当L2X=L3L2X=L3时,票价为时,票价为C3C3元元.当两站距离大于当两站距离大于L3L3时没有直达票,所以有时候要买几时没有直达票,所以有时候要买几次票做几次车才行。次票做几次车才行。比如,在上面的例图中,比如,在上面的例图中,2-62-6没有直达票,有几种买票没有直达票,有几种买票方法可以
14、从方法可以从2-62-6,其中一种是买,其中一种是买C2C2元的元的2-32-3车票,再买车票,再买C3C3元的元的3-63-6车票。车票。给定起点站和终点站还有给定起点站和终点站还有L1,L2,L3,C1,C2,C3L1,L2,L3,C1,C2,C3,求出要从,求出要从起点到终点最少要花多少钱起点到终点最少要花多少钱.怎么办怎么办当前所在的某个车站这一题的以前状态其实只有这一题的以前状态其实只有3种种.即满足即满足3种距离种距离(收费收费)情况情况的的3个车站个车站.要知道这要知道这3个车站可以先做一个预处理个车站可以先做一个预处理.显然这显然这3个车站在满足距离限制的条件下应该越远越好个车
15、站在满足距离限制的条件下应该越远越好.|预处理预处理 很容易想出一个很容易想出一个N2的预处理的预处理,但是那样是会超时的但是那样是会超时的.由于尽量要让车站离得远由于尽量要让车站离得远(费用是一样的啊费用是一样的啊 )因此在每种收费情况下因此在每种收费情况下,每个车站的以前状态车站一定每个车站的以前状态车站一定是递增的序列是递增的序列.这里是只要这里是只要O(N)的程序的程序:for j:=1 to 3 do begin k:=en-1;for i:=en downto be do begin while(wayi-wayk=be)do dec(k);pij:=k+1;end;end;数组数
16、组Pij表示的是表示的是I状态的第状态的第j种以前状态种以前状态.动态规划的部分动态规划的部分for i:=be+1 to en do 枚举当前状态枚举当前状态 begin costi:=maxlongint;for j:=1 to 3 do 枚举以前状态枚举以前状态 beginif (piji)and(costi costpij+cj)then costi:=costpij+cj;end;end;|有时候当前状态确定后有时候当前状态确定后,以前状态就已经确定以前状态就已经确定,则无需枚举则无需枚举.|TomTom是一个非常有创业精神的人,由于大学学的是汽车制造专业,所以是一个非常有创业精神的
17、人,由于大学学的是汽车制造专业,所以毕业后他用有限的资金开了一家汽车零件加工厂,毕业后他用有限的资金开了一家汽车零件加工厂,专门为汽车制造商专门为汽车制造商制造零件。由于资金有限,他只能先购买一台加工机器。现在他却遇制造零件。由于资金有限,他只能先购买一台加工机器。现在他却遇到了麻烦,多家汽车制造商需要他加到了麻烦,多家汽车制造商需要他加 工一些不同零件(由于厂家和零工一些不同零件(由于厂家和零件不同,所以给的加工费也不同),而且不同厂家对于不同零件的加件不同,所以给的加工费也不同),而且不同厂家对于不同零件的加工时间要求不同(有些加工时间要求甚至是冲突的,但开始和结束时工时间要求不同(有些加
18、工时间要求甚至是冲突的,但开始和结束时间相同不算冲突)。间相同不算冲突)。TomTom当然希望能把所有的零件都加工完,以得到更当然希望能把所有的零件都加工完,以得到更多的加工费,但当一些零件的加工时间要求有冲突时,在某个时间内多的加工费,但当一些零件的加工时间要求有冲突时,在某个时间内他只能选择某种零件加工(因为他只有一台机器),为了赚得尽量多他只能选择某种零件加工(因为他只有一台机器),为了赚得尽量多的加工费,的加工费,TomTom不知如何进行取舍。不知如何进行取舍。|Tom的烦恼的烦恼 按结束时间排序,枚举结束时间作为当前状态按结束时间排序,枚举结束时间作为当前状态,以前状态就是该结束时间
19、对应以前状态就是该结束时间对应的起始时间,这是已经确定的的起始时间,这是已经确定的.|文字游戏文字游戏(fairfox(fairfox邀请赛邀请赛1)1)给你一份单词表,和一个句子。求出该句子能有多少中不同的划分方法给你一份单词表,和一个句子。求出该句子能有多少中不同的划分方法.例如例如:单词是单词是ab cd a b c dab cd a b c d 句子是句子是abcdabcd 他共有他共有4 4种完全划分方案种完全划分方案:ab/cd a/b/c/d a/b/cd ab/c/d;ab/cd a/b/c/d a/b/cd ab/c/d;当前状态就是单词在句子中向后靠的位置当前状态就是单词在
20、句子中向后靠的位置,以前状态就是确定这个单词位以前状态就是确定这个单词位置以后置以后,除掉这个单词长度后的一个位置除掉这个单词长度后的一个位置.状态转移方程状态转移方程是是:Fi:=Fi+Fi-length(wordj):Fi:=Fi+Fi-length(wordj)IOI IOI中有一题中有一题前缀前缀也是类似的题目也是类似的题目.|状态转移方程的构造无疑是动态规划过程中最重要的一步状态转移方程的构造无疑是动态规划过程中最重要的一步,也是最难的一也是最难的一步步.对于大多数的动态规划对于大多数的动态规划,寻找状态转移方程有一条十分高效的通道寻找状态转移方程有一条十分高效的通道,就是就是寻找变
21、化中的不变量寻找变化中的不变量.定量处理的过程也就是决策实施的过程定量处理的过程也就是决策实施的过程.|最佳加法表达式最佳加法表达式|有一个由有一个由1.91.9组成的数字串组成的数字串.问如果将问如果将m m个加号插入到这个数字串中个加号插入到这个数字串中.使使得所形成的算术表达式的值最小得所形成的算术表达式的值最小.或许你不明白我在说什么,那么我们通过题目来说明吧|这一题中的定量是什么呢这一题中的定量是什么呢?因为是添入加号因为是添入加号,那么添完加号后那么添完加号后,表达式的最表达式的最后一定是个数字串后一定是个数字串,这就是定量这就是定量.从这里入手从这里入手,不难发现可以把以前状态认
22、不难发现可以把以前状态认为是在前为是在前i个字符中插入个字符中插入k-1个加号个加号(这里的这里的i是当作决策在枚举是当作决策在枚举),然后然后i+1到最后一位一定是整个没有被分割的数字串到最后一位一定是整个没有被分割的数字串,第第k个加号就添在个加号就添在i与与i+1个个数字之间数字之间.这样就构造出了整个数字串的最优解这样就构造出了整个数字串的最优解.而至于前而至于前i个字符中插入个字符中插入k-1个加号个加号,这又回到了原问题的形式这又回到了原问题的形式,也就是回到了以前状态也就是回到了以前状态,所以状态所以状态转移方程就能很快的构造出来了转移方程就能很快的构造出来了.|用用fi,j,表
23、示的是在前表示的是在前i个字符中插入个字符中插入j个加号能达到的最小值个加号能达到的最小值,最后的答案也最后的答案也就是就是Flength(s),m.|于是就有一个动规的方程于是就有一个动规的方程:Fi,j:=min(fi,j,fk,j-1+numk+1,i)numk+1,i表示表示k+1位到位到i位所形成的数字位所形成的数字.这里显然是把加号插入了第这里显然是把加号插入了第k+1个位置上个位置上.|知道了这一题怎么做以后知道了这一题怎么做以后,乘积最大的一题也是完全一样的形式乘积最大的一题也是完全一样的形式,谁还会去谁还会去用搜索用搜索?|现在大概大家已经了解了定量是什么现在大概大家已经了解
24、了定量是什么,那么我们下面通过几道题目来了那么我们下面通过几道题目来了解一下定量的威力解一下定量的威力.|游戏游戏(Noip2003普及组普及组)|这一题的描述简单说一下这一题的描述简单说一下:在一个圈的周围有在一个圈的周围有n个石子个石子,将他们划分成将他们划分成m堆堆(每堆中的石子必须连续相邻每堆中的石子必须连续相邻),每一堆石子计算出他们的总重量每一堆石子计算出他们的总重量mod10的值的值,然后将这些值相乘然后将这些值相乘,求得到的结果最大最小值是多少求得到的结果最大最小值是多少.|这一题作者其实是根据最佳加法表达式改编的这一题作者其实是根据最佳加法表达式改编的.但是他加了一个在圈上的
25、但是他加了一个在圈上的条件条件,怎么办呢怎么办呢?寻找定量!|可想而知可想而知,因为至少要分成因为至少要分成1堆堆,那么至少有两个石子之间是会被分隔开那么至少有两个石子之间是会被分隔开的的.这就是定量这就是定量!当划分数当划分数1时时,一定有两个相邻石子被划分到不同的堆一定有两个相邻石子被划分到不同的堆里去里去!|于是这个圈被这样的理解断成了一条线于是这个圈被这样的理解断成了一条线,解法就和最佳加法表达式一样解法就和最佳加法表达式一样了了.|当然这个断开的位置是需要枚举的当然这个断开的位置是需要枚举的,然后保留下一个最优值然后保留下一个最优值.显然这个断显然这个断开的操作对整个过程没有影响开的
展开阅读全文