大学精品课件:第七章 动态规划(第1-2节).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:第七章 动态规划(第1-2节).ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学精品课件:第七章 动态规划第1-2节 大学 精品 课件 第七 动态 规划
- 资源描述:
-
1、第第1页页第第2页页1.动态规划的产生动态规划的产生动态规划是运筹学的一个重要分支,它是解决多阶动态规划是运筹学的一个重要分支,它是解决多阶段决策过程最优化的一种数学方法。段决策过程最优化的一种数学方法。动态规划产生于动态规划产生于20世纪世纪50年代初,由美国数学家贝年代初,由美国数学家贝尔曼(尔曼(R.Bellman)等人提出。)等人提出。第第3页页(1)把多阶段决策问题)把多阶段决策问题 多个互相联系的单阶段多个互相联系的单阶段问题,逐个解决。问题,逐个解决。(2)提出最优性原理,并成功解决了生产管理、工)提出最优性原理,并成功解决了生产管理、工程技术等方面的多个实际问题。程技术等方面的
2、多个实际问题。第第4页页2.动态规划的特点动态规划的特点(1)没有一个标准的数学表达式和明确定义的一组)没有一个标准的数学表达式和明确定义的一组规则,必须对具体问题进行具体分析处理(线性规规则,必须对具体问题进行具体分析处理(线性规划有标准的数学表达式,任何线性规划问题都可以划有标准的数学表达式,任何线性规划问题都可以利用单纯形法进行求解)。利用单纯形法进行求解)。第第5页页(2)动态规划是考查问题的一种途径,而不是一种)动态规划是考查问题的一种途径,而不是一种特殊算法。特殊算法。(3)许多问题,特别是离散性问题,用动态规划方)许多问题,特别是离散性问题,用动态规划方法去处理,常比线性规划和非
3、线性规划更有效。法去处理,常比线性规划和非线性规划更有效。第第6页页3.动态规划模型的分类动态规划模型的分类 根据动态规划模型中的时间参量是离散变量还是连根据动态规划模型中的时间参量是离散变量还是连续变量:续变量:(1)离散型。)离散型。(2)连续型。)连续型。第第7页页根据动态规划模型中的各类参数是已知的还是未根据动态规划模型中的各类参数是已知的还是未知的:知的:(1)确定型。)确定型。(2)随机型。)随机型。第第8页页动态规划模型动态规划模型离散确定型动态规划模型离散确定型动态规划模型离散随机型动态规划模型离散随机型动态规划模型连续确定型动态规划模型连续确定型动态规划模型连续随机型动态规划
4、模型连续随机型动态规划模型本章主要针对离散确定型问题和连续确定型问题,本章主要针对离散确定型问题和连续确定型问题,介绍动态规划的基本思想、原理和方法。介绍动态规划的基本思想、原理和方法。第第9页页第第10页页在生产和科学实验中,有一类特殊的活动过程,它在生产和科学实验中,有一类特殊的活动过程,它们可以按时间顺序分解成若干个相互联系的阶段,们可以按时间顺序分解成若干个相互联系的阶段,而每一个阶段都要做出决策,当每个阶段的决策都而每一个阶段都要做出决策,当每个阶段的决策都确定后,就形成一个决策序列。确定后,就形成一个决策序列。第第11页页这种由前后相互联系、具有链状结构的多个阶段所这种由前后相互联
5、系、具有链状结构的多个阶段所组成的活动过程称为多阶段决策过程。组成的活动过程称为多阶段决策过程。1决策决策状态状态2决策决策状态状态n决策决策状态状态状态状态状态状态第第12页页多阶段决策过程的特点:多阶段决策过程的特点:1.本阶段的决策依赖于本阶段面临的状态;本阶段的决策依赖于本阶段面临的状态;2.本阶段的决策决定着下一阶段的状态(即引起状本阶段的决策决定着下一阶段的状态(即引起状态的转移);态的转移);第第13页页决策序列就是在变化的状态中产生的,故有决策序列就是在变化的状态中产生的,故有“动态动态”的含义,从而把处理这种多阶段决策过程的方法称的含义,从而把处理这种多阶段决策过程的方法称为
6、动态规划方法。为动态规划方法。第第14页页使用动态规划方法解决多阶段决策过程问题,首先使用动态规划方法解决多阶段决策过程问题,首先要将实际问题写成动态规划模型,此时就要用到以要将实际问题写成动态规划模型,此时就要用到以下几个概念:下几个概念:第第15页页1.阶段阶段(1)阶段)阶段 为了把问题转化为多阶段决策过程,一般根据时间为了把问题转化为多阶段决策过程,一般根据时间或空间的自然特征将问题分解成若干个互相联系的或空间的自然特征将问题分解成若干个互相联系的阶段,以便能按一定的次序去求解。阶段,以便能按一定的次序去求解。第第16页页(2)阶段变量)阶段变量描述阶段的变量,常用字母描述阶段的变量,
7、常用字母 k 表示第表示第 k 阶段。阶段。AB1B2C1C2C3C4D1D2D3E1E2E3F1F2G531368766835358422123366253543第第17页页例:从例:从 A 到到 G 可以分成:可以分成:(1)从)从 A 到到 B(B有两种选择有两种选择B1,B2)(2)从)从 B 到到 C(C有四种选择有四种选择C1,C2,C3,C4)(3)从)从 C 到到 D(D有三种选择有三种选择D1,D2,D3)(4)从)从 D 到到 E(E有三种选择有三种选择E1,E2,E3)(5)从)从 E 到到 F(F有两种选择有两种选择F1,F2)(6)从)从 F 到到 G 六个阶段。六个
8、阶段。k=1,2,3,4,5,6。第第18页页2.状态状态(1)状态)状态 各阶段开始时所处的自然状况或客观条件。各阶段开始时所处的自然状况或客观条件。通常一个阶段有若干个状态。通常一个阶段有若干个状态。(2)状态变量)状态变量 描述各阶段状态的变量,常用描述各阶段状态的变量,常用 sk 来表示第来表示第 k 阶段的阶段的状态变量。状态变量。第第19页页(3)状态变量集合)状态变量集合 各阶段状态变量的集合,常用各阶段状态变量的集合,常用 Sk 来表示第来表示第 k 阶段状阶段状态变量态变量 sk 的取值集合。的取值集合。第第20页页(4)状态变量的无后效性(马尔科夫性)状态变量的无后效性(马
9、尔科夫性)如果某阶段状态确定后,则以后各阶段的决策仅同如果某阶段状态确定后,则以后各阶段的决策仅同该阶段的状态有关,而同该阶段以前各阶段的状态该阶段的状态有关,而同该阶段以前各阶段的状态无关。(即仅仅根据该阶段的状态就可以对以后各无关。(即仅仅根据该阶段的状态就可以对以后各阶段进行决策了。)阶段进行决策了。)注意:如果所选择的状态变量不满足无后效性,则注意:如果所选择的状态变量不满足无后效性,则不能构造动态规划模型。不能构造动态规划模型。第第21页页例:例:设定每个阶段的出发位置为该阶段的状态变量。设定每个阶段的出发位置为该阶段的状态变量。AB1B2C1C2C3C4D1D2D3E1E2E3F1
10、F2G531368766835358422123366253543第第22页页因为每个阶段的出发位置选定后,从该位置以后的因为每个阶段的出发位置选定后,从该位置以后的铺管路线只与该位置有关,不受以前铺管路线的影铺管路线只与该位置有关,不受以前铺管路线的影响,所以满足状态的无后效性,故可以作为状态变响,所以满足状态的无后效性,故可以作为状态变量。量。第第23页页从从 A 到到 G 可以的可以的 6 个阶段的状态分别为:个阶段的状态分别为:S1=A:第一阶段只有一个状态:第一阶段只有一个状态 AS2=B1,B2:第二阶段有两个状态:第二阶段有两个状态B1、B2S3=C1,C2,C3,C4:第三阶段
11、有四个状态:第三阶段有四个状态C1、C2、C3、C4第第24页页S4=D1,D2,D3:第四阶段有三个状态:第四阶段有三个状态D1、D2、D3S5=E1,E2,E3:第五阶段有三个状态:第五阶段有三个状态E1、E2、E3S6=F1,F2:第六阶段有二个状态:第六阶段有二个状态 F1、F2 第第25页页3.决策决策(1)决策)决策当某阶段的状态确定以后,就可以作出不同的决定当某阶段的状态确定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定(或选择),从而确定下一阶段的状态,这种决定称为决策。称为决策。第第26页页(2)决策变量)决策变量描述决策的变量,常用描述决策的变量,常
12、用 uk(sk)表示第表示第 k 阶段状态为阶段状态为 sk 时的决策变量,它是状态变量的函数。时的决策变量,它是状态变量的函数。第第27页页(3)允许决策集合)允许决策集合决策变量的取值范围,常用决策变量的取值范围,常用 Dk(sk)表示第表示第 k 阶段状阶段状态为态为 sk 时的允许决策集合,显然时的允许决策集合,显然 uk(sk)Dk(sk)。第第28页页例:例:从第二阶段的状态从第二阶段的状态 B1 出发,可选择下一阶段的出发,可选择下一阶段的C1、C2、C3,即允许决策集合为:,即允许决策集合为:D2(B1)=C1,C2,C3;若选择点若选择点C2,则该决策可表示为:,则该决策可表
13、示为:u2(B1)=C2 第第29页页4.策略策略(1)全过程)全过程一个一个 n 阶段决策过程,从第阶段决策过程,从第 1 阶段开始到第阶段开始到第 n 阶段阶段终止的过程。终止的过程。(2)后部子过程或)后部子过程或 k 子过程子过程一个一个 n 阶段决策过程,从第阶段决策过程,从第 k 阶段开始到第阶段开始到第 n 阶段阶段终止的过程。终止的过程。第第30页页(3)全过程策略(简称策略)全过程策略(简称策略)一个一个 n 阶段决策过程,从第阶段决策过程,从第 1 阶段开始到第阶段开始到第 n 阶段阶段为止的各阶段的决策按顺序排列组成的集合,记作为止的各阶段的决策按顺序排列组成的集合,记作
14、p1,n(s1)=u1(s1),u2(s2),,un(sn)=s1,u1,s2,u2,sn,un,sn+1 。第第31页页(4)后部子过程策略或)后部子过程策略或 k 子过程策略子过程策略(简称子策略简称子策略)一个一个 n 阶段决策过程,从第阶段决策过程,从第 k 阶段开始到第阶段开始到第 n 阶段阶段为止的各阶段的决策按顺序排列组成的集合,记作为止的各阶段的决策按顺序排列组成的集合,记作pk,n(sk)=uk(sk),uk+1(sk+1),un(sn)=sk,uk+1,sk+1,uk+1,sn,un,sn+1。第第32页页(5)允许策略集合)允许策略集合在实际问题中,可供选择的策略有一定的
15、范围,此在实际问题中,可供选择的策略有一定的范围,此范围称为允许策略集合。范围称为允许策略集合。(6)最优策略)最优策略从允许策略集合中找出达到最优效果的策略称为最从允许策略集合中找出达到最优效果的策略称为最优策略。优策略。第第33页页5.状态转移方程状态转移方程 状态转移方程状态转移方程 由一个阶段的状态到下一个阶段由一个阶段的状态到下一个阶段的状态的演变过程。的状态的演变过程。动态规划中,本阶段的状态往往是上一阶段状态和动态规划中,本阶段的状态往往是上一阶段状态和上一阶段决策的结果。上一阶段决策的结果。第第34页页由第由第 k 阶段到第阶段到第 k+1 阶段的状态转移方程:阶段的状态转移方
16、程:第第 k 阶段的状态阶段的状态 sk 和决策和决策 uk(sk)一旦确定,则第一旦确定,则第 k+1 阶段的状态阶段的状态 sk+1 也就完全确定,即也就完全确定,即sk+1=Tk(sk,uk(sk),其中,其中 Tk 称为状态转移函数。称为状态转移函数。第第35页页例:例:状态转移方程为:状态转移方程为:sk+1=uk(sk)AB1B2C1C2C3C4D1D2D3E1E2E3F1F2G531368766835358422123366253543第第36页页6.指标函数指标函数(1)过程指标函数定义)过程指标函数定义用于衡量所选定策略优劣的数量指标,常用用于衡量所选定策略优劣的数量指标,常
展开阅读全文