管理运筹学课件第9章动态规划.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理运筹学课件第9章动态规划.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 运筹学 课件 章动 规划
- 资源描述:
-
1、2022-10-3课件1第第9章章 动态规划动态规划课件22022-10-3教学目标与要求教学目标与要求n【教学目标】【教学目标】n1.理解下列基本概念:状态变量,决策变量,策略,状态转移方程,指标函数和最优理解下列基本概念:状态变量,决策变量,策略,状态转移方程,指标函数和最优值函数值函数n2.理解动态规划的基本方程和最优化原理理解动态规划的基本方程和最优化原理n3.理解动态规划模型建立过程理解动态规划模型建立过程n5.掌握顺序算法与逆序算法解题方法掌握顺序算法与逆序算法解题方法n【知识结构】【知识结构】模型:最短路问题、一维资源分配问题、模型:最短路问题、一维资源分配问题、设备负荷问题、生
2、产存贮问题设备负荷问题、生产存贮问题 概念:基本概念、基本方程和最优化原理概念:基本概念、基本方程和最优化原理 算法:顺序算法、逆序算法算法:顺序算法、逆序算法 计算机解法(计算机解法(Lingo,WinQSB 或或 Excel)知识知识目标目标 管理管理 问题问题 技能技能目标目标 课件32022-10-3引例引例 马车驿站问题马车驿站问题124833538667863235AB2B1D2D1C3C2C4C1EA B C D E阶段阶段1阶段阶段2阶段阶段3阶段阶段44个阶段个阶段EED1D2D1D2D1D2D1D2C2C3C4C1C2C3 1D1E1D2E2C4D1 C4D22C3D1 C
3、3D22C2D1 C2D22C1D1C1D23B2C2B2C3B2C43B1C1B1C2B1C3B1B22AB1AB2AB2B1C4C3C2C1D1D24321终点终点路线数路线数可选路线可选路线起点起点阶段阶段一共有一共有2321=12条不同的路线条不同的路线f(E)=0f(D1)=2f(D2)=1f(C1)=8f(C2)=5f(C3)=4f(C1)=5f(B1)=8f(B2)=11f(A)=13回顾分析过程回顾分析过程:1.将分析对象划分成将分析对象划分成4阶段阶段;2.每阶段始点状态与终点状态有关每阶段始点状态与终点状态有关,而而不考虑始终点状态如何形成不考虑始终点状态如何形成(无记忆性
4、无记忆性);3.每阶段各始点状态为终点状态与始点每阶段各始点状态为终点状态与始点至终点距离之和的最小值至终点距离之和的最小值(状态转移状态转移)这种最优化方法称为动态规划这种最优化方法称为动态规划,由美国由美国数学家贝尔曼等人于数学家贝尔曼等人于20世纪世纪50年代创年代创立立.课件42022-10-3本章主要内容本章主要内容n9.1 动态规划的概念和原理动态规划的概念和原理n9.1.1 动态规划的基本概念动态规划的基本概念n9.1.2 动态规划的最优化原理动态规划的最优化原理n9.2 动态规划的模型和求解动态规划的模型和求解n9.2.1 动态规划模型的建立动态规划模型的建立n9.2.2 动态
5、规划问题的解法动态规划问题的解法n9.3 应用举例应用举例n案例案例1 资源分配问题资源分配问题n案例案例2 设备负荷问题设备负荷问题n案例案例3 生产库存问题生产库存问题n案例案例4 背包问题背包问题n本章小结本章小结课件52022-10-39.1.1 动态规划的基本概念动态规划的基本概念1.阶段阶段:把所给问题的过程,把所给问题的过程,恰当地分为若干个相恰当地分为若干个相互联系的阶段,以便互联系的阶段,以便能按一定的次序去求能按一定的次序去求解。描述阶段的变量解。描述阶段的变量称为阶段变量,常用称为阶段变量,常用k表示。表示。导入案例导入案例中中k=1,2,3,42.状态变量状态变量:每个
6、阶段开始所处的自然状每个阶段开始所处的自然状况或客观条件况或客观条件(用点集表示用点集表示).如引例如引例:第第1阶段的状态就是起点阶段的状态就是起点A,记记为为s1=A;第第2阶段有阶段有2个状态个状态B1,B2,记记为为s2=B1,B2;第第3阶段有阶段有4个状态个状态C1,C2,C3,C4,记为记为s3=C1,C2,C3,C4;第第4阶段有阶段有2个状态个状态D1,D2,记记为为s4=D1,D2;3.决策变量决策变量:在某一阶段的某个状态时的在某一阶段的某个状态时的不同选择不同选择,如引例中如引例中B1状态下状态下有有3种选择种选择:B1C1,B1C2,B1C3这这3种选择构成了允许决策
7、种选择构成了允许决策的集合。不同状态下允许决的集合。不同状态下允许决策的集合也不同,故决策变策的集合也不同,故决策变量是状态变量的函数,即量是状态变量的函数,即xk(sk)D(sk)124833538667863235AB2B1D2D1C3C2C4C1E A B C D E阶段阶段1阶段阶段2阶段阶段3阶段阶段44个阶段个阶段4.策略策略按顺序排列的决策组成的集按顺序排列的决策组成的集合,由过程的第合,由过程的第k阶段开始阶段开始到终止状态为止的过程到终止状态为止的过程(或或k子过程子过程),k子过程的策略称子子过程的策略称子策略,记为策略,记为Pk,n(sk),即即 Pk,n(sk)=xk(
8、sk),xk+1(sk+1),xn(sn)当当k=1时,即为全过程的一个时,即为全过程的一个策略。如引例中:策略。如引例中:DE,即,即4到到5过程起始有过程起始有2个状态,个状态,D1和和D2,因此有,因此有P4,5=D1E,D2E5.状态转移方程状态转移方程确定过程是由一个状态到另确定过程是由一个状态到另一个状态的演变过程。第一个状态的演变过程。第k阶段状态变量值给定后,如阶段状态变量值给定后,如果确定决策变量,第果确定决策变量,第k+1阶阶段状态变量值就完全确定。段状态变量值就完全确定。即:即:sk+1=T(sk,xk)如引例中:若对如引例中:若对AB1,AB2选择了选择了AB1,则则s
9、2=5,B1到到C有有3种选择种选择:B1C1、B1C2、B1C3,若选择了,若选择了B1C2,则则s3=s2+d(B1,C2)=86.指标函数指标函数用来衡量所实现过程优劣的用来衡量所实现过程优劣的一种数量指标。其基本方程一种数量指标。其基本方程有加法和乘法两种形式,通有加法和乘法两种形式,通常加法形式用的较多,其公常加法形式用的较多,其公式为:式为:,111(,.,)(,)nk nkkkniiiiVs x ssv s x7.边界条件边界条件起始或终止条件。起始或终止条件。课件62022-10-35.1.2 动态规划的基本原理动态规划的基本原理124833538667863235AB2B1D
10、2D1C3C2C4C1EA B C D E阶段阶段1阶段阶段2阶段阶段3阶段阶段44个阶段个阶段最优化原理最优化原理(Optimality principle):最优策略具备这样的性质最优策略具备这样的性质:无论初始无论初始状态与初始决策如何状态与初始决策如何,以后诸决策对以后诸决策对以第一个决策所形成的状态作为初以第一个决策所形成的状态作为初始状态的过程而言始状态的过程而言,必然构成最优策必然构成最优策策略策略.通俗地说通俗地说:最优策略的子策略最优策略的子策略也是最优的也是最优的.例如,在导入案例中,最优策略是例如,在导入案例中,最优策略是AB1C2D1E,最短距离为最短距离为13,其子策
11、略其子策略:B1C2D1E,C2D1E,D1E也是最优的。也是最优的。依据这一原理,从后往前推各阶段依据这一原理,从后往前推各阶段最优子过程,从而得到全程最优过最优子过程,从而得到全程最优过程。程。设设f(i)表示从点表示从点i到终点到终点E的最短距的最短距离离,d(i,j)表示点表示点i,j之间的距离之间的距离.显然显然f(E)=0,为该问题的边界条件为该问题的边界条件.k=411()()(,)022f Df Ed D E1()2f D决策:决策:D1E1111212()(,)()min()(,)26min81 8f Dd C Df Cf Dd C D22()()(,)0 11f Df Ed
12、 D E k=32()1f D决策:决策:D2E1()8f C决策:决策:C1D12()5f C决策:决策:C2D11212222()(,)()min()(,)23min51 5f Dd C Df Cf Dd C D1313232()(,)()min()(,)23min41 3f Dd C Df Cf Dd C Dk=23()4f C决策:决策:C3D21414242()(,)()min()(,)28min514f Dd C Df Cf Dd C D4()5f C决策:决策:C4D21111212313()(,)()min()(,)()(,)82min 53846f Cd B Cf Bf Cd
13、 B Cf Cd B C1()8f B决策:决策:B1C22122313414()(,)()min()(,)()(,)58min 471156f Cd B Cf Bf Cd B Cf Cd B C1122()(,)()min()(,85min1311 3f Bd A Bf Af Bd A B2()11f B决策:决策:B2C3k=1()13f A 决策:决策:AB1最短路线最短路线:AB1C2D1E最短路长最短路长:13课件72022-10-35.1.2 动态规划的最优化原理动态规划的最优化原理课件82022-10-39.2.1 动态规划模型的建立动态规划模型的建立解解 把生产第把生产第k种产
14、品看成是第种产品看成是第k阶段,划分为阶段,划分为n个阶段个阶段.设设 sk表示第表示第k阶段初资源可用量(状态变量)阶段初资源可用量(状态变量)xk表示分配给第表示分配给第k阶段资源的数量(决策变量),显然有:阶段资源的数量(决策变量),显然有:允许决策集合允许决策集合 sk+1=sk-xk (状态转移方程)(状态转移方程)s1=a (边界条件)(边界条件)指标函数:指标函数:若若fk(sk)表示数量为表示数量为sk资源分配给第资源分配给第k种产品时,从第种产品时,从第k阶段到第阶段到第n阶段阶段总收益,则有:总收益,则有:10()max()(),()max()kknnkkkkkkkxsnn
15、nnxsfsgxfsxknfsgx()0kkkkkD sxxs,()nk niii kVg x课件92022-10-39.2.1 动态规划模型的建立动态规划模型的建立指标函数通常有两种形式:加法形式和乘法形式。指标函数通常有两种形式:加法形式和乘法形式。,()nk niii kVg x()nk,niii kVg x课件102022-10-39.2.2 动态规划问题的解法动态规划问题的解法:逆序法逆序法最优值函数最优值函数f(k):从从k阶段到阶段到E的最短距离;阶段指标函数的最短距离;阶段指标函数,即该阶段选择即该阶段选择不同路线的距离。从后向前推。不同路线的距离。从后向前推。S1=AS2=B
展开阅读全文