随机型动态规划及软件介绍课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《随机型动态规划及软件介绍课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 动态 规划 软件 介绍 课件
- 资源描述:
-
1、第第6章章 动态规划动态规划动态规划的基本理论动态规划的基本理论 (2学时)学时)确定型动态规划确定型动态规划 (2学时)学时)随机型动态规划随机型动态规划 (1学时)学时)动态规划的软件求解简介动态规划的软件求解简介(1学时)学时)一、离散随机性动态规划一、离散随机性动态规划 随机型的动态规划是指状态的转移律是不确定的,即对给定的状态和决策,下一阶段的到达状态是具有确定概率分布的随机变量,这个概率分布由本阶段的状态和决策完全确定。随机型动态规划的基本结构如下图:sk状态 xk决策概率k阶段的收益p1p2pN.k+1阶段的状态sk+1c1c2cN 1 2N第15讲 随机型动态规划及软件介绍 图
2、中图中N N表示第表示第k+1k+1阶段可能的状态数,阶段可能的状态数,p p1 1、p p2 2、p pN N为给定状态为给定状态s sk k和决策和决策x xk k的前提下,可能达到下一个状态的的前提下,可能达到下一个状态的概率。概率。c ci i为从为从k k阶段状态阶段状态s sk k转移到转移到k+1 k+1 阶段状态为阶段状态为i i时的指时的指标函数值。标函数值。在随机性的动态规划问题中,由于下一阶段到达的状在随机性的动态规划问题中,由于下一阶段到达的状态和阶段的效益值不确定,只能根据各阶段的期望效益值态和阶段的效益值不确定,只能根据各阶段的期望效益值进行优化。进行优化。例例1
3、1 某公司承担一种新产品研制任务,合同要求三个月内交出一件合格的样品,否则将索赔2000元。根据有经验的技术人员估计,试制品合格的概率为0.4,每次试制一批的装配费为200元,每件产品的制造成本为100元。每次试制的周期为1个月。问该如何安排试制,每次生产多少件,才能使得期望费用最小?(类例教材(类例教材1:例:例6-7)解:把三次试制当作三个阶段(解:把三次试制当作三个阶段(k=1,2,3k=1,2,3),决策变量决策变量x xk k表示第表示第k k次生产的产品的件数;状态变量次生产的产品的件数;状态变量s sk k表示第表示第k k次试制前次试制前是否已经生产出合格品,如果有合格品,则是
4、否已经生产出合格品,如果有合格品,则s sk k=0=0;如果没有;如果没有合格品,记合格品,记s sk k=1=1。最优函数。最优函数f fk k(s(sk k)表示从状态表示从状态s sk k、决策、决策x xk k出发出发的第的第k k阶段以后的最小期望费用。故有阶段以后的最小期望费用。故有f fk k(0)(0)0 0。生产出一件合格品的概率为生产出一件合格品的概率为0.40.4,所以生产,所以生产x xk k件产品都不件产品都不合格的概率为合格的概率为 ,至少有一件合格品的概率为,至少有一件合格品的概率为1-1-,故,故有状态转移方程为有状态转移方程为 kx6.0kkxkxkspsp
5、6.01)0(6.0)1(11kx6.0 用用C(xC(xk k)表示第表示第k k阶段的费用,第阶段的费用,第k k阶段的费用包阶段的费用包括制造成本和装配费用,故有括制造成本和装配费用,故有 根据状态转移方程以及根据状态转移方程以及C(xC(xk k),可得到,可得到 0002)(kkkkxxxxC)1(6.0)0()6.01()(min)1(11kxkxkxkffxcfkkk)1(6.0)(min1kxkxfxckk 如果如果3 3个月后没有试制出一件合格品,则要承担个月后没有试制出一件合格品,则要承担20002000元的罚金,因此有元的罚金,因此有f f4 4(1)=20(1)=20。
6、当当k=3k=3时,计算如下表:时,计算如下表:x3 s3 C(x3)+20f3(s3)x3*0 1 2 3 4 5 6 0 0 0 0 1 20 1511.2 9.32 8.59 8.56 8.93 8.56 5 0.63x 当当k=2k=2时,计算如下表:时,计算如下表:x2 s2 C(x2)+8.56f2(s2)x2*0 1 2 3 4 0 0 0 0 18.568.147.086.857.11 6.85 3 0.62x 当当k=1k=1时,有时,有 x1 s1 C(x1)+6.85f1(s1)x1*0 1 2 3 0 0 0 0 16.857.116.466.48 6.46 2 0.6
7、1x 上面三个表中并没有列出上面三个表中并没有列出x xk k取更大数值的情况,因取更大数值的情况,因为可以证明以后的为可以证明以后的C(xC(xk k)+f)+fk+1k+1(1)(1)的值是对的值是对x xk k单调单调增加的。增加的。因此得到的最优策略是,在第因此得到的最优策略是,在第1 1个阶段试制个阶段试制2 2件产件产品;如果都不合格,在第品;如果都不合格,在第2 2阶段试制阶段试制3 3件产品;如果仍都件产品;如果仍都不合格,则在第不合格,则在第3 3个阶段试制个阶段试制5 5件产品。该策略得到的最件产品。该策略得到的最小的期望费用小的期望费用6.466.46。0.6kx例例2
展开阅读全文