最-优-控-制-理-论与-应-用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最-优-控-制-理-论与-应-用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课件
- 资源描述:
-
1、最最 优优 控控 制制 理理 论与论与 应应 用用 Optimal Control Theory Optimal Control Theory and Applicationand Application 主主 要要 内内 容容 1 1 最优控制问题最优控制问题2 2 求解最优控制的变分方求解最优控制的变分方法法3 3 最大值原理最大值原理与应用与应用5 5 动态规动态规划划4 4 线性二次型性能指标的最优控线性二次型性能指标的最优控制制6 6 对策论与最大最小控对策论与最大最小控制制最优控制理论最优控制理论 现代控制理论的重要组成部分;现代控制理论的重要组成部分;2020世纪世纪5050年代
2、年代 发展形成系统的理论;发展形成系统的理论;(动态规划、最大值原理)(动态规划、最大值原理)中心问题中心问题 给定一个控制系统,选择控制规律,给定一个控制系统,选择控制规律,使系统在某种意义上是最优的;使系统在某种意义上是最优的;应用应用 在各个领域中得到应用,效益显著。在各个领域中得到应用,效益显著。前前 言言 例例1.1 1.1 飞船软着陆问题飞船软着陆问题 :飞船软着陆:在:飞船软着陆:在月球表面着陆时速度必须为零,由发动机月球表面着陆时速度必须为零,由发动机的推力变化来完成。的推力变化来完成。1 1 最优控制问题最优控制问题1.1 1.1 一个实例一个实例 mg tu th tv月球
3、月球问题:如何选择推力,使燃料消耗最少。问题:如何选择推力,使燃料消耗最少。th高度高度()v t垂直速度垂直速度 tm飞船的质量飞船的质量g月球重力加速度常数月球重力加速度常数M飞船自身质量飞船自身质量()u t发动机推力发动机推力燃料的质量燃料的质量F初始条件:初始条件:登月舱初始质量登月舱初始质量 初始高度初始高度 初始速度初始速度 初始时间,初始时间,末端时间末端时间 00mFMm 00hh 00vv00tft.a tvth gtmtutv tkutmk常数常数模型抽象模型抽象 边界条件边界条件 初始条件初始条件 末端条件末端条件 控制约束:控制约束:(发动机最大推力)(发动机最大推力
4、)性能指标:选择性能指标:选择 使使 燃料最省燃料最省.b 0,0fftvth.c max0utu.d,*tu fthth0 maxftmJ0(0)hh0(0)vvFMm)0(1.2 1.2 问题描述问题描述(1)(1)状态方程状态方程 一般形式为一般形式为 00()(),(),)()|t tx tf x t u t tx tx()nx tR为为n n维状态向量维状态向量 ()ru tR为为r r维控制向量维控制向量),(),(ttutxf为为n n维向量函数维向量函数 给定控制规律给定控制规律)(tu),(),(ttutxf满足一定条件时,方程有唯一解满足一定条件时,方程有唯一解(2)(2)
5、容许控制容许控制 Uu0)(uGU:Uu,()iiu tm1,2,ir有时控制域可为超方体有时控制域可为超方体 (3)(3)目标集目标集 ()(),)0fffSx tx tt(),)ffx ttq维向量函数维向量函数()fftx tx固定端问题固定端问题 nSR自由端问题自由端问题 (4)(4)性能指标性能指标 0()(),)(),(),)dftfftJ ux ttL x t u t tt对状态、控制以及终点状态的要求,复合型性能对状态、控制以及终点状态的要求,复合型性能指标。指标。(),)0ffx tt积分型性能指标,表示对整个状积分型性能指标,表示对整个状态和控制过程的要求。态和控制过程的
6、要求。0),(),(ttutxL终点型指标,表示仅对终点状态终点型指标,表示仅对终点状态的要求。的要求。BolzaMayerLagrange2 2 求解最优控制的变分方法求解最优控制的变分方法(回顾:函数极值(回顾:函数极值 )回顾回顾:静态最优化问题的解静态最优化问题的解 -函数极值函数极值 (一一)一元函数的极值一元函数的极值:*(),()0()0,()0u uJf ua bufuufufu设为义闭区间单连续点的数,则点条为条定定在在上上的的值值可可微微函函存存在在极极值值的的必必要要件件是是极极小小值值充充要要件件是是(二二)多元函数的极值多元函数的极值1212(),0,0TnTunnf
7、f uuu uunfuffffuuu设数,为维。得条数为:元元函函列列向向量量它它取取极极值值的的必必要要件件是是或或函函的的梯梯度度零零向向量量2222122222212212212212222nnnnnuufuufuufuufufuufuufuufuffuf2200ffuu条,阵为阵函数取取极极小小值值的的充充要要件件是是:即即下下列列海海森森矩矩正正定定223123233121312323213123*()25263,04201026022201,1,21 12xTf xxxxx xx xxfffxxxfxxxfxxxxxxxx 例 设试 点条得联 点为。求求的的极极值值及及其其极极小小
8、值值。解解:由由极极值值必必要要件件立立解解得得故故极极值值22222*40201022221 12,()10 xTffxfxxxfff x从森阵为点又又得得海海矩矩是是正正定定的的。故故极极小小值值的的极极小小值值三、具有等式约束条件极值的解法拉格朗日三、具有等式约束条件极值的解法拉格朗日乘子法将具有等式约束条件的极值问题化为约束乘子法将具有等式约束条件的极值问题化为约束条件的极值问题来求解条件的极值问题来求解(一)拉格朗日函数(一)拉格朗日函数(,)Jf x uxnur连续标数为维,维已已知知可可微微的的目目函函(,)0(,)(,)TTg x uHHJgf x ug x ug约条为约标数个
9、数:维。等等式式束束件件用用乘乘子子向向量量乘乘等等式式束束并并与与目目函函相相加加,构构成成一一新新函函是是与与 同同的的列列向向量量*(,)0Txug x u说称为数个没约数标数为证将,代入H,得 明明:(1 1)拉拉格格朗朗日日函函,它它是是一一有有束束的的函函(2 2)用用 所所求求的的极极值值就就是是目目函函的的极极值值。因因可可明明,求求出出的的HH(二)拉格朗日函数(二)拉格朗日函数H H极值的解法极值的解法102030()0()0(,)0TTHHHHxuHfgxxxHfguuuHg x u条(),(),()将条开存存在在极极值值的的必必要要件件是是:必必要要件件展展得得:2 2
10、 求解最优控制的变分方法求解最优控制的变分方法2.1 2.1 泛函与变分法基础泛函与变分法基础平面上两点连线的长度问题平面上两点连线的长度问题 其弧长为其弧长为1211()dSx tt行程问题行程问题一般来说,曲线不同,弧长就不同,即弧长依赖一般来说,曲线不同,弧长就不同,即弧长依赖于曲线,记为于曲线,记为 。()S x()S x,称为泛函。,称为泛函。)(tx,称泛函的宗量,称泛函的宗量。泛函与函数的几何解释泛函与函数的几何解释 12()()()x tx tx t宗量的变分宗量的变分 ()()Jx tJ x t1212()()()J xxJ xJ x线性泛函线性泛函 泛函对宗量是线性的泛函对
11、宗量是线性的连续泛函连续泛函:宗量的变分趋于无穷小时,泛函的变宗量的变分趋于无穷小时,泛函的变分也趋于无穷小分也趋于无穷小.泛函的变分:泛函的变分:(,)L xxJ泛函的增量泛函的增量()()()(,)(,)J xJ xxJ xL xxr xx此时此时,称称泛函是可微的。泛函是可微的。(,)r xx是是的高阶无穷小量,则的高阶无穷小量,则x若若定理定理2.1 2.1 泛函的变分为泛函的变分为0()JJ xx 0()J xx00()()limlimJJ xxJ x 01lim()()L xxr xx0()(,)lim(,)r xxL xxxL xxx证明证明例例2.1 2.1 求泛函的变分求泛函
12、的变分 0(,)dTtJF x x tt 00()(,)dTtJJ xxF xx xx tt0()dTtFFxxtxx00 xxJJ定理定理2.2 2.2 若泛函若泛函)(xJ在在x有极值,则必有有极值,则必有0J上述方法与结论对于包含多变量函数的泛数同样适用上述方法与结论对于包含多变量函数的泛数同样适用。2.2 2.2 欧拉方程欧拉方程d0dFFxtx0()(,)dfttJ xF x x tt泛函泛函),(txxF 有二阶连续偏导数有二阶连续偏导数 两端固定两端固定 00()x tx1()x Tx0()dfttFFJxx txx变分变分 0ftt0d()ddfttFFFJx txxtxx分部
13、积分分部积分 x00ftt0d()d0dfttFFJx txtx例例2.2 2.2 求平面上两固定点间连线最短的曲线求平面上两固定点间连线最短的曲线 02()1()dTtJ xx tt)(12txF,dd0ddFFFxtxtx 2d20d1xtxcxx21atx)(battx)(直线直线 2.3 2.3 横截条件横截条件左端固定右端沿曲线变动左端固定右端沿曲线变动 终点值与终点的变分终点值与终点的变分 t()0fFFxx横截横截条件条件 00(,)d|fftttJF xx xx tt00d()ddfffttttftFFFx txFtxtxx0ffttfFJxFtx()()()0fftfffft
14、FFxtF ttFxtxx例例2.3 2.3 从一固定点到已知曲线有最小长度的曲线从一固定点到已知曲线有最小长度的曲线 1xC02()1()dfttJ xx ttd0dFtx21FxCxx1()x tC t2221(1()()011ffttxxxtxxx所求的极值曲线与约束曲线相正交。所求的极值曲线与约束曲线相正交。欧拉方程欧拉方程 积分积分求解求解计算计算横截条件横截条件直直线线 1 ftx2.4 2.4 含有多个未知函数泛函的极值含有多个未知函数泛函的极值 泛函泛函 0111(,)(,;,;)dftnnntJ xxF xxxx tt欧拉方程欧拉方程 d0diiFFxtxd0dFFxtx边界
15、值边界值,00,()1,2,()1,2,ffitiit titx txinx txin00t txxfft ttxx()0ftFFxx 横截条件横截条件 2.5 2.5 条件极值(有约束)条件极值(有约束)状态方程状态方程 0),(txxf 泛函泛函 0(,)dfttJF x x tt引进乘子引进乘子 T1()(),()nttt构造新的函构造新的函数和泛函数和泛函 TFFf00T()ddffttttJFftFt欧拉方程欧拉方程 约束方程约束方程 *d0dFFxtx*d0dFFft例例2.4 2.4 泛函泛函2201()d2JQ tt约束方程约束方程 )()(tutQ 边界条件边界条件 1)0(
16、Q1)0(Q0)2(Q0)2(Q)(tuJ试求试求使泛函使泛函有极值。有极值。解:化为标准形式解:化为标准形式 2220011()d()d22JQ ttutt121()()()()()x tQ tx tx tQ t把问题化为标准形式,令把问题化为标准形式,令例例2.6122()()0()()0 x tx tx tu t约束方程可定为约束方程可定为1(0)1x2(0)1x1(2)0 x2(2)0 x边界条件为边界条件为引进乘子引进乘子T12()(),()ttt构造函数构造函数T2112221()()2FFfuxxxu欧拉方程欧拉方程 *111d0dFFxtx*1222d0dFFxtx*2d0dF
17、Fuutu解出解出 11a212ata 12uata1a2a其中,其中,和和为任意常数。为任意常数。32112342212311()621()2x tata ta tax tata ta()u t代入约束方程,并求解可得代入约束方程,并求解可得将将13a 272a 31a 41a 利用边界条件,可得:利用边界条件,可得:32117()124x tttt 2237()122x ttt273)(ttu于是,极值曲线和于是,极值曲线和)(tu为:为:2.6.1 2.6.1 自由端问题自由端问题约束方程约束方程 0),(xtuxf新的泛函新的泛函 0T()(,)(,)dftftJx tL x u tf
18、 x u txt00TTT()(,)dfftftttJx tH xu txtxx0T()(,)dftftJx tH xu tx t有有T(,)(,)HL x u tf x u t令令哈米顿函数哈米顿函数 2.6 2.6 最优控制问题的变分解法最优控制问题的变分解法00TTTTTTTT()()()()()()()d()()|()()()dffftfffftfttftx tHHJx ttx txux tx txuHHx txu txxu 0T()d0fttHJu tu0uH变分变分(,)()H xu ttx()()()fffx ttx t则则伴随方程伴随方程 控制方程控制方程横截条件横截条件 例例
19、2.5 2.5 考虑状态方程和初始条件为考虑状态方程和初始条件为)()(tutx00()x tx02211()d22ftftJcx tut的简单一阶系统,其指标泛函为的简单一阶系统,其指标泛函为,使,使0tft0c)(tu其中其中,给定,试求最优控制给定,试求最优控制J有极小值。有极小值。uutuxfttxLH221),()(),(伴随方程伴随方程()0Htx 边界条件边界条件 21()()()()2fffftcx tcx tx t控制方程控制方程 0uuH)(t解解:引进伴随变量引进伴随变量,构造哈米顿函数,构造哈米顿函数00()()()ffcxu tcx tc tt 则最优控制为则最优控制
20、为 ()fucx t 得得00()()()fx tcx tttx 代入状态方程求解得代入状态方程求解得00()1()ffxx tc tt令令ftt,则有,则有2.6.2 2.6.2 固定端问题固定端问题,00()t tx tx()fft ttx tx 0(,)dfttJL x u tt性能指标性能指标 00TTT()dffttttJHx txx0TT()()dfttHHJxutxu()Htx 0()d0ftTtHu tu0uH边界条件边界条件 1(0)1x2(0)1x1(2)0 x2(2)0 x2201d2Jut指标泛函指标泛函 哈米顿函数哈米顿函数 212212Huxu伴随方程伴随方程 11
21、()0Htx 212()()Httx ,例例2.6 2.6 12()()x tx t2()()x tu t重解例重解例2.42.4 11()ta212()tata 其解为其解为 20Huu212uata 12xx 212xua ta32112341162xa ta ta ta2212312xa ta ta273)(ttu32117()124x tttt 2237()122x ttt约束方程约束方程 0),(xtuxf引入拉格朗日乘子向量,得新的泛函引入拉格朗日乘子向量,得新的泛函 2.6.3 2.6.3 终端时刻自由,终端状态受限问题终端时刻自由,终端状态受限问题(),)0jffgx tt(1
22、,2,)jkn(),)0ffG x tt终端约束终端约束 0(),)(),)(,)+(,.)-)ftTTafffftJxttv GxttF xutf xut xdt性能指标性能指标 0(),)(,)dftfftJx ttF x u tt 有有 0(),)()dftTafftJx ttHxt00TT()(),(),(,)()(,)fffafffffftttttJx tx tttx ttH xx uutxxdtH x utx dtT(),)(),)(),)ffffffx ttx ttv G x ttT(,)(,)HF x u tf x u t令令H函数函数 T()()affffJx ttx tt
23、0TTT()()fttHHxux dtxu T(,)()ffftttH xx uutxxdt00TTTTTT()()()()()()fftttfftHHxux dtxuHHxu dttx txu 而而 T(,)()ffftttH xx uutxxdtTTTTTT(,)()()(,)()()(,)()()()ffftttfffffffHHH x utxuxx dtxuH x utttx ttH x utttx tx t T()()affffJx ttx tt0TTT()()()()ftffftHHxu dtHttx txu于是于是 T()()affffJx ttx tt0TTT()()()()f
24、tffftHHxu dtHttx txu于是于是0TT()()fttHHxu dtxu()()()Tffffftx tHtx tt1()()()()kjfjjfffgtvx tx tx t0uHHtx)(,()Htx,取极值的必要条件得取极值的必要条件得aJ由由1()()()()kjfjjfffgH tvx tx tx t 问题描述问题描述系统状态方程系统状态方程 00()()=xf x,u,tx tx&性能指标性能指标 0()(,)dftftJx tL x ut0,tf 固定固定,自由,自由,u可以有约束,也可以有约束,也可无约束。可无约束。()fx t3 3 最小值原理最小值原理3.1 3
25、.1 古典变分法的局限性古典变分法的局限性u(t t)受限的例子受限的例子 矛盾矛盾!例例3.13.1)()()(tutxtx1)0(x1)(tu10()dJx tt()()()()Hx ttx tu t1)()(txHt伴随方程伴随方程 0)(tuH极值必要条件极值必要条件 (t)03.2 3.2 最小值原理最小值原理()x t()Hx t()Htx 且且 min(),(),(),)(),(),(),)u UH x t u tt tH x t u tt t()x t)(tu()x t)(t)(tu定理定理3.1(最小值原理最小值原理)设为设为容许控制,容许控制,为对应的积分轨线,为使为对应的
展开阅读全文