最优控制与状态估计7课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最优控制与状态估计7课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 状态 估计 课件
- 资源描述:
-
1、华东理工大学华东理工大学ECUSTECUST采用状态方程表示,令采用状态方程表示,令1x12xxDFDDmJTIJKx2于是于是FDDDmTJIJKxxxx10000102121(3)初始状态初始状态00)0()0(21xx末值状态末值状态0)()(21fftxtxDI控制控制 不受限制不受限制性能指标性能指标ttIREDtDfd)(20(4))(tID本问题的最优控制问题是:在数学模型(本问题的最优控制问题是:在数学模型(3)的约束下,寻求一个)的约束下,寻求一个控制控制 ,使电动机从初始状态转移到末值状态,性能指标,使电动机从初始状态转移到末值状态,性能指标E 为为最小。最小。华东理工大学
2、华东理工大学ECUSTECUST问题问题 2:对于问题对于问题 1 中的直流他励电动机,如果电动机从初始中的直流他励电动机,如果电动机从初始)(tID时刻时刻 的静止状态转过一个角度的静止状态转过一个角度 又停下,求控制又停下,求控制 (是是受到限制的),使得所需时间最短。受到限制的),使得所需时间最短。00t)(tID这也是一个最优控制问题:这也是一个最优控制问题:系统方程为系统方程为FDDDmTJIJKxxxx10000102121初始状态初始状态00)0()0(21xx末值状态末值状态0)()(21fftxtx)(tIDmaxDI(5)性能指标性能指标ftttJf0d(6))0(x最优控
3、制问题为:在状态方程的约束下,寻求最优控制最优控制问题为:在状态方程的约束下,寻求最优控制,将,将 转移到转移到 ,使,使J 为极小。为极小。maxDI)(tID)(ftx华东理工大学华东理工大学ECUSTECUST最优控制问题的一般性提法为最优控制问题的一般性提法为系统状态方程为系统状态方程为),(tux,fx 初始状态为初始状态为)(0tx其中,其中,x 为为n 维状态向量;维状态向量;u 为为r 维控制向量;维控制向量;f 为为n 维向量函数,维向量函数,它是它是 x、u 和和t 的连续函数,并且对的连续函数,并且对x、t 连续可微。连续可微。最优。其中最优。其中 是是 x、u 和和t
4、的连续函数的连续函数),(tuxL)(ftxrRu 寻求在寻求在 上的最优控制上的最优控制 或或 ,以将系统状,以将系统状态从态从 转移到转移到 或或 的一个集合,并使性能指标的一个集合,并使性能指标,0fttrRU u)(0tx)(ftxttttJfttffd),(),(0uxLx最优控制问题就是求解一类带有约束条件的条件泛函极值问题。最优控制问题就是求解一类带有约束条件的条件泛函极值问题。华东理工大学华东理工大学ECUSTECUST第一章、用变分法求解最优控制问题第一章、用变分法求解最优控制问题一、泛函与变分一、泛函与变分1、泛函的基本定义:、泛函的基本定义:)(tx如果对于某个函数集合如
5、果对于某个函数集合 中的每一个函数中的每一个函数 ,变量,变量J 都有一个都有一个值与之对应,则称变量值与之对应,则称变量J 为依赖于函数为依赖于函数 的泛函,记作的泛函,记作)(tx)(tx)(txJ可见,泛函为标量,可以理解为可见,泛函为标量,可以理解为“函数的函数函数的函数”例如:例如:ttxxJd)(30(其中,(其中,为在为在 上连续可积函数)上连续可积函数))(tx3,0当当 时,有时,有 ;当;当 时,有时,有 。ttx)(5.4Jtetx)(13 eJ华东理工大学华东理工大学ECUSTECUST泛函泛函 如果满足以下条件时,称为线性泛函:如果满足以下条件时,称为线性泛函:)(t
6、J x1),其中,其中c 为任意常数;为任意常数;2))()(tcJtcJxx)()()()(2121tJtJttJxxxx)()(0ttxx对于一个任意小正数对于一个任意小正数 ,总是可以找到,总是可以找到 ,当,当 时,有时,有 就称泛函就称泛函 在在 处是连续的。处是连续的。)()(0ttxx)()(0tJtJxx)(tJ x2、泛函的变分、泛函的变分)(tx所谓泛函所谓泛函 的宗量的宗量 的变分是指两个函数间的差。的变分是指两个函数间的差。)(tJ x)()(0ttxxxnRtt)(),(0 xx定义:设定义:设 是线性赋泛空间是线性赋泛空间 上的连续泛函,其增量可表示为上的连续泛函,
7、其增量可表示为xJnR,xxxxxxxxrLJJJ,xxr其中,其中,是关于是关于 的线性连续泛函,的线性连续泛函,是关于是关于 的高阶的高阶无穷小。则无穷小。则 称为泛函称为泛函 的变分。的变分。,xxLxx,xxLJ xJ华东理工大学华东理工大学ECUSTECUST3、泛函变分的规则、泛函变分的规则1)2121)(LLLL2)122121)(LLLLLL3)ttLttLbabad,d,xxxx4)xxddddtt泛函的变分等于泛函的变分等于0)(xtxJ华东理工大学华东理工大学ECUSTECUST4、泛函的极值、泛函的极值0 xxJ设设 是在线性赋泛空间是在线性赋泛空间 上某个子集上某个子
8、集D 中的线性连续泛函,中的线性连续泛函,若在,若在 的某邻域内的某邻域内nRD0 xnRUxxxxx,),(00在在 时,均有时,均有DU),(0 xx0 xxxJJJ00 xxxJJJ0或或则称则称 在在 处达到极大值或极小值。处达到极大值或极小值。)(xJ0 xx 华东理工大学华东理工大学ECUSTECUST为了判别是极大还是极小,要计算二阶变分为了判别是极大还是极小,要计算二阶变分 。但在实。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般际问题中根据问题的性质容易判别是极大还是极小,故一般不计算不计算 。J22J0 xx 定理定理:设:设 是在线性赋泛空间是在线性赋泛空间
9、上某个开子集上某个开子集D 中定义的可中定义的可微泛函,且在微泛函,且在 处达到极值处达到极值的必要条件是对于的必要条件是对于 在在 处处必有必有泛函泛函 xJxJnR0 xx 0,0 xxJ华东理工大学华东理工大学ECUSTECUST欧拉方程:欧拉方程:fftxx)(ft定理:设有如下泛函极值问题:定理:设有如下泛函极值问题:其中,其中,及及 在在 上连续可微,上连续可微,和和 给定,给定,已知已知 ,则极值轨线,则极值轨线 满足如下欧满足如下欧拉方程拉方程dttLJfttt0),(min)(xxxx),(tLxx)(tx,0ftt0t00)(xxtnRt)(x)(*tx0ddxxLtL及横
10、截条件及横截条件0)()(00txLtxLtTftTfxx注意:满足欧拉方程是必要条件,不是充分条件。注意:满足欧拉方程是必要条件,不是充分条件。华东理工大学华东理工大学ECUSTECUST证明:让自变量函数证明:让自变量函数 、在极值曲线在极值曲线 、附附近发生微小变分近发生微小变分 、,即,即)(tx)(tx)(*tx)(*tx xx*()()()x txtx t)()()(*txtxtx0,fttJL xx xx tL x x tdt022(),()fttLLxxoxxdtxx 上式中上式中 是高阶项是高阶项。22(),()oxx于是泛函于是泛函J J 的增量的增量 可计算如下(以下将可
11、计算如下(以下将*号省去)号省去)J华东理工大学华东理工大学ECUSTECUST 根据定义,泛函的变分根据定义,泛函的变分 是是 的线性主部,的线性主部,即即JJ0fttLLJxxdtxxfffttttttvduuvudv000对上式第二项作分部积分,按公式对上式第二项作分部积分,按公式可得可得00()ffttttLdLLJxdtxxdtxx华东理工大学华东理工大学ECUSTECUST J J 取极值的必要条件是取极值的必要条件是 等于零。因等于零。因 是任意的,要是任意的,要使上式中第一项(积分项)为零,必有使上式中第一项(积分项)为零,必有Jx()0LdLxdtx上式称为欧拉上式称为欧拉拉
12、格朗日方程。拉格朗日方程。第二项为零,就有第二项为零,就有0)()(00txLtxLtTftTfxx华东理工大学华东理工大学ECUSTECUST二、用变分法求解最优控制问题二、用变分法求解最优控制问题1 末值时刻固定、末值状态自由情况下的最优控制末值时刻固定、末值状态自由情况下的最优控制非线性时变系统状态方程为非线性时变系统状态方程为),(tux,fx(6)初始状态初始状态)()(00ttttxx(7)其中,其中,x 为为n 维状态向量;维状态向量;u 为为r 维控制向量;维控制向量;f 为为n 维向量函数。维向量函数。要求在控制空间中寻求一个最优控制向量要求在控制空间中寻求一个最优控制向量
13、,使以下性能指标,使以下性能指标)(tutttJfttfd),()(0uxLx(8)沿最优轨线沿最优轨线 取极小值。取极小值。)(tx(性能指标如(性能指标如(8 8)式所示的最优控制问题,是变分法中的波尔扎)式所示的最优控制问题,是变分法中的波尔扎问题问题)华东理工大学华东理工大学ECUSTECUST引入拉格朗日乘子引入拉格朗日乘子)()()()(21ttttn(9)将性能指标(将性能指标(8)式改写为其等价形式)式改写为其等价形式tttttJTttffd),()(),()(0 xuxfuxLx),()(),(),(ttttHTuxfuxLux定义哈密顿函数定义哈密顿函数(10)则则tttH
14、tJTttffd)(),()(0 xuxxttttHtTttttfffd)(d),()(00 xuxx(11)由(由(6 6)式可知)式可知为零为零 xux,f),(t华东理工大学华东理工大学ECUSTECUST(12)对(对(11)式中的第三项进行分部积分,得)式中的第三项进行分部积分,得tttttHtJTttttTttffffd)()(d),()(000 xxuxx当泛函当泛函J 取极值时,其一次变分等于零。取极值时,其一次变分等于零。即即0J可以变分的量:可以变分的量:uuu)()(ttxxx)()(tt)()()(ffftttxxx不可以变分的量:不可以变分的量:0tft)(0tx)(
15、t求出求出J 的一次变分并令其为零的一次变分并令其为零0d)()()()(0tHHttttJTTTttffTfTffxuuxxxxx华东理工大学华东理工大学ECUSTECUST将上式改写成将上式改写成0d)()()(0tHHtttJTTttfTfffuuxxxx(13))(ftx)(t由于由于 未加限制,可以选择未加限制,可以选择 使上式中使上式中 和和 的系数的系数等于零。于是有等于零。于是有)(txxH(15)(14)(16))()(ffttx0d0tHJTttfuu由于由于 是任意的变分,根据变分法中的辅助引理,由(是任意的变分,根据变分法中的辅助引理,由(16)式得)式得u0uH(17
16、)(14)式称为伴随方程,)式称为伴随方程,为伴随变量,(为伴随变量,(17)式为控制方程。)式为控制方程。)(t华东理工大学华东理工大学ECUSTECUST几点说明:几点说明:1)实际上,()实际上,(14)式和()式和(17)式就是欧拉方程。)式就是欧拉方程。xfxLxH(18)因为因为0uH0ufuL(19)如果令如果令),()(),(),(xuxfuxLuxttttHT简记成简记成xfLTH(20)xfxL由欧拉方程得到由欧拉方程得到0ddxxHtH0)(xfxL即即(21)华东理工大学华东理工大学ECUSTECUST可见(可见(21)式和()式和(18)式相同,()式相同,(22)式
17、和()式和(19)式相同。因此,)式相同。因此,(14)式和()式和(17)就是欧拉方程,而()就是欧拉方程,而(7)式和()式和(15)就是横截条)就是横截条件。件。0dduuHtH0ufuL(22)2)是泛函取极值的必要条件是否为极小值还需要二次变分是泛函取极值的必要条件是否为极小值还需要二次变分 来判断,来判断,则泛函则泛函J 取极小值。取极小值。0JJ202J华东理工大学华东理工大学ECUSTECUST3)哈密顿函数沿最优轨线随时间的变化率哈密顿函数沿最优轨线随时间的变化率tHHHHtHTTTuuxxdd在最优控制在最优控制 、最优轨线、最优轨线 下,有下,有 和和*u*x0uH(10
18、10)式的哈密顿函数对)式的哈密顿函数对 求求偏导,结果为偏导,结果为 xux,f),(t 由(由(1414)式可得)式可得0 xxxxHHHHHHTTTT 因为减号两边是相等标量因为减号两边是相等标量(行向量与列向量相乘)(行向量与列向量相乘)(23)(24)这两个等于零的式子代入(这两个等于零的式子代入(23)式,于是)式,于是tHtHdd华东理工大学华东理工大学ECUSTECUST 即哈密顿函数即哈密顿函数H 沿最优轨线对时间的全导数等于它对时间的偏沿最优轨线对时间的全导数等于它对时间的偏导数。记为导数。记为 则则)(),(*tHtHuxttHHdd(25)对上式积分,得到对上式积分,得
19、到dHtHtHfttf*0*0)()((26)当哈密顿函数不显含当哈密顿函数不显含 t 时,由(时,由(25)式得)式得consttHtHf)()(*华东理工大学华东理工大学ECUSTECUST初始条件初始条件例例 1 系统状态方程为系统状态方程为ux)(0tx性能指标性能指标tutcxJfttfd21)(212200c试求最优控制试求最优控制 ,使,使J 取极小值。取极小值。*u解解 哈密顿函数哈密顿函数uutuxH221),(由伴随方程由伴随方程0 xHconst)()()(fftcxtt)()(21)()(2fffftcxtcxtxt因为因为const华东理工大学华东理工大学ECUSTE
20、CUST由控制方程由控制方程0uuH即即)()(*ftcxtu将将 代入状态方程代入状态方程*u)(ftcxux解为解为10)()(ctttcxtxf当当 时,代入上式,求得时,代入上式,求得 ,所以,所以0tt)(01txc)()()(00txtttcxtxf当当 时,时,ftt)(1)()(00tttxtxff)(1)(21d21)(2100222*0ttctcxtutcxJfttff最优性能指标为最优性能指标为华东理工大学华东理工大学ECUSTECUST2 末值时刻固定,末端状态固定情况下的最优控制末值时刻固定,末端状态固定情况下的最优控制非线性时变系统状态方程为非线性时变系统状态方程为
21、),(tux,fx(27)初始状态初始状态)()(00ttttxx(28)末值状态末值状态)()(fttttfxx(29)性能指标性能指标ttLJfttd),(0ux(30))(ftx寻求最优控制寻求最优控制 ,在,在 内,将系统从内,将系统从 转移到转移到 ,同时使性能指标同时使性能指标J 取极小值。取极小值。*u,0ftt)(0tx(性能指标如(性能指标如(3030)式所示的最优控制问题,是变分法中的拉格朗)式所示的最优控制问题,是变分法中的拉格朗日问题日问题)华东理工大学华东理工大学ECUSTECUST引入哈密顿函数引入哈密顿函数),()(),(),(ttttHTuxfuxLux)()(
22、)()(21ttttn其中其中ttHJTttfd),(0 xux于是于是因为因为xuxuxfuxuxL)(),(),()(),(),(ttHtttHtTT对上式右边第对上式右边第2项进行分部积分,可以得到项进行分部积分,可以得到ttHttttJTttffTTfd),()()()()(000 xuxxx上式中可以变分的量:上式中可以变分的量:uuu)()(ttxxx)()(tt)(t不可以变分的量:不可以变分的量:0tft)(0tx)(ftx华东理工大学华东理工大学ECUSTECUST令性能指标令性能指标J 的一次变分等于零,得的一次变分等于零,得0d0tHHJTTttfuuxx(31)选择选择
23、 ,使其满足,使其满足)(txH(32)则则0d0tHJTttfuu(33)在末端状态固定情况下,在末端状态固定情况下,不是任意的。只有在系统能控的情况不是任意的。只有在系统能控的情况下,才有控制方程下,才有控制方程u0uH华东理工大学华东理工大学ECUSTECUST例例 2 问题问题 1的系统状态方程为的系统状态方程为FDDDmTJIJKxxxx10000102121末值状态末值状态0)()(21fftxtx初始状态初始状态00)0()0(21xx性能指标性能指标ttIREJDtDfd)(201DR设设ttIEJDtfd)(20)(ftx最优控制问题就是在状态方程的约束下,寻求最优控制问题就
24、是在状态方程的约束下,寻求 ,使,使 转转移到移到 ,并使,并使J 取极小值。取极小值。)(tID)0(x华东理工大学华东理工大学ECUSTECUST解解 根据能控性判据知,该系统是能控的根据能控性判据知,该系统是能控的200rankrankDmDmJKJKCQ1)哈密顿函数为)哈密顿函数为FDDDmTDTJIJKItH1000010),(2xux2)由控制方程得到)由控制方程得到00221DmDDJKIIH即即022DmDJKI221DmDJKI华东理工大学华东理工大学ECUSTECUST3)由伴随方程)由伴随方程 ,得到,得到xH01constc 11112c212ctc(,为积分常数)为
25、积分常数)1c2c)(2121ctcJKIDmD4)由状态方程得)由状态方程得21xx FDDmDmFDDDmTJcJKtcJKTJIJKx1212112221222322221222)121(41ctTJcJKtcJKxFDDmDm43222223122112141121ctctTJtcJKtcJKxFDDmDm(,为积分常数)为积分常数)3c4c华东理工大学华东理工大学ECUSTECUST根据边界条件,确定积分常数,得根据边界条件,确定积分常数,得043 cc223124mDfKJtcFmDmDfTKJKJtc22222212代入代入 和和)()(2ttx)(tID6)(222fftttt
展开阅读全文