最小二乘法及其应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最小二乘法及其应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最小二乘法 及其 应用 课件
- 资源描述:
-
1、第三章第三章 最小二乘法及其应用最小二乘法及其应用 最小二乘法是求解最优化问题的一种有效而方便的方法。信号处理中有许多问题可归结为最优化问题,因此最小二乘法是信号处理的重要工具之一。希尔伯特空间中线性逼近问题的求解方法称为最小二乘法。通常它有三种不同的表现形式:投影法、求导法和配方法。下面来分别说明。3-1 最小二乘法的三种形式最小二乘法的三种形式 设X为希尔伯特空间,为X中一组归一化正交元素,x为X中的某一元素。在子空间 中求一元素m。使得12,e e 12,Mspan e e0|min|mMxmxm(3-1-1)由于M中元素可表为 的线性组合,问题转化成为求 ,使得12,e e 12,a
2、a 1|=min kkkxa e(3-1-2)第二章中的投影定理指出了最优系数 应满足12,a a 1,1,2,kkmkxa eem(3-1-3)由此即得 。也就是说,当且仅当 取为x关于归一化正交系 的傅立叶系数时,式(3-1-2)成立。kmk=1(,)=(a,)=amkmx eee ka12,e e k(,)ckkax e(3-1-4)这种求解方法称为投影法,它是最小二乘法的第一种表现形式。第二种方法是求导法,仍以上面的问题为例来说明。记泛函2121(,)|kkkf a axa e为了能用求导法求此泛函的极小值,将它表为12112211(,)(,)|2 kkmmkkkkkkkfaaxa e
3、xa exa ca其中 。于是最优的 应满足即(,)kkcx e12,a a =0 m=1,2,mfa20,m=1,2mmmmcaac或,下面再用第三种方法即配方法来求解:2212112222111122211(,)|2|2|()min,1,2 kkkkkkkkkkkkkkkkkkkkkf aaxa caxcca caxcacack(3-1-5)以上三种方法都称为最小二乘法。在实际应用中,他们各有各的优势和缺陷,我们并不能通过简单的比较来说明他们谁优谁劣,因为衡量一种方法好坏的标准是多方面的。因此,在不同的场合根据不同的需要和可能,灵活选择和使用合适的方法,是掌握最小二乘法的关键。利用令导数等
4、于零来求函数的极值是一种方便的方法。但是对于多元函数,有时由于变元太多而使表达式相当繁复,为此,本节介绍用向量-矩阵的形式来简化求导过程。下面举例个例子来具体说明。例3-2-1 求矛盾方程组Ax=b的最小二乘 解(可参阅第二章的相关例题)3-2 向量向量-矩阵求导及配方法矩阵求导及配方法 解:解:求Ax=b的最小二乘解就是求 的极小点。由于2()|g xAxb()()()2TTTTTg xAx bAx bx A Axb Ax b b下面先给出两个需要用到的向量求导公式:()()TTxxb xx b(3-2-1)()()TTxx AxAAx()2,ATxx AxAx其中 为对称阵(3-2-2)当
5、A不时对称阵时,式(3-2-10)应该为(3-2-3)利用式(3-2-1)和(3-2-2)可以立即得到220TTxgA AxA b(3-2-4)TTA AxA b 这就是书中例2-4-1中所得到的法方程若使用配方法,则有:11()2 ()()()()minTTTTTTTTTTTTTTTTg xx A Axb Ax b bA AxA bA AA AxA bb b b A A AA bA AxA b可以看出,1min()TTTTgb bb A A AA b 本例中介绍的两个向量求导公式中,提到了对于向量x求导的梯度算符 ,我们还可以引入对矩阵 求导的梯度算符 :xijAaA1112112nAnnn
6、naaaaaa(3-2-5)需要说明的是,算符 只有作用在关于 的标量函数上才有意义。例如对于二次型由于 ,故Aija1112,1(,)nTnnijiji jf aaaa x xx Ax(3-2-6)ijijfx xa,1,.,()TTAiji jnx Axx xxx(3-2-7)在课本中,给出了一些常用的向量-矩阵求导公式,在实际应用中可供大家查阅。设有如图3-3-1所示的系统T。当输入n个数据 时,输出为y,且有下列线性关系:3-3 应用举例应用举例3-3-1 系统辨识系统辨识12,nx xx1 122nnya xa xa x12,na aa(3-3-1)其中 为未知,需要通过对输入输出的
7、观测值来确定这组参数。现设进行了m次观测,观测值为 和 12(),(),()nx kx kx k1x2xnxy图3-3-1 多输入单输出系统(),1,2,y k km则问题成为求 使之满足12,na aa1 122()()()()1,2,nna x ka xka xky kkm(3-3-2)若记 及则方程(3-3-2)成为1(1),(2),.,(),.,TTnyyyy maaa11(1)(1)()()nnxxXx nx n Xay(3-3-3)当方程(3-3-3)无解时,问题就转化为求矛盾方程组的最小二乘解。可以得到1()TTaX XX y(3-3-4)进而考察多输入多输出的情形。关系式为其中
8、1122 1,2,iiininTTya xa xa xipyx A或(3-3-6)(3-3-5)1112,.,.,TTTpnyy yyxx xx1111pnnpaaAaa 现设输入和输出的第k次观测值分别是 ()(),1,2,TTxkk km和y则系统的辨识问题就是求A使之满足(1)(1)()()Y=X ATTTTyxAymxm或 简 记 为(3-3-8)(3-3-7)其中Y为 矩阵,X为 矩阵。当上述方程无解时,问题就转化成为求A使下列非负定矩阵达到极小:mpm n-minTJ AYXAYXA()()()(3-3-9)问题(3-3-9)可以用配方法来求解:1111 -minTTTTTTTTT
9、TTTTTTTTTJ AY YA X YY XAA X XAY YY X X XX YAX XX YX X AX XX YAX XX Y()()()()()()(3-3-10)其中假定 可逆。TX X 这个问题不能用求导法来求解,因为目标函数J(A)不是标量而是矩阵。要用求导法来求解该问题,需要引入矩阵范数的概念。矩阵 的范数定义为m pYR211|pmTijijYtr Y Yy()(3-3-11)事实上,可以把式(3-3-11)理解成向量 的范数。1112121,Tppmmpyyyyyy,这样,我们可以把多输入多输出线性系统的辨识问题叙述为求 矩阵A,使得np21()|()()minTJAY
10、XAtr YXAYXA(3-3-12)式(3-3-12)的形式与(3-3-9)类似,但应注意在此处 是标量函数。她可以完全类似于式(3-3-10)那样来配方而求解,也可体用求导法来求解。由于1()JA1()()2()()TTTTJ Atr Y Ytr Y XAtr A X XA(3-3-13)利用课本中表3-2-2中的公式5和7,得到11()220 ()TTATTJAX YX XAAX XX Y 即(3-3-14)数据压缩是指在传输或存储信号时对信号数据量进行压缩。实际中的信号往往都是维数很高的随机数据向量。各种数据间的相关性也很大,简单的随意压缩会导致数据严重失真。按照最优化原则设计的数据压
11、缩技术可以解决通讯和数据传输系统的信道容量不足和计算机存储容量不足的问题,因而是一种从容量方面提高系统使用效率的重要技术。3-3-2 数据压缩数据压缩下面向大家介绍一种有效的数据压缩方法。其思想是对信号作正交变换,根据失真最小的原则在变幻域进行压缩。其框图如下所示。1TT压缩xyyx 设 为n维随机变量,n的值很大。经过正交T变换后,得到变幻域的n维向量1,Tnxxx1,TnyyyyTx(3-3-15)其中变幻矩阵T的列向量为满足12,n 12,TnT(3-3-16)Tkmkm(3-3-17)现在对数据进行压缩,即保留y的m个分量其余的n-m个分量用预先选定的常数 代,替,得到一个新的向量,再
12、由 通过逆变换 得到x的估计kb11,Tmmnyyybby1T1xTy我们的问题是:如何选取变幻矩阵T和常数 ,y的那些分量被压缩掉,才能使 最接近x,即均方误差最小:kbx221|()minniiixxExx(3-3-18)下面来注意解决这些问题。由式(3-3-15)和式(3-3-16)可知1121,nniiixTyyy 111mniiiiii mxTyyb由此式可知,要使 达到最小,应有2211|()|()nniiiiii mi mE ybEyb(3-3-19)2()0kkkE ybb(3-3-20)即,1,kkbE ykmn 这就使常数 应选取的数值。由此式得kb TTkkkbExE x
13、(3-3-21)其中 是随机向量x的协方差阵。由式(3-3-22)可考虑如何选择T的行向量使 达到极小。注意到 是归一化正交的。为求 在条件 下的极值,令代入式(3-3-19),得到11()()nnTTiiiiixii mi mEybybC(3-3-22)xCii1Tii 1(1)nTiii m 这表明 是协方差阵 的特征值,而 是相应的特征向量,很显然,T取成x的卡享南-洛厄维变换是最合理的,此时的最小均方误差为则由式(3-3-22),有1(1)nTTiXiiiii mC 于是 1,220kxkkkkmnxkkkCC (3-3-23)kkCk根据此式,我们可先把非负定矩阵 的特征值按大小次序
14、排列,然后根据实际问题对均方误差的要求选择m,使得 小于指定的误差(即选择满足此条件的最小的m),把n-m个较小的特征值 所对应的 换成 。min11nnTixiii mi mC(3-3-24)xCmin1nii miiy iibE y12n特别地,如果取Ex=0(通常的信号经过预处理后可满足此条件),则取 ,至此,前面提出的问题便全部解决。0ib 在上述解法中,卡享南-洛厄维变换被选用并不是偶然的,因为这种变换消除了原始信号x的诸分量间的相关性,从而使数据压缩能遵循均方误差最小的准则实施。上述数据压缩方法告诉我们应该压缩掉y中那些方差大的分量,这称为数据压缩的方差准则。由于卡享南-洛厄维变换
15、需要知道矩阵的特征值和特征向量,其计算量非常大,因此在实际应用中通常都使用固定程式的有限正交变换。尽管这些变换不是最佳的,但实践和理论表明它们也都能在较大程度上消除随机向量诸分量间的相关性,而且由于它们具有快速算法,因而是实用的。卡享南-洛厄维变换是理论上的最佳变换,它可作为理论研究的工具,也可用来衡量其他变换优劣的标准。设有随机向量 ,它含有真实信号 及噪声 ,如下述模型所示:3-3-3 维纳滤波维纳滤波1,Tnxxx1,Tnsss1,TnvvvxHsv(3-3-25)其中H为已知 矩阵,它也表示一种干扰。现在将x输入到一个如下图所示的系统n n1TTxyA1sTAy要使相应的输出 成为真实
16、信号s的最佳估计,即均方差最小:求滤波器矩阵A,其中T是正交变换。s2|()()minTssE ssss(3-3-26)这个问题称为维纳(Wiener)滤波器设计问题。正交变换T的作用是把滤波问题转化到变换域处理。由系统框图知于是11sTAyTATx(3-3-27)利用表3-2-2中的公式2和3,得到11()()(2TTTTTTEsTAysTAyEs sy A Tsy A Ay2 2 TTAE TsyE Ayy 因此最佳滤波器矩阵A应满足TTAE yyTE sy(3-3-28)当 可逆时TE yy1 TTATE syE yy(3-3-29)设信号与噪声的均值为零:Ex=0;Ev=0;真实信号与
17、噪声不相关:;并记真实信号s与噪声v的自相关矩阵为则0TTE svE vsTTE ssPE vvR()()TTTTTTTTTTTTE syE sxTE s HsvTPH TE xxHPHRE yyT HPHR T于是式(3-3-29)便成为这就是维纳滤波器矩阵。1()TTTATPHHPHRT(3-3-30)下面再用配方法来解决此问题。为此,用矩阵的迹来表示 是有效的。1111()()()()()()TTTTTTTTTE s ss strE s s s strE s T Ay s T Aytr E ssT AE yy AT E sy AT T AE ys又一次得到了式(3-3-29),而且得到了
18、最小误差:1111111 ()min TTTTTTTTTTTTtr E sstr E syE yyE ystr TAE syE yyE yyTAE syE yyTAE syE yy1min ()TTTTTTtr E sstr E syE yyE ystr PP HPHR P(3-3-31)注意到 的表达式中不出现正交变换T,由此可知维纳滤波与正交变换的选取无关。于是由式(3-3-30)联想到若取T使得矩阵A呈对角型,则将使矩阵乘向量的计算量由 降低到n。这种想法是有实际意义的。如在图象处理中,(3-3-25)是一个典型的失真模型。若选T为傅立叶变换,则A便成为对角型矩阵。这样的维纳滤波器称为对
展开阅读全文