参数估计理论与应用(第三章)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《参数估计理论与应用(第三章)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 理论 应用 第三 课件
- 资源描述:
-
1、2022-6-6第三章 参数估计理论与应用第三章第三章 参数估计理论与应用参数估计理论与应用3.1 参数估计的评价准则3.2 基于统计分布的参数估计方法3.3 基于模型的参数最小二乘估计 本章小结2022-6-6第三章 参数估计理论与应用 在许多情况下,观测数据所服从的在许多情况下,观测数据所服从的概率模型已知概率模型已知的,而的,而模型的未知部分是以模型的未知部分是以未知参数形式出现未知参数形式出现的。的。 参数估计的基础是参数估计的基础是优化理论优化理论,即,即被估计的参数被估计的参数应该应该在某在某种准则下种准则下是是最优最优的,以及任何获得最优的估计。的,以及任何获得最优的估计。 非参
2、数估计方法不假定观测数据服从某种特定的概率模非参数估计方法不假定观测数据服从某种特定的概率模型。例如,型。例如,频域上频域上的的谱估计谱估计与与谱线拟合谱线拟合就是典型的就是典型的非参数估非参数估计方法计方法。观测到的状态观测到的状态状态状态控制控制x( (t) )y( (t) )u( (t) )v( (t) )w( (t) )观量噪声观量噪声设备噪声设备噪声设备(模型结构已设备(模型结构已知、参数未知)知、参数未知)测量装置测量装置图图3-13-1 系统辨识中的参数估计问题系统辨识中的参数估计问题2022-6-6第三章 参数估计理论与应用3.1 3.1 参数估计的评价准则参数估计的评价准则
3、参数估计参数估计是通过是通过样本样本去去估计总体估计总体的某些的某些数字特征数字特征或或统计量统计量。任何一任何一个统计量都可作为参数的估计量,但其效果的优劣有所差别。个统计量都可作为参数的估计量,但其效果的优劣有所差别。3.1.1 3.1.1 无偏性、有效性与相容性无偏性、有效性与相容性 (1 1)无偏性)无偏性 设样本的总体分布密度函数为设样本的总体分布密度函数为 p(x;), 是未知参数。从总体中抽取容量为是未知参数。从总体中抽取容量为 N 的样本的样本 x=x1, , xN , 用样本的估计量用样本的估计量 来估计来估计,如果希望,如果希望多次估计中,平均多次估计中,平均的估计值没有偏
4、差的估计值没有偏差,即,即则称则称 是是的的无偏估计量无偏估计量。xxxd);()(Ep2022-6-6第三章 参数估计理论与应用 例例3-13-1 样本均值是总体数学期望的无偏估计。样本均值是总体数学期望的无偏估计。 设设x1, , xN 是随机过程是随机过程 xk 的的N个独立观测样本,如果个独立观测样本,如果参数参数是总体的数学期望是总体的数学期望Ex,即用样本的均值,即用样本的均值作为作为的估计量,对该估计量取期望值,有的估计量,对该估计量取期望值,有 一个无偏估计量在多次估计中将不会产生一个无偏估计量在多次估计中将不会产生系统偏差系统偏差,但,但并不意味着有偏估计就不好。如果一个有偏
5、估计是渐进无偏并不意味着有偏估计就不好。如果一个有偏估计是渐进无偏的,即的,即xxNNkk11EE11EE11xxNxNNkNkkkElimNN2022-6-6第三章 参数估计理论与应用那么它仍然有可能是一个好的估计。那么它仍然有可能是一个好的估计。 考虑实随机过程考虑实随机过程xk的相关函数的两种估计量:的相关函数的两种估计量: 假定数据假定数据xk是独立观测的,容易验证是独立观测的,容易验证 式中,式中,Rx()=E xk+ xk 是随机数据是随机数据xk的相关函数。的相关函数。 以上二式表明,估计量以上二式表明,估计量 1() 是无偏的,而是无偏的,而 2()则是则是有偏的。但是,有偏的
6、。但是, 2()是渐进无偏的是渐进无偏的,即,即RRRNkkkNkkkxxNRxxNR12111)(,1)()()1 (E11E)(E)(E11E)(E112111xNkkkNkkkxNkkkNkkkRNxxNxxNRRxxNxxNR2022-6-6第三章 参数估计理论与应用渐进无偏估计量渐进无偏估计量 2()是是半正定半正定的,而无偏估计量的,而无偏估计量 1()却却不一定是半正定的,故不一定是半正定的,故 2()的使用场合较多。的使用场合较多。 (2 2)有效性)有效性 如果如果 1 和和 2 是两个根据是两个根据N个独立观测样个独立观测样本得到的无偏估计量,无疑地,对本得到的无偏估计量,
7、无疑地,对 的的平均偏差较小平均偏差较小是选择是选择的标准之一。例如,如果的标准之一。例如,如果则则 1的值比的值比 2 的值更的值更密集地聚集在密集地聚集在真值真值的的附近附近。通常。通常将方将方差(或协方差阵)在所有的无偏估计量中达到最小的差(或协方差阵)在所有的无偏估计量中达到最小的 称为称为有效估计量有效估计量。 例例3-23-2 设设x1,xN 是是N个独立观测样本,若被估计参数个独立观测样本,若被估计参数RRR)()(Elim2xNRR)()(22122022-6-6第三章 参数估计理论与应用=Ex,则对任何满足,则对任何满足都是都是的无偏估计量。利用不等式的无偏估计量。利用不等式
8、 可得可得在估计总体的数学期望时,简单的在估计总体的数学期望时,简单的算术平均算术平均比比加权平均加权平均好。好。 (3 3)一致性)一致性 估计量的精度是与样本的容量估计量的精度是与样本的容量 N 有关系有关系的。一般说来,总是认为的。一般说来,总是认为N 越大估计的效果应该越好。如果越大估计的效果应该越好。如果记依赖样本容量记依赖样本容量 N 的估计为的估计为 N ,当满足,当满足)1(11NiiNiiicxc,NiiNiicNc1221)() ()()()()()(212221222NiiNiicxcNxNxx2022-6-6第三章 参数估计理论与应用则称则称 N 是是的的一致性估计量一
9、致性估计量,或,或相容估计相容估计。 例例3-33-3 设总体设总体 x 具有均匀分布,分布密度为具有均匀分布,分布密度为其中,其中,1 和和2 是未知参数。是未知参数。 总体样本总体样本的的均值均值和和二阶矩二阶矩分别为(严格按定义计算)分别为(严格按定义计算)解得解得0, 0|limNNP其它,0,/ 1)(2112xxp22221212213E,2Exmx32)(32,22/ 122221mm2022-6-6第三章 参数估计理论与应用 按矩的估计方法,用按矩的估计方法,用独立样本独立样本的的均值均值和独立样本的和独立样本的二阶二阶矩矩,分别作为,分别作为总体总体均值均值和和二阶矩二阶矩的
10、的估计量估计量,就有,就有 下面说明下面说明 1 和和 2 分别是分别是1 和和2 的的相容估计相容估计。 设设 y1,yN 是具有同分布的独立观测样本,根据大数定是具有同分布的独立观测样本,根据大数定律,有律,有令令y=x2, 就有就有NNNiixxxxN32132)1(32212/121220, 0| 1|lim1NiiNyEyNP0, 0|lim|)E(E1|lim2212222NNNiiNPxxxxNP2022-6-6第三章 参数估计理论与应用于是于是3.1.2 Fisher3.1.2 Fisher信息和信息和Cramer-RaoCramer-Rao不等式不等式 通常希望获得有效的参数
11、估计量。但是,由于不存在导通常希望获得有效的参数估计量。但是,由于不存在导致最小方差无偏估计量的最佳算法,所以通常采用参数无偏致最小方差无偏估计量的最佳算法,所以通常采用参数无偏估计的估计的Cramer-Rao下限下限(或或CR下界下界), 作为评价参数估计性能作为评价参数估计性能的测度。为了简洁叙述这一的评价测度,先定义一个重要的的测度。为了简洁叙述这一的评价测度,先定义一个重要的概念。概念。 Fisher 信息信息 Fisher 信息用信息用J()表示,定义为)表示,定义为(3.1.13.1.1)0, 0|lim32|lim0|lim3|lim2211NNNNNNPPPP)|(lnE|(l
12、nE)(222xpxpJ2022-6-6第三章 参数估计理论与应用 当考虑当考虑 N 个观测样本个观测样本 X= x1,xN , 此时,联合条件分此时,联合条件分布密度函数可表示为布密度函数可表示为 将式(将式(3.1.13.1.1)中的)中的p(x|)改为改为p(X|)就可给出就可给出N个样本个样本变量变量X的的Fisher信息的表达式。信息的表达式。 定理(定理(Cramer-RaoCramer-Rao不等式)不等式) 设观测样本设观测样本X= x1,xN , 若参数估计若参数估计 是真实参数是真实参数 的的无偏估计无偏估计,并且条件分布密度,并且条件分布密度函数的函数的p(X|) 对参数
13、对参数 的一、二阶偏导数存在,则有的一、二阶偏导数存在,则有(3.1.23.1.2) 参数参数 的方差所能达到的下限(称为的方差所能达到的下限(称为CR下限),即上下限),即上式式等号成立等号成立的充要条件是的充要条件是)|,()|(1Nxxppx/ )|(XlnE1)(1)E()var(222pJ2022-6-6第三章 参数估计理论与应用其中其中, 函数函数K()0,并与样本向量并与样本向量 X 无关无关。 当当 为有偏估计量时,为有偏估计量时,Cramer-Rao 不等式为不等式为 (3.1.33.1.3) 式中式中()为估计偏差,即为估计偏差,即()=E -,并假定,并假定b()是可是可
14、微分的。微分的。 对于多个参数的情况,记对于多个参数的情况,记=1,p,则用矩,则用矩阵阵J() 表示表示Fisher信息,其元素信息,其元素Jij() 定义为定义为(3.1.43.1.4))()|(ln Kp x/)|(lnE)d/)(d1 ()var(222xp)|(lnE)(2XpJjiij2022-6-6第三章 参数估计理论与应用且且Cramer-Rao不等式变为矩阵不等式:不等式变为矩阵不等式:(3.1.53.1.5) 上式表示上式表示无偏估计量无偏估计量的的协方差矩阵协方差矩阵cov( )与逆与逆Fisher信息阵信息阵之差之差是一是一半正定矩阵半正定矩阵。 Fisher信息信息是
15、描述从观测数据中得到的是描述从观测数据中得到的 的的 “信息信息” 测测度,它度,它给出利用观测数据估计参数给出利用观测数据估计参数的方差下界的方差下界。但是,。但是,满满足这一下界的估计量有的时候可能不存在足这一下界的估计量有的时候可能不存在。3.2 3.2 基于统计分布的参数估计方法基于统计分布的参数估计方法 参数估计量的优劣取决于所采用的评价准则(或代价函参数估计量的优劣取决于所采用的评价准则(或代价函数)和估计算法。现在介绍已知总体统计分布的两种最有效数)和估计算法。现在介绍已知总体统计分布的两种最有效的参数估计方法:的参数估计方法:Bayes 估计估计和和最大似然估计最大似然估计。)
16、()E()cov(12JT2022-6-6第三章 参数估计理论与应用3.2.1 Bayes3.2.1 Bayes 估计估计 在参数估计中,估计误差在参数估计中,估计误差 - 通常不为零。因此,除了通常不为零。因此,除了采用前面介绍的采用前面介绍的无偏无偏、有效有效和和相容估计相容估计作为评价准则外,还作为评价准则外,还可以利用可以利用估计误差估计误差的变化范围的变化范围作为参数估计作为参数估计的的测度测度,这种测,这种测度叫做度叫做代价函数代价函数,用符号,用符号C( ( ,) )表示。常用的代价函数有表示。常用的代价函数有绝对型绝对型、二次型二次型和和均匀型均匀型三种。三种。),(C),(C
17、),(COOO/2/2绝对型绝对型二次型二次型均匀型均匀型2022-6-6第三章 参数估计理论与应用 本节仅介绍最常用的本节仅介绍最常用的二次型二次型代价函数,即代价函数,即 当总体的分布密度函数当总体的分布密度函数p(X|)已知时,利用已知时,利用X= x1,xN 进行参数估计,通常是采用进行参数估计,通常是采用代价函数代价函数的的期望值期望值作为评价参数估计量效果的测度,并称之为作为评价参数估计量效果的测度,并称之为风险函数风险函数。使风使风险函数最小的参数估计叫做险函数最小的参数估计叫做 Bayes 估计估计;基于二次型风险函基于二次型风险函数最小的估计称为最小均方误差(数最小的估计称为
18、最小均方误差(minimum mean square error, MMSE)估计)估计。二次型风险函数定义为。二次型风险函数定义为(3.2.13.2.1) 根据条件概率公式,有根据条件概率公式,有22|),(|),(|MMSEMMSECC或),(E),(RCddd);()()E(122MMSENxxpRx2022-6-6第三章 参数估计理论与应用其中,其中,p( | x1,xN )是给定是给定N个观测样本个观测样本X= x1,xN 条件条件下下 的后验分布密度函数。于是,式(的后验分布密度函数。于是,式(3.2.13.2.1)可以写成)可以写成(3.2.23.2.2) 为使为使风险函数风险函
19、数RM M S E 最小最小,对上式取,对上式取 的偏导,并令其的偏导,并令其结果为零,便得到结果为零,便得到由于由于p(x1,xN ) 是非负的,因此,是非负的,因此,RM M S E / =0, 等价于等价于上式中上式中=0。故有。故有)()|,()()|();(1pxxppppNXXXXXXd)()|()(2MMSEpdpR0d)(d)|(2d)|(2d)()|()(2XXXXXXXMMSEppppdpR2022-6-6第三章 参数估计理论与应用(3.2.33.2.3) 注意,在式(注意,在式(3.2.33.2.3)中,利用了以下事实:)中,利用了以下事实: 由此可得出重要的结论:未知参
20、数由此可得出重要的结论:未知参数 的的MMSE估计是给估计是给定样本定样本X条件下条件下的条件均值。的条件均值。 例例3-43-4 某一随机参量某一随机参量x 服从高斯服从高斯N(mx,Cx)分布,用仪器分布,用仪器可测量其线性组合可测量其线性组合y ,即,即(1 1)式中,式中,yN 维,维,kNM 维,维,x M维,维,e N 维。维。,|Ed)|(1MMSENxxpX1d)|(Xpexky2022-6-6第三章 参数估计理论与应用其中,测量误差其中,测量误差 e 服从高斯服从高斯N(0,Ce)分布;分布;k 为给定的常数为给定的常数阵。假设阵。假设 () e 与与 x 独立;独立; ()
21、 e 与与 x 相关,互协方差函数为相关,互协方差函数为Cxe 。 试分别求出两种情况下的试分别求出两种情况下的MMSE估计估计x(y)和和估计误差估计误差x (y)的的协方差协方差R x(y)。 解解 如果如果将将 x 看作未知参数看作未知参数,那么,根据上面讨论,那么,根据上面讨论, x 的的MMSE估计估计是是给定观测样本给定观测样本y1,yN 时时 x 的的条件均值条件均值。因。因此,可利用公式(此,可利用公式(1.4.16)和()和(1.4.17)pp.29 (2 2)(3 3)来求解。来求解。)(1|yyxyxyxmymmCCyxyxyxyxCCCCC1|2022-6-6第三章 参
22、数估计理论与应用 对式(对式(1)两边取均值,得到)两边取均值,得到 (4 4) 将式(将式(1)和()和(3)代入有关定义式,得)代入有关定义式,得(5 5)(6 6)(7 7)T1,Mxx xxxmmkm,exxxxyxxykemxkmxymxCCmCTTT)()E()(E(xexxyyxk CCCCTTTexexexxxyyykkkkemxkemxkmymyE)()()(E)(TTTCCCCC2022-6-6第三章 参数估计理论与应用(i)当)当 e与与 x 互相独立,互相独立,Cxe=0。将式(。将式(4)(7)代入)代入式(式(2)和()和(3),得到),得到x(y)的估计及协方差的
23、估计及协方差R x(y)(ii)当)当 e 与与 x 相关,只需注意相关,只需注意Cxe 0即可。即可。 这个问题留给读者解决。请构造一组数据,在这个问题留给读者解决。请构造一组数据,在Matlab 平平台上仿真这两种的估计结果。台上仿真这两种的估计结果。3.2.2 3.2.2 最大似然估计最大似然估计 最大似然估计(最大似然估计(maximum likelihood estimate, ML估估计)的基本思路是:计)的基本思路是:在给定参数在给定参数条件下,条件下,将观测样本将观测样本 x x)( )()(1TTyxmkykkkmmxexxxy | xCCC(y)xxexxxy | xkkk
24、k1TT)(RCCCCCCK2022-6-6第三章 参数估计理论与应用联合条件概率密度函数联合条件概率密度函数p(x|)视为视为真实参数真实参数 的函数的函数,即,即似似然函数然函数L(x,) (包含未知参数(包含未知参数的可能性函数),然后利的可能性函数),然后利用容量为用容量为 N 的观测样本的观测样本x= x1,xN ,求出,求出使使L(x,)达到达到最大化最大化的的参数参数 作为作为=1,p的的估计值估计值。在数学。在数学上,通常将未知参数上,通常将未知参数 的最大似然估计量记为的最大似然估计量记为式中式中是参数是参数 的值域。故的值域。故ML估计量估计量 ML就是就是p(x|)的全的
25、全局极大点。局极大点。 由于对数函数是严格单调的,故由于对数函数是严格单调的,故 L(x,) 的极大点与的极大点与ln L(x,)的极大点是一致的。通常,将的极大点是一致的。通常,将ln L(x,)称为称为对对数似然函数数似然函数。于是,。于是,ML估计量估计量 ML可由可由(3.2.43.2.4))|(maxargMLxppiLi, 2, 1, 0,(ln)x2022-6-6第三章 参数估计理论与应用确定。如果确定。如果 x1,xN 是是N个独立的观测样本,则对数似然函个独立的观测样本,则对数似然函数可写作数可写作(3.2.53.2.5) ML估计量估计量 ML只要能够求出来,总是比较好的估
展开阅读全文