模式识别课件:a05.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模式识别课件:a05.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 课件 a05
- 资源描述:
-
1、1模式识别主讲主讲: 蔡宣平蔡宣平 教授教授 电话电话: 7344173441(O O),73442,73442(H H)E-mailE-mail:单位单位: : 电子科学与工程学院信息工程系电子科学与工程学院信息工程系第五章第五章 统计决策中的训练、学习统计决策中的训练、学习 与错误率测试、估计与错误率测试、估计n 统计推断概述统计推断概述n 参数估计参数估计n 概密的窗函数估计法概密的窗函数估计法n 有限项正交函数级数逼近法有限项正交函数级数逼近法5 51 1 统计推断概述统计推断概述第五章第五章 统计决策中的训练、学习统计决策中的训练、学习 与错误率测试、估计与错误率测试、估计本章目的:
2、已知类别的样本(训练样本)本章目的:已知类别的样本(训练样本) 学习或训练学习或训练获得类概密获得类概密)(ixp在上一章的学习中在上一章的学习中, ,我们一直假设类的条件概我们一直假设类的条件概率密度函数是已知的率密度函数是已知的, ,然后去设计贝叶斯分类器。然后去设计贝叶斯分类器。但在实际中,这些知识往往是不知道的,这就需但在实际中,这些知识往往是不知道的,这就需要用已知的样本进行学习或训练。也就是说利用要用已知的样本进行学习或训练。也就是说利用统计推断理论中的估计方法,从样本集数据中估统计推断理论中的估计方法,从样本集数据中估计这些参数。计这些参数。5.1 统计推断概述统计推断概述如果已
3、知如果已知i 类的概密类的概密)(ixp 的函数类型,即知道的函数类型,即知道i 类的类的概型,但不知道其中的参数或参数集概型,但不知道其中的参数或参数集,可采用参数估计的方法可采用参数估计的方法,当解得这些参数,当解得这些参数 后后)(ixp 也就确定了。也就确定了。 ),(21qqq=qD qmiL确定未知参数确定未知参数q参数估计参数估计参数估计有两类方法参数估计有两类方法: :1.1. 将参数作为非随机量处理,如将参数作为非随机量处理,如矩法估计矩法估计、最大似然估计最大似然估计;2.2. 将参数作为随机变量,将参数作为随机变量,贝叶斯估计贝叶斯估计就属此就属此类。类。5.1 统计推断
4、概述统计推断概述非参数估计非参数估计5.1 统计推断概述统计推断概述当不知道类的概型时,就要采用非参数估计的当不知道类的概型时,就要采用非参数估计的方法,这种方法也称为总体推断,这类方法有:方法,这种方法也称为总体推断,这类方法有:1. p-1. p-窗法窗法2. 2. 有限项正交函数级数逼近法有限项正交函数级数逼近法3. 3. 随机逼近法随机逼近法基本概念基本概念母体(总体):母体(总体):一个模式类称为一个一个模式类称为一个总体总体或或母体母体5.1 统计推断概述统计推断概述母体的母体的子样子样:一个模式类中某些模式:一个模式类中某些模式( (即母体中的即母体中的 一些元素一些元素) )的
5、集合称为这个的集合称为这个母体的子样母体的子样。母体。母体的子样含有母体的某些信息,可以通过构造的子样含有母体的某些信息,可以通过构造样样本的函数本的函数来获得。来获得。统计量:统计量:一般来说,每一个样本都包含着母体的某一般来说,每一个样本都包含着母体的某些信息,为了估计未知参数就要把有用的信息些信息,为了估计未知参数就要把有用的信息从样本中抽取出来。为此,要构造训练样本的从样本中抽取出来。为此,要构造训练样本的某种函数,这种函数在统计学中称为统计量。某种函数,这种函数在统计学中称为统计量。基本概念基本概念经验分布:经验分布:由样本推断的分布称为经验分布。由样本推断的分布称为经验分布。5.1
6、 统计推断概述统计推断概述)(ixp)(iP )(xPi数学期望、方差等数学期望、方差等理论量(或理论分布):理论量(或理论分布):参数空间:参数空间:在统计学中,把未知参数在统计学中,把未知参数q q的可能值的的可能值的集合称为参数空间,记为集合称为参数空间,记为Q Q。点估计、估计量:点估计、估计量:针对某未知参数针对某未知参数q q构造一个统计构造一个统计量作为量作为q q的估计的估计 ,这种估计称为点估计。,这种估计称为点估计。 称为称为q q的估计量。的估计量。qq基本概念基本概念5.1 统计推断概述统计推断概述 为了准确地对某一类的分布进行参数估计或总为了准确地对某一类的分布进行参
7、数估计或总体推断,应只使用该类的样本。体推断,应只使用该类的样本。就是说在进行参数估计时,应对各类进行独立就是说在进行参数估计时,应对各类进行独立的参数估计或总体推断。因此在以后的论述中,如的参数估计或总体推断。因此在以后的论述中,如无必要,不特别言明类别。无必要,不特别言明类别。 区间估计:区间估计:在一定置信度条件下估计某一未知参数在一定置信度条件下估计某一未知参数q q的取值范围,称之为置信区间,这类估计称的取值范围,称之为置信区间,这类估计称为区间估计。为区间估计。基本概念基本概念5.1 统计推断概述统计推断概述渐近无偏估计渐近无偏估计:即即 。当不能对所当不能对所有有 的都有的都有
8、时,希望估计量时,希望估计量 是渐是渐近无偏估计。近无偏估计。 q=qEENNlimN q=qEENNq基本概念基本概念5.1 统计推断概述统计推断概述均方收敛均方收敛:q=NNVarlim均方逼近均方逼近: :均方收敛均方收敛:=qqqq)(limNNNE又称相合估计又称相合估计一致估计一致估计: : 当样本无限增多时,估计量当样本无限增多时,估计量 依概依概率收敛于率收敛于 ,Nqq0)(lim=qqNNP 5 52 2 参数估计参数估计第五章第五章 统计决策中的训练、学习统计决策中的训练、学习 与错误率测试、估计与错误率测试、估计5.2 参数估计参数估计5.2.1 5.2.1 均值矢量和
9、协方差阵的矩法估计均值矢量和协方差阵的矩法估计5.2.2 5.2.2 最大似然估计最大似然估计(MLE)(MLE)5.2.3 5.2.3 贝叶斯估计贝叶斯估计(BE)(BE)5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计矩法估计矩法估计是用样本是用样本( (的统计的统计) )矩作为总体矩作为总体( (理论理论) )矩的估矩的估值。若类的概型为正态分布,我们用矩法估计出类的值。若类的概型为正态分布,我们用矩法估计出类的均值矢量和协方差阵后,类的概密也就完全确定了。均值矢量和协方差阵后,类的概密也就完全确定了。 ),()(21D=nxdxpxxEL均值矢量均值矢量
10、: =NjjxN11均值无偏估计均值无偏估计: 5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计=222212222222121212211nnnnnnLLLL)(2llkkklxxE= =lklkllkkdxdxxxpxx),()(=xxE)(=xxE协方差阵协方差阵 :5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计)(=xxE协方差阵协方差阵 :=NjjjxxNC1)(11协方差阵无偏估计协方差阵无偏估计 :=NjjjNmxNmxN1) )()(11或或5.2 参数估计参数估计设设)(Nm和和)(NC是由是由N个样本算得的均
11、矢和协方差阵,个样本算得的均矢和协方差阵,1Nx则可采用则可采用递推公式递推公式进行估算进行估算若再加入一个新的样本若再加入一个新的样本=1111) 1(NjjxNNm)(1111=NNjjxxN)(111=NxNmNN1) 1 (xm=初始值初始值:)(11)(1NmxNNmN = = 均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计5.2 参数估计参数估计协方差矩阵的递推估计式协方差矩阵的递推估计式: 均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计)1()(1(1) 1(11=NmxNmxNNCjNjj)()()() 1(1111112111=NNNNjNjjxNmNxN
12、mNNNNxxNxxN)()(11111NmNmNNxxNNNjNjj=)()(1111NmxNmxNNN=11)1() 1(11NjjjNmNmNNxxN11)(12)()(111111=NNNjNjjxxNxNmNNmNmNNxxN)()(11)(111NmxNmxNNCNNNN=)1 () 1 () 1 (111111xxxxmmxxC初始值初始值:5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) 如同如同矩法估计矩法估计一样,一样,最大似然
13、估计最大似然估计要求要求已知已知总体的概型总体的概型,即概密的具体函数形式,它也将被,即概密的具体函数形式,它也将被估计量作为确定性的变量对待。但最大似然估计估计量作为确定性的变量对待。但最大似然估计适用范围比矩法估计更宽一些,可以用于不是正适用范围比矩法估计更宽一些,可以用于不是正态分布的情况。态分布的情况。最大似然估计最大似然估计是参数估计中最重要的方法。是参数估计中最重要的方法。5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) 似然函数似然函数: :当当N个随机样本取定值个随机样本取定值NxxxL,21时,时,),(21
14、qLNxxxp称为相对于称为相对于NxxxL,21的的q的的似然函数似然函数。 联合概密联合概密 设一个总体设一个总体x的概密为的概密为),(qxp,其中,其中q是一个是一个未知参数集,未知参数集,5.2 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) ),(21qLNxxxp),()(qDNXp)()(qNXp由于由于q是概密的一个确定性的参数集是概密的一个确定性的参数集, , 因此因此),()(qNXp实际上就是条件概密实际上就是条件概密 上式中不同的上式中不同的 , ,q),()(qNXp将不同。将不同。 如果各个如果
15、各个), 2 , 1(NjxjL=是独立抽取的,则进是独立抽取的,则进)()(qNXp=q=qqq=NjjNxpxpxpxp121)()()()(L一步有:一步有:5.2 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(MLE)(Maximum Likelihood Estimate) (Maximum Likelihood Estimate) 最大似然估计:最大似然估计:5.2 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(MLE)(Maximum Likelihood Estimate) (Maximum Likelihood Estimate) 在实际中多是独立
16、取样和经常处理正态变量,而在实际中多是独立取样和经常处理正态变量,而且对数函数是单值单调函数,对数似然函数与似然且对数函数是单值单调函数,对数似然函数与似然函数在相同的函数在相同的 处取得最大值。处取得最大值。q5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) 在似然函数可微的条件下,在似然函数可微的条件下,求下面微分方程组的解:求下面微分方程组的解:0)()(=qqNXp)()(qNXpqq0)(ln)(ln1)(=qq=qq=NjjNxpXp或等价地求或等价地求作为极值的必要条件。作为极值的必要条件。 对数似然方程对数似然
17、方程组组 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) 需要指出的是:需要指出的是:对于具体问题,有时用上述对于具体问题,有时用上述方法不一定可行,原因之一是似然函数在最大值方法不一定可行,原因之一是似然函数在最大值点处没有零斜率。点处没有零斜率。 求出上面方程组中的一切解及边界值,计算使求出上面方程组中的一切解及边界值,计算使)()(qNXp最大的最大的q作为作为q的最大似然估计。的最大似然估计。 因此,最大似然的关键是必须知道概型。因此,最大似然的关键是必须知道概型。5.2 参数估计参数估计最大似然估计最大似然估计(M
18、LE)(Maximum Likelihood Estimate) 下面我们以多维正态分布为例进行说明。下面我们以多维正态分布为例进行说明。(1 1)假设)假设是已知的,未知的只是均值是已知的,未知的只是均值,则:,则:)()(|)2ln()|(ln12121q=kTkdkxxxp)()|(ln1q=kkxxp0)(11=Nkkx=NkkxN115.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate) 这说明,样本总体的未知均值的最大似然估计这说明,样本总体的未知均值的最大似然估计就是训练样本的平均值。它的几何解释就是:若把就是训练样本
19、的平均值。它的几何解释就是:若把N N个样本看成是一群质点,则样本均值便是它们的个样本看成是一群质点,则样本均值便是它们的质心。质心。2122)(21)2ln(21)|(lnqqqq=kkxxp=22212122)(21)(1)|(lnqqqqqqqkkkxxxp0)(1112=Nkkxqq0)(11122212=NkNkkxqqq=NkkxN110)(1112=Nkkxqq0)(11122212=NkNkkxqqq212) (1=NkkxN可见,正态分布中的协方差阵可见,正态分布中的协方差阵的最大似然估的最大似然估计量等于计量等于N N个矩阵的算术平均值。个矩阵的算术平均值。=NkkxN11
20、(3 3)对于一般的多维正态密度的情况,计算方法)对于一般的多维正态密度的情况,计算方法完全是类似的。最后的结果是:完全是类似的。最后的结果是:TNkkkxxN) )(11=可以证明上式的均值是无偏估计,但协方差阵可以证明上式的均值是无偏估计,但协方差阵并不是无偏估计,无偏估计是:并不是无偏估计,无偏估计是:TNkkkxxN) )(111=5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)考虑到考虑到)(NX的各种取值,我们应求的各种取值,我们应求)()(NXR q在在=LN空间中的期望,即平均损失:空间中的期望,即平均损失: q=NNNNXdXpXRR)()()()()()()()()()
21、(),(NNNXddXpXpNqqqq= Q5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)q=NNNNXdXpXRR)()()()()()()()()()(),(NNNXddXpXpNqqqq= Q5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE),(qq 不同的具体定义,可得到不不同的具体定义,可得到不同的最佳贝叶斯估计。比如,可以用平方误差作同的最佳贝叶斯估计。比如,可以用平方误差作为代价,此时:为代价,此时:上式中,对于上式中,对于)()(),(qqqq=qq)()()()()()()(NNNXdXpdXpN Qqqqqqq=)()()()()()()(NNNXddXpXpRNq
22、qqqqq= Q于是:于是: 5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)min)()()()()()(=qqqqqq=qQdXpXRNNq由于由于)()(NXp是非负的,是非负的,只出现在内层积分中,关于只出现在内层积分中,关于q使使R最小等价于:最小等价于:)()()()()()()(NNNXdXpdXpN Qqqqqqq=R为求为求)()(NXR q极小,令极小,令=qqqq=qqQdXpXRNN)()(2)()()(5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)=qqqq=qqQdXpXRNN)()(2)()()(从而可得:从而可得:)()()()()(NNNXEdXpX
23、q=qqq=qQ5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)下面介绍估计下面介绍估计q 所涉及的其它公式或近似算式:所涉及的其它公式或近似算式:由于各样本是独立抽取的,故它们条件独立,即有由于各样本是独立抽取的,故它们条件独立,即有=q=q=qNjjNNxpxxxpXp121)()(),()(L由贝叶斯定理知:由贝叶斯定理知:5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)=qq=q=qNjjNNNpxpXxxxpXp1)(121)()()()(),()(L5.2 参数估计参数估计贝叶斯估计贝叶斯估计(BE)作业:作业:P170 5.1, 5.2, 5.34254 概密的窗函数估计
24、法 第五章第五章 统计决策中的训练、学习统计决策中的训练、学习 与错误率测试、估计与错误率测试、估计43N设设 个样本个样本 是从上述概密为是从上述概密为 的总的总体中独立抽取的,体中独立抽取的, 个样本中有个样本中有 个样本落入区域个样本落入区域 中的概率中的概率 服从离散随机变量的二项分布服从离散随机变量的二项分布NxxxL,21)(xpNkRkPkNkkNkPPCP=)1 (44令令 为众数,如果为众数,如果 不是整数,则不是整数,则: 即即 等于等于 的整数部分;的整数部分;mPN) 1(mPN) 1(PNm) 1(=PN) 1(1) 1(=PNmPNm) 1(=如果如果 是整数,则是
25、整数,则: 和和45PNmPN) 1(1) 1(由于:由于:PNNPk所以:所以:这里这里 是是 的估计,当的估计,当 较大较大 较小时上式的近较小时上式的近似程度是足够的。似程度是足够的。 PPNP465.4 概密的窗函数估计法概密的窗函数估计法概率密度的基本估计式概率密度的基本估计式 当固定当固定 时,对时,对 的最大似然估计的最大似然估计 ,由概率论知,由概率论知, 的数学期望的数学期望 。kNkkNkPPCP=)1 (NkP =Pkk NPkE= NPkE= NPkE=475.4 概密的窗函数估计法概密的窗函数估计法概率密度的基本估计式概率密度的基本估计式设区域设区域R的体积为的体积为
展开阅读全文