《模式识别原理与应用》课件第2章.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《模式识别原理与应用》课件第2章.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别原理与应用 模式识别 原理 应用 课件
- 资源描述:
-
1、第2章贝叶斯决策理论第第2章贝叶斯决策理论章贝叶斯决策理论2.1分类器的描述方法分类器的描述方法2.2最大后验概率判决准则最大后验概率判决准则2.3最小风险贝叶斯判决准则最小风险贝叶斯判决准则2.4Neyman-Person判决准则判决准则2.5最小最大风险判决准则最小最大风险判决准则习题习题第2章贝叶斯决策理论2.1分类器的描述方法分类器的描述方法2.1.1基本假设基本假设给定模式空间S,由m个互不相交的模式类集合组成,即 ,。几个基本假设如下:12,m 12mS,(,1,2,)ijij i jm(1)假定类i的先验概率为P(i);(2)样本(或模式)x由特征向量来表示,同样记为x,假设为d
2、维,即x=(x1,x2,xd);第2章贝叶斯决策理论(3)特征向量x的取值范围构成特征空间,记为Rd;(4)特征向量x的类条件概率密度函数为p(x|i),表示当样本xi时,特征向量x的概率密度函数;(5)特征向量x的后验概率为P(i|x),表示在特征向量x出现的条件下,样本x来自类i的概率,即类i出现的概率。模式识别就是根据特征向量x的取值,依据某个判决准则把样本x划分到1,2,m中的一个。第2章贝叶斯决策理论2.1.2模式分类器的描述模式分类器的描述 模式分类器的描述方法有多种,这里仅介绍以下三种描述方法,它们之间是统一的。1.映射描述法映射描述法由于我们获取的有关观察对象的数据总量是有限的
3、,因此,可用一个d+1维向量表示,即12(,;)dx xx第2章贝叶斯决策理论其中:(x1,x2,xd)为特征向量,是特征空间Rd中的一个点;取值于集合1,2,m,表示模式的真实类别号,是未知的量,m为类别数。模式分类的实质在于实现特征空间Rd到类别号空间1,2,m的一个映射,即Rd1,2,m给定一个映射f,就给出了一种模式识别方法,不同的映射对应不同的分类方法,这就是模式识别问题的映射描述法。第2章贝叶斯决策理论2.划分描述法划分描述法 由于每个特征向量是Rd空间的一个点,且Rd1,2,m是一个多对一的映射,通过映射,本质上实现了对空间Rd的一种划分,即把Rd划分成个不相重叠的区域,每一个区
4、域对应一个类别。设区域Ri对应第i类i,则以下条件成立:(1)这一条表明了分类的确定性,一个样本只能属于某一类,不能同属两个或多个类别。,1,2,ijRRij i jm 第2章贝叶斯决策理论(2)若特征向量x=(x1,x2,xd)落在区域Ri内,即xRi,则将样本x判属第i类,记为xi;此时,Ri称为xi的决策区域。(3)。若 Ri为Rd的真子集,即,当样本落在此区域中时,样本对应的模式不是m类中的任何一种,可以把它称为拒绝类,为拒绝域,相应的判决为拒识。此时,引入一个新类m+1(拒绝类),相应的决策区域为。1mdiiRR1miiR1mdiiRR 1mdiiRR11mdmiiRRR第2章贝叶斯
5、决策理论当样本落在两类或多类的交界面上时,可以任取交界面所在的一类进行判决,也可以拒绝判决。从划分意义上看,模式识别就是对于一个具体分类问题,在确定了需分类的类别数m和所用的特征维数后,实现对Rd空间的划分,每一种划分对应一种识别方法。第2章贝叶斯决策理论如果不考虑拒识,此时,那么,正确分类包括m种情形,样本x来自类i,特征向量xRi(i=1,2,m);错误分类包括m(m1)种情形,样本x来自类i,但特征向量xRj(i=1,2,m;j=1,2,m;ji)。因此,平均正确概率Pc为1mdiiRR11(|)()()(|)immciiiiiRiiPPRPPpdxxx(2-1)第2章贝叶斯决策理论平均
6、错误概率Pe为Pe=1Pc (2-2)以下不再刻意区分样本(或模式)和特征向量,也就是说,xi意指x是样本(或模式);xRi或函数g(x)意指x是特征向量。第2章贝叶斯决策理论3.判别函数法判别函数法把分类问题对应为Rd空间上的多元函数,通常称为判别函数(或称判决函数)gi(x),i=1,2,m。对于任给未知类别的样本x,计算各类判别函数的值gi(x),i=1,2,m,将样本x判属有极大(或极小)函数值的那一类。到底应取极大值还是取极小值,需要根据具体问题的物理意义确定。不同的判别函数对应不同的模式分类方法。第2章贝叶斯决策理论模式分类实际上是将特征空间划分为不同的决策区域,相邻决策区域被决策
7、面所分割,这些决策面是特征空间中的超曲面,其决策面方程满足相邻两个决策域的判别函数相等,即gi(x)=gj(x)分类器可被看做是一个计算m类个判别函数并选取最大(或最小)判决值对应的类别的网络或机器。一个分类器的网络结构如图2-1所示。第2章贝叶斯决策理论图 2-1分类器的网络结构第2章贝叶斯决策理论2.2最大后验概率判决准则最大后验概率判决准则2.2.1判决准则判决准则在讨论具体的判决准则之前,让我们先来看一个分类问题。假设某工厂里所有的产品都只属于事先确定的两类,分别表示为1=“高质量”,2=“平均质量”。假设工厂对于产品储量有一个合理的长期记录,总结出来的结果如下:第2章贝叶斯决策理论总
8、的产品个数n=2 253 550;属于类1产品的个数 n1=901 420;属于类2产品的个数 n2=1 352 130;由此可以估计出两类产品出现的概率,即先验概率分别4.0/)(11nnP6.0/)(22nnP第2章贝叶斯决策理论情形情形1:假设在没有看到一个具体的产品时就要确定它到底属于哪一类。如果唯一能够得到的信息就是先验概率,那么一个很自然的“合理”选择是将这一产品归入类2。可以想象,这时可能造成40%的错误率。如果我们仅仅需要做一次判断,那么采用这种判决规则还是合理的。但是,如果要求我们进行多次判断,那么重复使用这种规则就不合适了,因为我们将一直得到相同的结果。第2章贝叶斯决策理论
9、情形情形2:假设可以对产品进行一些测量,获得了它的观测向量(或特征向量)x,这时意味着对该产品所属类别的不确定性减少了,即观测向量(或特征向量)能够提供一些类别信息。具体地,后验概率P(i|x)表示了x所代表的某个产品属于第i类的概率,那么现在“合理”的选择是:第2章贝叶斯决策理论如果P(1|x)P(2|x),则判决x属于1;如果P(1|x)P(2|x),则判决x属于2;如果P(1|x)=P(2|x),则判决x属于1或属于2。这种决策称为最大后验概率判决准则,也称为贝叶斯(Bayes)判决准则。假设已知P(i)和p(x|i)(i=1,2,m),最大后验概率判决准则就是把样本x归入后验概率最大的
10、类别中,也就是,)|(max)|(,2,1xximijPP2-3则xj。第2章贝叶斯决策理论由于已知P(i)和p(x|i),因此我们希望找到P(i|x)与它们之间的关系。这里以一维为例进行讨论。假设特征变量为X,那么有0(|)lim|(,)iiPxPXxx 由Bayes公式可知第2章贝叶斯决策理论(,)|()|(,)(,)iiiP XxxPPXxxP Xxx()(|)d()dxiixxxPp yyp yy12()(|)2()2iiPp yp y12()(|)()iiPp yp y=第2章贝叶斯决策理论其中,y1,y2(x,x+)。当趋近于0时,y1与y2趋近于x,从而有(|)()(|)()ii
11、ip xPPxp x(2-4)类似地,可得特征变量为多维时的结果(|)()(|)()iiipPPpxxx(2-5)第2章贝叶斯决策理论根据式(2-5),可以得到几种最大后验概率判决准则的等价形式:(1)若)()|(max)()|(,2,1iimijjPpPpxx,则xj;(2)若(|)()(),1,2,(|)()jiijpPLim ijpPxxx,则xj;(3)若()ln()ln(|)ln(|)ln,1,2,()ijijPLppim ijPxxx则xj。第2章贝叶斯决策理论其中,L(x)称为似然比,lnL(x)称为对数似然比。在最大后验概率判决准则中,xj的决策区域Rj为(|)()|,1,2,
12、(|)()jijijpPRim ijpPxxx (j=1,2,m)(2-6)第2章贝叶斯决策理论【例例 2.1】假设在某个局部地区的细胞识别中,第一类表示正常,第二类表示异常,两类的先验概率分别为:正常P(1)=0.9,P(2)=0.1。现有一个待识别样本细胞,其观察值为x,从类条件概率密度函数曲线p(x|i)上可查得:p(x|1)=0.2,p(x|2)=0.4,试判断该细胞是否正常。第2章贝叶斯决策理论解解计算p(x|1)P(1)=0.20.9=0.18p(x|2)P(2)=0.40.1=0.040.18根据 Bayes 判决准则将该细胞判为第一类,即为正常细胞。第2章贝叶斯决策理论2.2.
13、2 错误概率错误概率最大后验概率判决准则的一个优良性质就是使平均错误概率达到最小。因此,最大后验概率判决准则又称为最小错误概率判决准则。这里以二分类情况为例进行分析。此时,m=2,任意一个判决准则对应于特征空间Rd的一个划分:R=R1R2,R1R2=。错误分类为两种情况:真实类别为1时,而特征值x落入R2;真实类别为2时,而特征值x落入R1。因此,平均错误概率为第2章贝叶斯决策理论212111221122()(|)()(|)()()(|)()(|)RRP ePRPPRPPpdPpdxxxxxx1122()()()()PP ePP e(2-7)其中,211()(|)RP epdxx122()(|
14、)RP epdxx第2章贝叶斯决策理论考虑到21(|)Rpdxx=111(|)Rpdxx(2-8)式(2-7)可以化为111122()()(1(|)()(|)RRP ePpdPpdxxxx112211()()(|)()(|)RPPpPpdxxx(2-9)第2章贝叶斯决策理论若要使Pe达到最小,则x1的决策区域R1必须满足:12211|()(|)()(|)0RPpPpxxx即12121(|)()|(|)()pPRpPxxx(2-10)式(2-10)与最大后验概率判决准则中x1的决策区域是一致的,也就是说,最大后验概率判决准则使平均错误概率达到最小。第2章贝叶斯决策理论例如,假设模式x为一维的情况
15、,如图2-2所示,得到的两类分界点为t,将x轴分为两个区域R1和R2,其中,纹理区域的面积表示平均错误概率,即ttdxxpPdxxpPeP)|()()|()()(2211图中,11()(|)tP ep xdx,22()(|)tP ep xdx第2章贝叶斯决策理论图2-2 平均错误概率计算示意图第2章贝叶斯决策理论2.3最小风险贝叶斯判决准则最小风险贝叶斯判决准则最大后验概率判决准则使分类的平均错误概率最小化。但是,对于某些具体的分类问题,这个准则并不是最好的,这是因为它没有考虑到不同的错误判断带来的后果是不相同的。考虑到各种错误分类造成的损失不同,人们提出了最小风险贝叶斯判决准则。它的基本思路
16、是给每一种决策规定一个损失值(或代价),将其作为因错误决策而导致的损失的度量。第2章贝叶斯决策理论设样本x来自类i,可能被判为1,2,m 中的任何一种,若允许拒绝判决,可将拒绝类看成是独立的一类,记为第m+1类,即m+1。为了表述方便,引入如下符号:(1)决策j:将样本x的类别判为第j类。不同的决策对应于特征空间的不同决策区域Rj,j1,2,m。若xRj,则判决xj(j=1,2,m)。这里未考虑拒识情况。第2章贝叶斯决策理论(2)损失函数(j,i):对真实类别为第i类的样本采取决策j所带来的损失。在实际应用时,可以将(j,i)简写为ji,写成矩阵形式mmmmmm212222111211称之为损
17、失矩阵。第2章贝叶斯决策理论对于给定类i的样本,正确判断时的代价函数应该是最小的,即0),(min),(ijjii(i=1,2,m)(2-11)当样本x的真实类别未知时,决策j的条件风险是对 x 为所有可能的真实类别条件下将样本判为第j类的代价求平均,即1(|)(,)(|)mjjiiiRP xx(2-12)第2章贝叶斯决策理论条件风险只是反映对某一个样本x做出决策所带来的风险。由于x是随机向量,对于x的不同取值,决策j的条件风险的大小不同,因此,究竟采取哪一种决策,与x的取值有关。决策可以看成是随机向量x的函数,记为(x),它本身也是一个随机变量,它的取值为1,2,m。不同的决策值对应于特征空
18、间不同的决策区域。由此可以定义期望风险。第2章贝叶斯决策理论条件风险R(j|x)(j=1,2,m)在特征空间中的平均值称为期望风险,记为R,即()|)()dRRRpdxxxx 1(|)()jmjRjRpdxxx(2-13)其中,p(x)为样本矢量在Rd空间中的概率密度函数,与类别号无关。期望风险的另一种表示方法为第2章贝叶斯决策理论与最小错误概率判决规则类似,若对每一个x都选择最小的条件风险,就能保证总体风险R最小,因此,得到最小风险贝叶斯判决准则如下:可见,期望风险反映对整个特征空间上所有x采取相应决策所带来的平均风险。,1(,)(|)()(|)()jmjijijijiijRj ij ijR
19、PPPRpdxxx(2-14)第2章贝叶斯决策理论如果)|(min)|(,2,1xximikRR(2-15)则判决xk。损失函数根据实际问题和经验确定。若将损失函数取为mjijijiij,.,2,1,10),(2-16)则称这种损失函数为0-1损失函数。此时,决策j的条件风险为第2章贝叶斯决策理论1(|)(,)(|)(|)1(|)mjjiiijiijRPPP xxxx(2-17)由(2-17)可以看出,R(j|x)最小实际上对应于P(j|x)最大,因此当取0-1损失函数时,最小风险贝叶斯判决准则等价于最大后验概率判决准则。这说明最大后验概率判决准则是最小风险贝叶斯判决准则的特例。第2章贝叶斯决
展开阅读全文