《模式识别原理与应用》课件第10章.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《模式识别原理与应用》课件第10章.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别原理与应用 模式识别 原理 应用 课件 10
- 资源描述:
-
1、第10章多分类器融合第第10章多分类器融合章多分类器融合10.1多分类器融合的基本原理多分类器融合的基本原理10.2多数投票法和多数投票法和BKS方法方法10.3基于基于Bayes理论的多分类器融合理论的多分类器融合10.4基于证据理论的多分类器融合基于证据理论的多分类器融合10.5基于神经网络的多分类器融合基于神经网络的多分类器融合10.6基于模糊积分的多分类器融合基于模糊积分的多分类器融合10.7基于决策模板的多分类器融合基于决策模板的多分类器融合习题习题第10章多分类器融合10.1.1多分类器融合的必要性多分类器融合的必要性模式识别最终的目标是得到尽可能好的识别性能。为了实现这一目标,传
2、统的做法是设计不同的分类方案,再根据实验结果,选择一个最好的分类器作为最终的解决方法。过去十多年中,对分类器研究的焦点从单个分类器的研究转移到多分类器系统的研究。10.1 多分类器融合的基本原理多分类器融合的基本原理第10章多分类器融合多分类器融合的必要性包括以下两个方面:(1)在模式识别中,分类的方法有很多,这些算法是基于不同的理论框架提出来的。分类器包括Bayes分类器、KNN分类器、各种距离分类器、模糊分类器、神经网络分类器、句法分类器等。每种分类器各有优点,对于特定的应用问题,都能够取得一定的成功,但是,没有一种方法适应所有的应用需求,或达到期望的效果。人们从大量的实验和应用中发现,不
3、同的分类器对于分类模式具有互补的信息,可以利用这种互补信息来提高识别性能,例如,更高的识别率和更低的错误率。因此,需要集成不同分类器的结果,以获得较好的分类效果。第10章多分类器融合(2)对于某些复杂的识别问题,输入的特征变量较多。这些特征变量具有不同类型、不同表现形式或不同量级。对于不同类型的特征变量,需要根据不同的理论和方法来设计分类器。对于不同表现形式和不同物理含义的特征变量,进行归一化处理非常困难,难以用一个分类器来处理。此外,当输入特征向量的维数较大时,分类器的结构将非常复杂,这增加了计算复杂度,由于有限的学习样本,分类器的性能也较差。因此,利用信息融合的思想,可将设计一个性能优良的
4、高维输入分类器问题转化成多个性能较优的低维输入分类器的设计问题,运用多分类器融合技术,为高维特征空间的划分和高可靠性分类器的设计提供一个新的思路。第10章多分类器融合10.1.2多分类器融合的体系结构多分类器融合的体系结构多分类器融合常见的结构有三种:并行结构、串行结构、串并行结构。如图10-1所示,在并行结构中,各分类器是独立进行设计的,它们之间没有关联。第10章多分类器融合图10-1 多分类器集成的并行结构第10章多分类器融合如图10-2所示,在串行结构中,前一级分类器为后一级分类器提供信息,它们之间有一定的关联。图 10-2多分类器集成的串行结构第10章多分类器融合如图10-3所示,串并
5、行结构是串行结构中某一级的分类器由多个并行结构的分类器组成,从而结合并行结构和串行结构的优点。第10章多分类器融合图 10-3多分类器集成的串并行结构第10章多分类器融合正如图10-4中的灰线和椭圆所示,各多分类器融合系统的不同之处体现在如下几个方面:(1)使用的分类器数量L。(2)单个分类器的类型。一些组合策略使用相同类型的分类器进行融合,如神经网络、线性分类器、最近邻分类器,而其他一些组合策略使用不同的分类器集合。(3)单个分类器使用的特征子集(在图10-4中用灰色椭圆表示)。第10章多分类器融合(4)分类器决策的组合方法。例如多数投票法、贝叶斯法、BKS方法、简单组合方法(如平均、相乘、
6、最小、最大)、模糊积分法、线性组合法、神经网络法、D-S证据理论法等。(5)不同分类器使用的训练集。(6)两级结构的训练类型。主要有训练多个独立的分类器,直接进行融合;先训练多个独立的分类器,再训练一个融合器;同时训练整个两级架构。通常根据分类准确度来选择单个分类器(准确度越高越好)。当整个结构作为一个整体来训练时,单个分类器的参数将随融合策略的不同而发生变化。第10章多分类器融合图 10-4多分类器融合系统 第10章多分类器融合10.1.3多分类器融合的分类多分类器融合的分类1.分类器输出信息的分类器输出信息的3个级别个级别给定模式空间S,由M个互不相交的模式类集合1,2,M组成,即S=12
7、M,ij=(ij;i,j=1,2,M),模式识别就是把给定的模式x划分到1,2,M中的一个。设e为一分类器,令=1,2,M。对于输入样本(模式)xS,e(x)=j表示分类器e把x划分到类j中。其中,jM+1,j为模式类集合j的类别号(标签)。这里引入拒识,e(x)=M+1表示分类器e拒识x,即不能判断x的类别。第10章多分类器融合一般地,分类器能够提供的信息可分为三个级别:(1)抽象级:分类器e只输出唯一的标签j,或一个子集。(2)排序级:分类器e把(或子集)中的标签按照某种规则排列成一个序列,排在首位的是第一选择。(3)度量级:分类器e给每一个标签分配一个度量值,用以表示输入样本x属于相应类
8、的程度。J J 第10章多分类器融合在上述三个级别中,度量级包含的信息最多,抽象级信息最少。根据属于某个标签的度量值,按照某种排序规则,我们可以把中标签排成一个序列(递增或递减)。通过选择排在首位的标签,或直接在度量级选择具有最大值或最小值的标签,分配给输入样本x,从而为x指定唯一的标签。换句话说,从度量级到抽象级是一个信息减少的过程或抽象的过程。第10章多分类器融合许多分类器能够提供度量级信息,例如,Bayes分类器提供后验概率P(j|x),j=1,2,M;距离分类器提供输入样本x与每类的原型样本之间的距离;模糊分类器中的隶属度,等等。度量级的处理是许多分类器的中间步骤。但是,有些分类器只能
9、提供抽象级输出,例如,句法分类器。第10章多分类器融合2.分类器融合的类型分类器融合的类型根据各分类器提供的信息的级别,多分类器融合可以分为以下三种类型:(1)决策层融合,即单个分类器输出为某个确定的类别号。假设R个分类器e1,e2,eR对同一输入样本(模式)x进行分类,事件ek(x)=jk表示分类器ek把x划分到类jk中,其中,jkM+1,ek(x)=M+1表示分类器ek拒识x,k=1,2,R。决策层融合就是利用这些事件构造一个集成的分类器e对x进行分类,输出一个确定的类别号,即e(x)=j,jM+1。第10章多分类器融合(2)排序层融合,即单个分类器输出为样本属于各类的可能性的一个排序列表
10、。对于输入x,每个分类器ek(x)产生一个子集Lk,且Lk中标签排成一个序列。排序层融合就是利用事件ek(x)=Lk,k=1,2,R,构造一个集成的分类器e,对x进行分类,输出一个确定的类别号,即e(x)=j,jM+1。第10章多分类器融合(3)度量层融合,即单个分类器输出为样本属于相应类的程度。对于输入x,每个分类器ek(x)产生一个度量向量Me(k)=(mk(1),mk(2),mk(M)T,其中,mk(i)表示x属于相应类i的程度。度量层融合就是利用事件ek(x)=Me(k),k=1,2,R,构造一个集成的分类器e,对x进行分类,输出一个确定的类别号,即e(x)=j,jM+1。这三类方法覆
11、盖了不同的应用范围,所利用的分类器输出信息量依次增多,相应地,也可能得到更好的结果。第10章多分类器融合在决策层融合中,各个分类器在理论与方法上可以相差很大,例如,有些分类器是基于统计的方法,而另一些方法是基于句法的方法。事实上,不是每种分类器都可以输出排序列表或隶属程度,但是,任何分类器至少可以输出抽象级信息,从而决策层融合可以适用于所有的模式识别领域。所以,决策层的融合成为应用最广泛,也是研究较早和较充分的一类融合方法。具有代表性的几种决策层融合方法包括多数投票法、BKS方法、Bayes规则和证据理论方法等。第10章多分类器融合在度量层融合中,融合操作只能在相同量级的度量信息上进行,从而要
12、求所有的分类器输出度量级信息。此外,不同种类的度量向量应该能够被转换成一种相同的度量向量。具有代表性的几种度量层融合方法包括Bayes方法、证据理论方法、模糊积分方法和神经网络方法等。第10章多分类器融合排序层融合位于决策层融合与度量层融合之间,它要求所有的分类器输出排序级信息。在排序层融合中,分类器不能是纯句法分类器,它只能输出抽象级信息。任何输出度量级信息的分类器都可以参与排序层融合,因为从度量向量Me(k)可以产生一个排序列表。第10章多分类器融合10.2多数投票法和多数投票法和BKS方法方法多数投票法和BKS方法是简单、有效的多分类器集成方法,本节简要讨论这两种方法。10.2.1多数投
13、票法多数投票法假设R个分类器e1,e2,eR对同一输入样本(模式)x进行分类。定义示性函数:第10章多分类器融合1,if()and()0,elsekkjejjTxx(10-1)则最保守的投票规则为 1,if,min()0()1,elseRkjkjjTeM xx(10-2)第10章多分类器融合也就是说,集成的分类器e把x划分到类j,当且仅当所有R个分类器同时把x划分到类j中,否则拒识x。多数投票准则为 11,if()max()2()1,elseRRkjikikkjTTReMxxx(10-3)第10章多分类器融合更一般的形式为 11,if()max()()1,elseRRkjikikkjTTReM
14、xxx(10-4)其中,01。若取=1,则式(10-4)变成式(10-2);若取=0.5+,为很小的正数,则式(10-4)变成式(10-3)。因此,式(10-2)与式(10-3)是式(10-4)的特例。第10章多分类器融合事实上,式(10-4)仅考虑了得票最多的类别号,并且所得票数要足够多。但是,可能出现得票最多的类别号有多个,或者得票第一多与第二多的票数相差很小。这时,式(10-4)的决策可能不可靠。进一步修正式(10-4),得到新的多数投票准则:11 11,if()max(),()()max()1,elseRRkjikikkRRkjijkikkjTTeTTRMxxxxx(其他)(10-5)
15、第10章多分类器融合基于投票准则的多分类器集成是决策层融合的一般形式,也就是说,决策层融合是基于投票准则的,或者是投票准则的变形或改进。多数投票法存在如下问题:(1)所有的分类器都是平等的,都作为一票,没有考虑不同分类器的性能差异。(2)投票准则是抽象级信息的集成,单一分类器的输出信息采用硬分类,即要么认为输入模式属于某一类,要么拒识。但是,大部分分类器的输出信息是度量级的,从而在集成的过程中,抛弃了很多有用的信息。(3)对于每个分类器,都需要确定一些门限值,这些值的确定还没有理论指导。第10章多分类器融合10.2.2BKS方法方法BKS方法又称为性能知识空间法,穷举各个分类器对训练样本集合的
16、识别结果的各种组合,然后统计各种决策组合对应的样本,找出其中占主导地位的类别,作为多分类器融合的输出。一个性能知识空间(BKS)是一个R维空间,其中,每一维代表一个分类器的判决结果。每一个分类器有M+1种可能的决策1,2,M+1,各个分类器的决策联合形成BKS的一个单元,称之为局部单元。一个二维的BKS空间如表10-1所示。第10章多分类器融合表表10-1二维二维BKS空间空间 1jM+1(1,1)(1,j)(1,M+1)i(i,1)(i,j)M+1(M+1,1)(M+1,j)(M+1,M+1)(1)|(2)ee第10章多分类器融合 利用R个分类器对所有的训练样本进行分类,统计各分类决策组合对
17、应的样本,并归入相应的局部单元中。引入记号:BKS的一个单元BKS(e(1),e(R):第一个分类器给出了决策e(1),第二个分类器给出了决策e(2),第R个分类器给出了决策e(R)等;N(e(1),e(R)(m):在BKS(e(1),e(R)中属于类别m的训练样本总数;第10章多分类器融合T(e(1),e(R):在BKS(e(1),e(R)中的训练样本总数,即(1),()(1),()1()Mee Ree RmTNm(10-6)(e(1),e(R):在BKS(e(1),e(R)中占主导地位的类别,即(e(1),e(k)=j,满足(1),()(1),()1()max()ee Ree Rm MNj
18、Nm(10-7)第10章多分类器融合对于输入样本x,各分类器决策为e(1),e(R),则多分类器融合为(1),()(1),()(1),()(1),()(1),()(),if0()1,ee kee Ree Ree Ree RNTTeMx,else(10-8)这里是一个门限值(01),用于控制最终决策的可靠性。第10章多分类器融合10.3基于基于Bayes理论的多分类器融合理论的多分类器融合本节讨论基于Bayes理论的多分类器融合,包括合成规则和合成方法。10.3.1基于基于Bayes理论的多分类器合成规则理论的多分类器合成规则假设有R个分类器,对于给定的模式x,每个分类器把模式x表示为相应的特征
19、(或度量)向量。不妨用xi表示第i个分类器ei输出的特征向量。类别k的先验概率为P(k),在模式x属于类别k为真的条件下,特征向量xi的概率密度函数为p(xi|k)(i=1,2,R;k=1,2,M)。第10章多分类器融合根据最大后验概率准则,给定特征向量xi(i=1,2,R),模式x应该划分到具有最大后验概率的类别j中,即如果1212(|,)max(|,)jRkRkPPx xxx xx(10-9)则jx(10-10)式(10-9)和(10-10)表明,为了利用所有可能的信息进行决策,必须根据所有的特征向量计算各种假设的后验概率。由Bayes公式,式(10-9)中的后验概率可以写成第10章多分类
20、器融合12121212121(,|)()(,|)()(|,)(,)(,|)()RkkRkkkRMRRiiipPpPPppPx xxx xxx xxx xxx xx12121212121(,|)()(,|)()(|,)(,)(,|)()RkkRkkkRMRRiiipPpPPppPx xxx xxx xxx xxx xx(10-11)第10章多分类器融合其中:p(x1,x2,xR)为x1,x2,xR的联合(无条件)概率密度;p(x1,x2,xR|k)为在模式 x属于类别k为真的条件下特征向量x1,x2,xR的联合概率密度。一般地,联合概率密度p(x1,x2,xR|k)较难得到。下面将利用每个分类器
21、的信息来简化式(10-11),并得到实用的融合策略。第10章多分类器融合1.积规则积规则假设在模式x属于类别k(k=1,2,M)为真的条件下,特征向量x1,x2,xR是相互独立的,即121(,|)(|)RRkikippx xxx(10-12)把式(10-12)代入式(10-11),可得11211()(|)(|,)()(|)RkikikRRmjijjiPpPPpxx xxx(10-13)第10章多分类器融合把式(10-13)代入式(10-9),则得到判决规则:如果 11()(|)max()(|)RRjijkikkiiPpPpxx(10-14)则jx(10-15)考虑到(|)()(|)()kiii
22、kkPppPxxx(10-16)第10章多分类器融合把式(10-16)代入式(10-14),利用各分类器的后验概率,得到判决规则:如果 1111(|)()max(|)()RRRRjijkikkiiPPPPxx(10-17)则jx(10-18)第10章多分类器融合式(10-17)和式(10-18)给出的判决规则称为积规则。积规则组合各分类器的后验概率,量化了假设的似然度。2.和规则和规则在式(10-17)中,进一步把后验概率P(j|xi)表示为(|)()(1)kikkiPPx(10-19)其中,ki0,则称A为证据的焦元(Focus Element),所有焦元的集合称为核。定义定义10.32上的
23、信任函数Bel(Belief Function)与似真函数Pl(Plausibility Function)定义为()()BABel Am BA(10-59)()()1()BAPl Am BBel AA (10-60)第10章多分类器融合(10-63)其中,为A的补集。信任函数Bel(A)表示证据全部给予命题A的支持程度,似真函数Pl(A)表示证据不反对(不怀疑)命题A的程度。信任函数Bel满足如下条件:ABel()=0(10-61)(10-62)Bel()=0111,()(1)()IniIni IIBel AABelA第10章多分类器融合其中:n为任意正整数;A1,An为的任意n个子集;|I
24、|表示集合I中的元素的个数。特别地,n=2,此时 21AA()()1Bel ABel AA (10-64)Bel(A)与Pl(A)满足:()()Bel APl A(10-65)区间Bel(A),Pl(A)构成证据不确定区间,表示命题的不确定程度,如图10-5所示。第10章多分类器融合图10-5 信息的不确定性表示第10章多分类器融合定义定义10.4共性函数(Commonality Function)定义为()()ABQ Am BA(10-66)Q(A)是所有以命题A为前提的命题的基本概率赋值函数之和。Q(A)可以理解为,在证据出现后,命题A作为前提(原因)的支持程度。基本概率赋值函数、信任函数
25、、似真函数与共性函数可以相互推导出来,它们包含的信息量是一样的。除了式(10-60)外,还有如下结果:第10章多分类器融合()(1)()A BBAm ABel BA (10-67)()(1)()BBABel AQ BA (10-68)()(1)()BBAQ ABel BA (10-69)第10章多分类器融合3.Dempster合成公式合成公式证据理论提供了一个有用的合成公式,它是反映证据的联合作用的一个规则,使人们能够合成多个证据源提供的证据。给定同一辨识框架上几个基于不同证据的信任函数Bel1,Bel2,Beln,如果这些证据相互独立,且不完全冲突,那么,可以利用Dempster合成公式计算
展开阅读全文