第5章-非线性判别函数分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第5章-非线性判别函数分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 非线性 判别函数 分析 课件
- 资源描述:
-
1、 模 式 识 别 徐蔚然北京邮电大学信息工程学院北京邮电大学信息工程学院非线性判别函数非线性判别函数n传统的模式识别技术,则侧重于使用分段线性判别函数 n人工神经元网络如多层感知器等网络能够实用非常复杂的非线性分类,以及非线性函数拟和,非线性映射等 n支持向量机则提出了一种基于特征映射的方法,也就是使用某种映射,使本来在原特征空间必须使用非线性分类技术才能解决的问题,映射到一个新的空间以后, 使线性分类技术能继续使用。 5.1非线性判别函数与分段线性判别函数线性辨别函数以下只讨论有关分段线性判别函数设计中的一些基本问题。 分段线性判别 二次函数判别 分段段数问题n分段段数问题 n分段段数过少
2、,分类效果必然要差 n但段数又要尽可能少,以免分类判别函数过于复杂,增加分类决策的计算量 n同一类样本可以用若干个子类来描述n合适的子类划分不知道,需要采用聚类方法分段线性判别函数的一般形式n分段线性判别函数的一般形式 表示第i类第l段线性判别函数 li为i类所具有的判别函数个数, 分别是第l段的权向量与阈值权。 分段线性判别函数的一般形式n相应的判别规则是:如果 其中 则决策 则称为第i类的判别函数。分类的决策面方程: 取决于相邻的决策域,如第i类的第n个子类与第j类的第m个子类相邻,则由它们共同决定的决策面方程为分段线性判别的主要问题n分段线性判别的主要问题n每一类的样本数据在特征空间中的
3、分布呈复杂修正时,使用线性判别函数就会产生很差的效果,n如果能将它们分割成子集,而每个子集在空间聚集成团,那么子集与子集的线性划分就可以取得比较好的效果。n因此分段线性判别的主要问题是如何对数据划分成子集的问题。 5.2 基于距离的分段线性判别函数n正态分布条件下,两类别问题在各特征统计独立、同方差、且先验概率相等情况下,最小错误率决策可按最小距离决策,即基于距离的分段线性判别函数n分段线性距离分类器原理n按距离分类的原理推广n把各类别样本特征向量的均值作为各类的代表点,n而样本的类别按它到各类别代表点的最小距离划分 n在这种判别函数中,决策面是两类别均值连线的垂直平分面基于距离的分段线性判别
4、函数基于距离的分段线性判别函数基于距离的分段线性判别函数n分段线性距离分类器原理n显然这种判别方法只有在各类别密集地分布在其均值附近时才有效。n对于上图所示情况,若企图再用每类一个均值代表点产生最小距离分类器,就会产生很明显的错误率。 n在这种情况下,可以将各类别划分成相对密集的子类,每个子类以它们的均值作为代表点,然后按最小距离分类 基于距离的分段线性判别函数n分段线性距离分类器原理n归纳起来,如果对于i有li个子类,则有li个代表点,或者说把属于i的决策域Ri分成li个子域,即n对每个子区域Ril均值用mil表示,并以此作为该子区域的代表点,n则判别函数定义为:n相应的判别规则是:如果 ,
5、则Xi 基于距离的分段线性判别函数 基于距离的分段线性判别函数n对样本进行子类的合适划分是分段线性距离分类器性能好坏的一个关键问题 5.3错误修正算法 n错误修正法是对感知准则函数的扩展 naiTy与ajTy相比较的含义:nai与aj代表两类增广权向量 ny则代表规范化的增广权向量 n一般来说点积值比较大则表示这两个向量在方向上比较一致,换句话说向量间的夹角较小。 错误修正算法n思路n如果某一类样本比较分散n能用若干个增广权向量表示n使同一类规范化增广样本向量能够做到与代表自己一类的增广权向量的点积的最大值比与其它类增广权向量的点积值要大n就可以做到正确分类。错误修正算法n思路n这种算法就是要
6、用错误提供的信息进行叠代修正n它对每类样本集进行具体划分n希望能知道每类所需的增广权向量数目n实际上,该数目也可以在计算过程中按分类效果调整错误修正算法的基本要点n当每类的子类数目已知时n可以采用假设初始权向量n然后由样本提供的错误率信息进行迭代修正,直至收敛n(1)对每个类别的子类赋予一初始增广权向量 ,其中括号中的数目表示迭代次数。 错误修正算法的基本要点n(2)然后对每次迭代所得增广权向量用样本去检测,如发生错误分类,则利用错误分类的信息进行修正。其做法是:na)先将某一j类的增广样本向量yj,与该类所有增广权向量aj-l(k)求内积aj-l(k)Tyj ,找到其中的最大值 aj-m(k
7、)Tyj aj-m(k)Tyj=max aj-l(k)Tyj错误修正算法的基本要点nb) 将该yj与其它类(如i类)的权向量求内积,并将这些内积值与作比较,若aj-m(k)Tyj ai-l(k)Tyj i=1,c, ij, l=1, ,li则表明权向量组,不影响yj的正确分类,因此不需要修改这些权向量错误修正算法的基本要点nb)但是如果存在某个或几个子类不满足上述条件,譬如某个子类的现有权向量使得aj-m(k)Tyj ai-n(k)Tyj ij这表明yj将错分类,而有关权向量需要修正错误修正算法的基本要点nc)此时首先找到导致yj错分类的所有权向量中具有与yj内积最大值的权向量ai-n(k)T
展开阅读全文