第三章-线性判别分析非参数判别分类方法第四次课课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三章-线性判别分析非参数判别分类方法第四次课课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 线性 判别分析 参数 判别 分类 方法 第四 课件
- 资源描述:
-
1、第3章线性判别分析第三章第三章 线性判别分析线性判别分析 非参数判别分类方法非参数判别分类方法第3章线性判别分析本章内容本章内容3.1线性判别函数线性判别函数3.2线性分类器线性分类器 Fisher线性判决线性判决 感知准则函数感知准则函数 3.3分段线性分类器分段线性分类器3.4近邻分类器近邻分类器总结总结习题习题第3章线性判别分析3.2.2Fisher线性判决线性判决u Fisher线性判决的基本思想线性判决的基本思想是寻找一个最好的投影方向是寻找一个最好的投影方向, 当特征向量当特征向量x从从d维空间映射到维空间映射到这个方向上时这个方向上时, 两类能最好地两类能最好地分开。分开。u 这
2、个方法实际上涉及这个方法实际上涉及特征维特征维数的压缩数的压缩问题。问题。3.2线线 性性 分分 类类 器器第3章线性判别分析分析分析w1方向之所以比方向之所以比w2方向优方向优越越, 可以归纳出这样一个准则:可以归纳出这样一个准则:即向即向量量w的方向选择应能使两类样本投的方向选择应能使两类样本投影的均值之差尽可能大些影的均值之差尽可能大些, 而使类内而使类内样本的离散程度尽可能小样本的离散程度尽可能小。这就是。这就是Fisher准则函数的基本思路。准则函数的基本思路。第3章线性判别分析第一步:计算参量。第一步:计算参量。(1) 各类样本的均值向量各类样本的均值向量i: 1 (1,2)iii
3、iNxx(2) 样本类内离散度矩阵样本类内离散度矩阵Si:()() (1,2)iTiiiixSxx12wSSS总类内离散度矩阵总类内离散度矩阵Sw: *112()wwS第二步:计算最优投影方向,第二步:计算最优投影方向,并将样本往该方向上投影并将样本往该方向上投影。 xwTy)(*第三步:决策。第三步:决策。在投影空间内的决策准则为在投影空间内的决策准则为: 若若yy0, 则则x1, 否则否则x2。Fisher线性判决步骤线性判决步骤第3章线性判别分析n采用类似于人认知错误、纠正错误、通过自学习改善自采用类似于人认知错误、纠正错误、通过自学习改善自己认识事物本领的过程,己认识事物本领的过程,随
4、意确定判别函数初始值,该随意确定判别函数初始值,该值在对样本分类训练过程中逐步修正直至最终确定。值在对样本分类训练过程中逐步修正直至最终确定。n 基本思想基本思想:寻找一个权向量,使规范化增广样本向量集:寻找一个权向量,使规范化增广样本向量集的错分类样本数最少。的错分类样本数最少。 3.2.3 感知准则函数感知准则函数 第3章线性判别分析一、基本概念一、基本概念1.1.线性可分性线性可分性 已知来自已知来自1和和2两类的样本集两类的样本集x1, x2, , xN, 两类的两类的线线性性判决函数为判决函数为yi为增广样本向量为增广样本向量, v为增广权向量为增广权向量。()Tiig yv y线性
5、可分:线性可分:如果存在一个线性分类器能把每个样本正确分类如果存在一个线性分类器能把每个样本正确分类, 即若即若存在一个权向量存在一个权向量v, 使得对于任何使得对于任何yi1, 都有都有vTyi0, 而对而对于任何于任何yi2, 都有都有vTyi0。规范化规范化增广样本向量增广样本向量21iiiiiyyyyz 经过这样的变换后经过这样的变换后, 我们可以不考虑样本原来的类别标我们可以不考虑样本原来的类别标志志, 只要找到一个对全部样本只要找到一个对全部样本zi都满足都满足vTzi0(i=1, 2, , N)的的权向量即可。权向量即可。 样本的规范化样本的规范化第3章线性判别分析3. 解向量和
6、解区解向量和解区满足满足vTzi0(i=1, 2, , N)的的权向量称为解向量权向量称为解向量。 若把若把v看成是权向量空间中看成是权向量空间中的一点的一点, 对于任一对于任一zi, vTzi=0在权向在权向量空间确定了一个超平面量空间确定了一个超平面, 这个这个超平面把权空间分为两个半空间超平面把权空间分为两个半空间, 该超平面的法向量为该超平面的法向量为zi , 超平面超平面正侧的向量满足正侧的向量满足vTzi0。第3章线性判别分析 相应地相应地, N个样本确定了个样本确定了N个超平面个超平面, 每个超平面把每个超平面把权空间分为两个半空间。所以权空间分为两个半空间。所以, 满足满足vT
7、zi0(i=1, 2, , N)的的权向量必在这权向量必在这N个超平面正侧的交叠区个超平面正侧的交叠区, 称这一交叠区为称这一交叠区为解区解区, 解区中的任意向量都是解区中的任意向量都是解向量解向量v*。第3章线性判别分析二、感知准则函数二、感知准则函数感知准则函数方法感知准则函数方法利用错分类对现决策权向量进行修正直至收利用错分类对现决策权向量进行修正直至收敛敛。这种方法只对。这种方法只对线性可分情况适用线性可分情况适用,并且只适用于,并且只适用于两类判决两类判决。感知准则函数方法的思路感知准则函数方法的思路是:先随意找一个初始向量是:先随意找一个初始向量v,写作,写作v(0),然后用训练样
8、本集中的每个样本来计算。一旦发现有的,然后用训练样本集中的每个样本来计算。一旦发现有的zi,使,使vTzi0, 则引入余量后的解区在原解区之内。则引入余量后的解区在原解区之内。 将上式写将上式写成矩阵形式即为成矩阵形式即为 0 ( 1,2,)Tiiz vbiNZ vb 12TTTNzzZz12Nbbbb第3章线性判别分析定义误差向量定义误差向量: eZ vb 定义定义平方误差准则函数平方误差准则函数: 221( )()NTsiiiJvev zbJs(v)是一个是一个非负函数非负函数, 当当 有解时有解时, Js(v)达到最小值达到最小值0, 此时的矢量此时的矢量v*满足满足: Z vb * (
9、)0 (1,2,)TiivzbiNv*能将所有样本正确分类。能将所有样本正确分类。 若若v*不能使某个样本不能使某个样本zj正确分类正确分类, 即即(v*)Tzjbj, 则则e2j=(vTzjbj)2。 错分样本的结果是使错分样本的结果是使Js(v)增大增大, 因此因此, Js(v)越小越好越小越好, 其其最小值最小值0为理想分类结果为理想分类结果, 实现所有样本的正确分类。实现所有样本的正确分类。 求使求使Js(v)最小的最小的v*有两种方法有两种方法: 梯度下降法和解析法。梯度下降法和解析法。 第3章线性判别分析1. 1. 梯度下降法梯度下降法对对Js( (v) )求梯度求梯度( )2()
10、TsJvZZvb(3-78)(3-78)相应地相应地, ,梯度下降算法为梯度下降算法为 (1)( )( )Tkv kv kZZv kb其中,其中,k为为学习速率学习速率; ; 初值初值v(0)(0)可任意选取。可任意选取。 第3章线性判别分析2. 解析法解析法解析法得到的是伪逆解。解析法得到的是伪逆解。 令令Js(v)=0得得*TTZ ZvZ b(3-79)其中其中*1()TTvZ ZZ bZ b(3-80)ZTZ为为(d+1)(d+1)方阵方阵, 一般是满秩的一般是满秩的, 因此有唯一解因此有唯一解: -1()TTZZ ZZ(3-81)是是Z的左逆矩阵的左逆矩阵, Z的右逆矩阵定义为的右逆矩
11、阵定义为 1()TZZ Z Z(3-82)b的典型值为的典型值为 (1,1,1)Tb 第3章线性判别分析3.3 分段线性分类器分段线性分类器 线性分类器的分界面是一个超平面线性分类器的分界面是一个超平面。当类与类之间。当类与类之间不能用任何一个超平面实现划分时不能用任何一个超平面实现划分时, 类间的分界面应是类间的分界面应是一个超曲面。曲线可以由多个线段近似表达一个超曲面。曲线可以由多个线段近似表达, 曲面可以曲面可以由多个平面逼近由多个平面逼近, 因此因此, 可以可以用多个超平面近似表达超用多个超平面近似表达超曲面曲面, 分段线性分类器正是基于这种思路而设计的一种分段线性分类器正是基于这种思
12、路而设计的一种分类器。分类器。 第3章线性判别分析u线性判决函数只能解决线线性判决函数只能解决线性可分问题。性可分问题。u在线性不可分的情况下,在线性不可分的情况下,可以采用可以采用分段线性判别分段线性判别或或二次函数判别二次函数判别等方法等方法。u分段线性判决函数确定的分段线性判决函数确定的决策面是由决策面是由若干段超平面若干段超平面组成的。组成的。3.3.1 分段线性分类器的定义分段线性分类器的定义第3章线性判别分析 与线性判别函数相比,分段线性判别函数设计中与线性判别函数相比,分段线性判别函数设计中首先首先要解决的问题是分段线性判别函数的要解决的问题是分段线性判别函数的分段段数分段段数问
13、题。问题。u分段段数过少,其分类效果必然要差;但段数又要尽分段段数过少,其分类效果必然要差;但段数又要尽可能少,以免分类判别函数过于复杂,增加分类决策可能少,以免分类判别函数过于复杂,增加分类决策的计算量。的计算量。u在有些实际的分类问题中,同一类样本可以用若干个在有些实际的分类问题中,同一类样本可以用若干个子类来描述,这些子类来描述,这些子类的数目子类的数目就可作为确定分段段数就可作为确定分段段数的依据。的依据。u在有些情况下样本分布及合适子类划分并不知道,往在有些情况下样本分布及合适子类划分并不知道,往往需要采用一种往需要采用一种聚类的方法聚类的方法,设法将样本划分成相对,设法将样本划分成
14、相对密集的子类,然后用各种方法设计各段判别函数。密集的子类,然后用各种方法设计各段判别函数。第3章线性判别分析把属于类把属于类i的样本区域的样本区域Ri分为分为li个两两不相交的子区个两两不相交的子区, 对每对每个子类定义一个线性判决函数个子类定义一个线性判决函数: 0( )() (1,2, 1,2,)llTliiiigxxwllimw定义类定义类i的的判别函数判别函数: 1,2, ,( )max( ) (1,2, )iliillg xg xim判决准则为判决准则为 若若 ,则,则xj ( )max( )jiigxg x称称gi(x)(i=1, 2, , m)为分段线性判决函数为分段线性判决函
15、数, 相应的分类器称为相应的分类器称为分段线性分类器。分段线性分类器。第3章线性判别分析当类由多个子类构成时当类由多个子类构成时, 其决策面方程是由各子其决策面方程是由各子类的判决函数确定的类的判决函数确定的, 若第若第i类的第类的第n个子类和第个子类和第j类的类的第第k个子类相邻个子类相邻, 则该段决策面方程为则该段决策面方程为 ( )( )nkijgxgx其中其中, n1, 2, , li, k1, 2, , lj, li和和lj分别表示分别表示第第i类和第类和第j类的子类数目。类的子类数目。 第3章线性判别分析3.3.2 分段线性距离分类器分段线性距离分类器 正态分布条件下,两类别问题在
16、各特征统计独立、同方差、正态分布条件下,两类别问题在各特征统计独立、同方差、且先验概率相等情况下,最小错误率决策可按最小距离决策,且先验概率相等情况下,最小错误率决策可按最小距离决策,最小距离分类器的最小距离分类器的判决函数判决函数为为即即这时这时类间的决策面类间的决策面为为 2212-xx它是它是两类均值点连线的垂直平分面两类均值点连线的垂直平分面。 221122xxx 2211220 xxx 第3章线性判别分析 显然最小距离判别方法只有在显然最小距离判别方法只有在各类别密集地分布在其均各类别密集地分布在其均值附近值附近时才有效。时才有效。最小距离分类器最小距离分类器两类物体在特征空间的分布
17、两类物体在特征空间的分布n 对右图所示的情况按最小距离计算,就会将原来对右图所示的情况按最小距离计算,就会将原来类的类的x决策成决策成2类,如不对类,如不对类进行子类划分,或采用别的决策就类进行子类划分,或采用别的决策就不会取得好的效果。不会取得好的效果。第3章线性判别分析u右图所示情况,若企图再用右图所示情况,若企图再用每类一个均值代表点产生最每类一个均值代表点产生最小距离分类器,就会产生很小距离分类器,就会产生很明显的错误率。明显的错误率。u在这种情况下,可以将各类在这种情况下,可以将各类别划分成相对密集的子类,别划分成相对密集的子类,每个子类以它们的均值作为每个子类以它们的均值作为代表点
18、,代表点,然后按最小距离分然后按最小距离分类,可以有比较满意的效果。类,可以有比较满意的效果。u 对样本进行对样本进行子类的合适划子类的合适划分分是分段线性距离分类器性是分段线性距离分类器性能好坏的一个关键问题。能好坏的一个关键问题。分段线性距离分类器示意图分段线性距离分类器示意图第3章线性判别分析归纳起来,如果对于归纳起来,如果对于i有有li个子类,则有个子类,则有li个代表点,或者个代表点,或者说将类说将类i的样本区域的样本区域Ri分为分为li个子区个子区: 12iliiiiRRRR其中其中, 1212, jjiiRRjj。用用mli表示表示Rli中的均值向量中的均值向量, 并以此作为该子
19、区的代表并以此作为该子区的代表点点, 确定确定判别函数判别函数: 1,2,( )miniliillg xxm则则判决准则判决准则为为 若若1,2,( )min( )jiimgxgx, 则则xj 称这种分类器为称这种分类器为分段线性距离分类器分段线性距离分类器。 第3章线性判别分析注意:注意: 线性距离分类器使用的是马氏距离线性距离分类器使用的是马氏距离, 分段分段线性距离分类器使用的则是欧几里德距离线性距离分类器使用的则是欧几里德距离, 由最小距由最小距离分类器的导出过程可知离分类器的导出过程可知, 仅当所有子区的协方差阵仅当所有子区的协方差阵相同且等于相同且等于2I时时, 才具有较好的分类效
20、果。才具有较好的分类效果。 第3章线性判别分析 设计分段线性分类器的前提条件是有一组已知类别的设计分段线性分类器的前提条件是有一组已知类别的样本集样本集, 其关键在于解决以下两个问题其关键在于解决以下两个问题: (1) 根据样本集根据样本集确定子类数目及各子类的划分确定子类数目及各子类的划分; (2) 利用样本集利用样本集计算各子类判别函数的权向量和阈值权。计算各子类判别函数的权向量和阈值权。 根据已知条件的不同根据已知条件的不同, 可以分别采取不同的方法。可以分别采取不同的方法。3.3.3 分段线性分类器设计的一般考虑分段线性分类器设计的一般考虑 (1)子类数目及各子类划分已知;子类数目及各
21、子类划分已知;(2)子类数目已知子类数目已知, 各子类划分不知;各子类划分不知;(3)子类数目未知。子类数目未知。第3章线性判别分析u最初的近邻法是由最初的近邻法是由Cover和和Hart于于1968年提出的,是非参年提出的,是非参数法中最重要的方法之一。数法中最重要的方法之一。 u最小距离分类器将各类训练样本划分成若干子类,并在每最小距离分类器将各类训练样本划分成若干子类,并在每个子类中确定代表点,一般用子类的均值或邻近均值的某个子类中确定代表点,一般用子类的均值或邻近均值的某一样本为代表点。一样本为代表点。实质就是将样本判属于与代表点距离最实质就是将样本判属于与代表点距离最近的类。近的类。
22、u该法的该法的缺点缺点是所选择的代表点并不一定能很好地代表各类,是所选择的代表点并不一定能很好地代表各类,其后果将使错误率增加。其后果将使错误率增加。3.4 近邻分类器近邻分类器第3章线性判别分析3.5.1 最近邻法最近邻法一、最近邻法的原理及判决准则一、最近邻法的原理及判决准则u近邻法的基本思想近邻法的基本思想:以全部训练样本作为:以全部训练样本作为“代表代表点点”,计算测试样本与这些,计算测试样本与这些“代表点代表点”,即所有,即所有样本的距离,并以最近邻者的类别作为决策。样本的距离,并以最近邻者的类别作为决策。u其主要特点就是将样本判属它的最近邻(和它距其主要特点就是将样本判属它的最近邻
23、(和它距离最近的代表点)所在的类。离最近的代表点)所在的类。第3章线性判别分析 假定有假定有m个类别个类别1, 2, , m的模式识别问的模式识别问题题, 每类有每类有Ni(i=1, 2, , m)个样本个样本, 规定类规定类i的的判判别函数别函数为为( )min 1,2,kiiiig xxxkN其中其中, 表示第表示第i类的第类的第k个元素。个元素。 kix判决准则判决准则: 若若1,2,( )min( )jiimgxg x,则,则xj 第3章线性判别分析第3章线性判别分析二、错误率分析二、错误率分析u最近邻法的错误概率最近邻法的错误概率比最小错误概率判决准则的错误概比最小错误概率判决准则的
24、错误概率要大,但是当样本数目无限时,它的错误概率率要大,但是当样本数目无限时,它的错误概率不会超不会超过后者的错误概率的一倍过后者的错误概率的一倍。u假设近邻分类器的渐近平均错误概率为假设近邻分类器的渐近平均错误概率为P, , 最小错误概最小错误概率判决准则的错误概率为率判决准则的错误概率为P*e , , 那么它们之间存在如下关那么它们之间存在如下关系系: : )12(*eeePmmPPP其中其中m为类别数为类别数, )(limePPNNPN(e)是当样本数为是当样本数为N 时近邻分类器的平均错误概率。时近邻分类器的平均错误概率。第3章线性判别分析图中曲线与直线分别图中曲线与直线分别是近邻法分
展开阅读全文