模式识别课件(第六章-NO1)(最近邻法).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模式识别课件(第六章-NO1)(最近邻法).ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 课件 第六 NO1 近邻
- 资源描述:
-
1、第六第六章章 近邻法近邻法6.1 最近邻法最近邻法一一.最近邻法的基本思想最近邻法的基本思想此法是一种根据全部样本全部样本提供的信息,绕开概率的估计而直接决策的方法,所以它是非参数决策方法是非参数决策方法的一种。其基本思想基本思想是:设有一组N个样本 =X1,X2,XN其中每个样本都已标以类别标志。如果在这N个样本中与待分样本X相距最近相距最近的一个样本为Xi,则把X分到Xi所在的类别中去。二二.最近邻法的决策规则最近邻法的决策规则设有c类模式样本,1,2,c每类有Ni个样本(i=1,2,c),则最近邻法的最近邻法的(i类类)判别判别函数为函数为:式中 表示i类中的第k个样本。kiX)N,1,
2、2,.(k min)(ikikiXXXg 对应的决策规则为:对应的决策规则为:如果如果 则决策则决策 即只要将待分样本X与全部与全部N()个已知类别的样本进行欧氏距离欧氏距离之间的比较,然后将X归到离它最近的类别中归到离它最近的类别中。由于这种方法只根据离待分样本X最近的一个样本的类别而决定其类别,所以通常称为1-最近邻法最近邻法(亦称1-NN方法方法)iXciiN1c),1,2,.(j )(gmin)(jXXgji三三.最近邻法的错误率问题最近邻法的错误率问题最近邻法是一种次优次优方法,它的错误率错误率比最小错误概率最小错误概率的的Bayes决策规则决策规则下的错误率要大要大,但是,当样本数
3、目无限无限时,它的错误率不会超过Bayes错误率的一倍一倍。定性分析:定性分析:若将X的最近邻Xj的类别看成是一个随机变量随机变量 ,于是 的概率就是后验概率 .当样本数目很多样本数目很多时,可以认为X的最近邻Xj 离它很近离它很近,从而近似的近似的认为j)(jjXPjj)()(XPXPjjj这时最近邻法可看成是如下的随机化决策如下的随机化决策:按照概率按照概率 来决定来决定X的类别的类别。故最近邻法可看成是用后验概率后验概率来对X进行分类的。再进一步说,就是如果有下式成立如果有下式成立:则依Bayes决策,应取 作为X的类别。而在最近邻法最近邻法中,最近邻的类别为 的概率为 ,所以X分到分到
4、 类去的概率为 ,而不分到不分到 类去的概率为:)(XPi)(XPj)(max)(XPXPjjiii)(XPii)(1XPii这也就是说:这也就是说:按Bayes决策决策的话:以概率为1,而得决策 按最近邻法决策最近邻法决策的话:以概率为,而得决策 显然,当接近于当接近于1时,最近邻法与最小错误率下的Bayes法的结果结果就几乎相同几乎相同了。也就是说,当最小错误概率较小时,最近邻法的错误概率也是较小的,这两种方法同样同样“好好”。而当各类的都接近于当各类的都接近于 时时(即所有类别是等可能的),最近邻法与Bayes法的结果就不一样了。这时两者的错两者的错误率都接近于误率都接近于iX)(XPi
5、iX)(XPi)(XPic1c11 定量描述:定量描述:式中:p为最近邻法的渐近平均错误率 为 Bayes错误率 c 为类别数 一般较小 )12(PccPPPPP PPP2 6.2 k-近邻法近邻法(k-NN法法)为了克服单个样本类别的偶然性偶然性以增加分类的可靠性可靠性,可将最近邻法则最近邻法则进行改进,一个简单的方法就是k-近邻法近邻法。此法就是考察待分样本考察待分样本X的的k个最近邻样本个最近邻样本,这这k个最近邻个最近邻元素中元素中哪一类哪一类的样本最多的样本最多,就将X判属哪一类。或者说,就是在在N个已知类别个已知类别的样本中,找出的样本中,找出X的的k个近邻个近邻,这,这k个近邻中
展开阅读全文