第八章-特征选择与特征提取课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章-特征选择与特征提取课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 特征 选择 提取 课件
- 资源描述:
-
1、模模式识别式识别Pattern Classification第八章第八章:特征选择与特征提取特征选择与特征提取.3引言引言特征是决定样本之间的相似性和分类器设计的关键如何找到合适的特征是模式识别的核心问题在实际问题中,常常不容易找到那些最重要的特征 或者受条件限制不能对它们进行测量,这使得特征选择和提取的任务复杂化 特征选择成为构造模式识别系统、提高决策精度的最困难的任务之一.4引言引言模式三大基本特征:物理、结构和数字特征物理和结构特征:易于为人的直觉感知,但有时难于定量描述,因而不易用于机器判别数字特征:易于用机器定量描述和判别,如基于统计的特征.5引言引言一般情况下普遍认为,增加特征向量
2、的维数(增加特征数)将有助于提高分类器的质量但实际应用中特征维数却收到多方面因素的约束和限制用较多的特征进行分类器设计,无论从计算的复杂程度还是就分类器性能来看都是不适宜的.6特征的形成特征形成特征形成(acquisition):信号采集信号采集原始测量原始测量原始特征原始特征实例实例数字图像中的各像素灰度值数字图像中的各像素灰度值人体的各种生理指标人体的各种生理指标语音的音调周期、共振峰、声道参数、频谱语音的音调周期、共振峰、声道参数、频谱.7特征的形成高维原始特征不利于分类器设计高维原始特征不利于分类器设计计算量大计算量大信息冗余信息冗余.8特征选择与提取分析原始特征的有效性,选出最有代表
3、性的特征是模式识别的关键一步降低特征维数在很多情况下是有效设计分类器的重要课题.9特征选择与提取两类获取有效特征信息、压缩特征空间的方法:特征提取和特征选择基本任务是如何从原始特征中获取最有效的信息.10特征选择与提取特征选择(selection)从原始特征中挑选出一些最有代表性,分类性能最好的特征特征提取(extraction)通过映射或变换的方法把高维的原始特征变换为低维的新特征,新的特征包含了原有特征的有用信息.11特征选择与提取目前,还没有特征选择和提取的一般方法,这是由于特征选择一般是面向问题的,很难对这些方法去作评价和比较 特征选择与提取是模式识别中重要而困难的一个环节.12特征选
4、择与提取细胞自动识别原始测量 正常或异常细胞的数字图像原始特征 找到一组代表细胞性质的特征:细胞面积,胞核面积,形状系数,光密度,核内纹理,和浆比 原始特征的维数仍很高,需压缩以便于分类!.13特征选择与提取细胞自动识别特征选择 挑选最有分类信息的特征特征提取 数学变换:傅立叶变换或小波变换、特征压缩.14特征选择特征选择特征选择的任务是从一组数量为D的特征中选择出数量为d(D d)的一组最优特征各个特征之间存在复杂的相互关系 如果仅对每个单独的特征按照一定的统计进行排队,取排在前面的d个特征 所得结果在大多数情况下不是最优特征组.15特征选择特征选择从D个特征中选择出d个最优的特征,在这两个
5、参数都已知的状况下,所有可能的组合数为如果D=100,d=10,则的Q数量级是1013.16特征选择特征选择在实际问题的研究过程当中,D的维数往往远远高于100例如,在利用生物芯片来进行药物设计和癌症诊断时,其产生的有效特征维数往往在10000左右实际需要选取的优化特征组的特征数量是未知的寻找可行的特征选择算法已逐渐成为国际上研究的热点.17特征选择特征选择一般来看,特征选择(确定优化的特征子集)需要两个主要步骤确定评价准则来评价所选择的特征子集的性能确定进行特征搜索所需要的策略.18特征选择特征选择按搜索策略划分的特征选择算法全局最优搜索策略 “分支定界”算法:该方法能保证在事先确定优化特征
6、子集中特征数目的情况下,找到相对于所设计的可分性判据而言的最优特征子集。如何事先确定优化特征子集当中特征的数目?当处理高维度多类问题时,算法运算效率低下.19特征选择特征选择按搜索策略划分的特征选择算法随机搜索策略 将特征选择视为组合优化问题,采用非全局最优搜索方法 把特征选择问题和模拟退火算法、禁忌搜索算法、遗传算法、或随机重采样过程结合,以概率推理和采样过程作为算法基础 遗传算法在这一领域的应用最为广泛.20特征选择特征选择按搜索策略划分的特征选择算法启发式搜索策略 单独最优特征组合算法 序列前向选择算法 序列后向选择算法 浮动搜索算法.21特征选择特征选择特征选择的原则选择反映模式本质特
展开阅读全文