模式识别详细课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模式识别详细课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 详细 课件
- 资源描述:
-
1、1 课程对象课程对象 相关学科相关学科 教学方法教学方法 教学目标教学目标 基本要求基本要求 教材教材/参考文献参考文献关于本课程的有关说明2 课程对象信息工程专业本科生的专业课信息工程专业本科生的专业课学院硕士研究生的学位课学院硕士研究生的学位课 学院博士研究生的必修课之一学院博士研究生的必修课之一3 相关学科统计学统计学概率论概率论线性代数(矩阵计算)线性代数(矩阵计算)形式语言形式语言人工智能人工智能图像处理图像处理计算机视觉计算机视觉 等等等等4 教学方法着重讲述模式识别的基本概念,基本着重讲述模式识别的基本概念,基本方法和算法原理。方法和算法原理。注重理论与实践紧密结合注重理论与实践
2、紧密结合 实例教学:通过实例讲述如何将所学实例教学:通过实例讲述如何将所学知识运用到实际应用之中知识运用到实际应用之中避免引用过多的、繁琐的数学推导避免引用过多的、繁琐的数学推导5 教学目标掌握模式识别的基本概念和方法掌握模式识别的基本概念和方法有效地运用所学知识和方法解决实际问题有效地运用所学知识和方法解决实际问题为研究新的模式识别的理论和方法打下基础为研究新的模式识别的理论和方法打下基础 6 基本要求基本基本:完成课程学习,通过考试,获得学分。:完成课程学习,通过考试,获得学分。提高提高:能够将所学知识和内容用于课题研究,:能够将所学知识和内容用于课题研究,解决实际问题。解决实际问题。飞跃
3、:飞跃:通过模式识别的学习,改进思维方式,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。为将来的工作打好基础,终身受益。7教材教材/参考文献参考文献孙即祥,现代模式识别,国防科技大学孙即祥,现代模式识别,国防科技大学出版社,出版社,20032003年。年。吴逸飞译,模式识别原理、方法及应吴逸飞译,模式识别原理、方法及应用,清华大学出版社,用,清华大学出版社,20032003年。年。李晶皎等译,模式识别(第三版),电李晶皎等译,模式识别(第三版),电子工业出版社,子工业出版社,20062006年。年。8讲授课程内容及安排第一章第一章 引论引论 第二章第二章 聚类分析聚类分析第
4、三章第三章 判别域代数界面方程法判别域代数界面方程法 第四章第四章 统计判决统计判决 第五章第五章 学习、训练与错误率估计学习、训练与错误率估计 第六章第六章 最近邻方法最近邻方法第七章第七章 特征提取和选择特征提取和选择 上机实习上机实习9第一章 引论1.1 1.1 概述概述1.2 1.2 特征矢量和特征空间特征矢量和特征空间1.3 1.3 随机矢量的描述随机矢量的描述1.4 1.4 正态分布正态分布10概念概念n模式识别模式识别(Pattern Recognition)(Pattern Recognition):确定一个确定一个样本的类别属性(模式类)的过程,即把某一样本的类别属性(模式类
5、)的过程,即把某一样本归属于多个类型中的某个类型。样本归属于多个类型中的某个类型。n样本(样本(Sample)Sample):一个具体的研究(客观)对象。一个具体的研究(客观)对象。如患者,某人写的一个汉字,一幅图片等。如患者,某人写的一个汉字,一幅图片等。n模式模式(Pattern)(Pattern):对客体(研究对象)特征的对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。界的某一样本的测量值的集合(或综合)。11x),(21nxxxxn特征特征(Features)(Features):能描述模式特
6、性的量(测能描述模式特性的量(测量值)。在统计模式识别方法中,通常用一量值)。在统计模式识别方法中,通常用一个矢量个矢量 表示,称之为特征矢量,记为表示,称之为特征矢量,记为 n模式类模式类(Class)(Class):具有某些共同特性的模式具有某些共同特性的模式的集合。的集合。概念概念12要对这些动物进行分类,则不同的特征有不同的分法:有效地运用所学知识和方法解决实际问题次序量-(等级、技能、学识)的损失函数,各种判决的平均损失4、停止回溯再向下搜索d32(x)0设两类样本的类内离差矩阵分别为:由于 是标量,于是有:因为d3(x3)=-2d1(x3)=0,d3(x3)=d2(x3)=0,错分
7、,第五章 统计决策中的训练、学习 与错误率测试、估计以上工作都应该在预处理阶段完成。在信息论中,熵(Entropy)表示不确定性,熵越大不确定性越大。(4)后验概率的最大值的类别(09)就是手写数字的所属类别。提高:能够将所学知识和内容用于课题研究,解决实际问题。例:已知有20个样本,每个样本有2个特征,数据分布如下图,使用C均值法实现样本分类(C=2)。式中 表示括号中事件同时发生的概率。(2)适用于非线性和线性可分的情况解:图形结构复杂,首先应分解为简单的子图(背景、物体)。d3(x)=-2x1-2基于类的概率密度函数的可分性判据模式识别的例子模式识别的例子计算机自动诊断疾病计算机自动诊断
8、疾病:获取情况获取情况(信息采集信息采集)测量体温、血压、心率、测量体温、血压、心率、血液化验、血液化验、X X光透射、光透射、B B超、心电图、超、心电图、CTCT等尽可等尽可能多的信息,并将这些信息数字化后输入电脑。能多的信息,并将这些信息数字化后输入电脑。当然在实际应用中要考虑采集的成本,这就是当然在实际应用中要考虑采集的成本,这就是说说特征要进行选择特征要进行选择的。的。运行在电脑中的运行在电脑中的专家系统专家系统或专用程序可以分析或专用程序可以分析这些数据并进行这些数据并进行分类分类,得出正常或不正常的判,得出正常或不正常的判断,不正常情况还要指出是什么问题。断,不正常情况还要指出是
9、什么问题。13对象空间对象空间模式空间模式空间特征空间特征空间类型空间类型空间各类空间(各类空间(Space)Space)的概念的概念模式采集:模式采集:从客观世界(对象从客观世界(对象空间)到模式空间的过程称为空间)到模式空间的过程称为模式采集。模式采集。特征提取和特征选择:特征提取和特征选择:由模式由模式空间到特征空间的变换和选择。空间到特征空间的变换和选择。类型判别:类型判别:特征空间到类型空特征空间到类型空间所作的操作。间所作的操作。模模式式识识别别三三大大任任务务141.1 概述模式识别系统数据采集数据采集特征提取特征提取二次特征二次特征提取与选择提取与选择分类分类识别识别待识待识对
10、象对象识别结果识别结果通常在采集信息过程中,还要去除所获取信息通常在采集信息过程中,还要去除所获取信息中的噪声,增强有用的信息等工作。这种使信息中的噪声,增强有用的信息等工作。这种使信息纯化的处理过程叫做信息的纯化的处理过程叫做信息的预处理预处理。分类识别是根据事先确定的分类识别是根据事先确定的分类规则分类规则对前面选对前面选取的特征进行取的特征进行分类分类(即识别)。(即识别)。通常能描述对象的元素很多,为节约资源和提通常能描述对象的元素很多,为节约资源和提高处理速度,有时更为了可行性,在满足分类识高处理速度,有时更为了可行性,在满足分类识别正确率要求的条件下,按某种准则尽量选用对别正确率要
11、求的条件下,按某种准则尽量选用对正确分类识别作用较大的特征。使得用较少的特正确分类识别作用较大的特征。使得用较少的特征就能完成分类识别任务。征就能完成分类识别任务。预处理预处理这个环节的内容很广泛,与要解决的具这个环节的内容很广泛,与要解决的具体问题有关,例如,从体问题有关,例如,从图象图象中将中将汽车车牌汽车车牌的号码的号码识别识别出来,就需要先将出来,就需要先将车牌车牌从从图像图像中找出来,再中找出来,再对对车牌车牌进行进行划分划分,将每个,将每个数字数字分别分别划分划分开。做到开。做到这一步以后,才能对每个这一步以后,才能对每个数字数字进行进行识别识别。以上工。以上工作都应该在预处理阶段
12、完成。作都应该在预处理阶段完成。数字化数字化比特流比特流151.1 概述模式识别系统数据采集数据采集特征提取特征提取二次特征二次特征提取与选择提取与选择分类分类识别识别待识待识对象对象识别结果识别结果数据采集数据采集特征提取特征提取改进分类改进分类识别规则识别规则二次特征提二次特征提取与选择取与选择训练训练样本样本改进采集改进采集提取方法提取方法改进特征提改进特征提取与选择取与选择制定改进分制定改进分类识别规则类识别规则人工人工干预干预正确率正确率测试测试161.1 概述模式识别系统模式识别系统的主要环节:模式识别系统的主要环节:特征提取:特征提取:符号表示,如长度、波形、。符号表示,如长度、
13、波形、。特征选择:特征选择:选择有代表性的特征,能够正确分类选择有代表性的特征,能够正确分类学习和训练:学习和训练:利用已知样本建立分类和识别规则利用已知样本建立分类和识别规则分类识别:分类识别:对所获得样本按建立的分类规则进行对所获得样本按建立的分类规则进行分类识别分类识别17纸币识别器对纸币按面额进行分类纸币识别器对纸币按面额进行分类 面额面额1.1 概述系统实例5元10元20元50元100元181.1 概述系统实例 长度长度(mm)(mm)宽度宽度(mm)(mm)5 5元元13613663631010元元14114170702020元元14614670705050元元1511517070
14、100100元元1561567777191.1 概述系统实例磁性磁性金属条位置金属条位置(大约大约)5 5元元有有 54/8254/821010元元有有 54/8754/872020元元有有 57/8957/895050元元有有 60/9160/91100100元元有有 63/9363/93205元 10元 20元 50元 100元12345678反反射射光光波波形形211.1 概述系统实例数据采集、特征提取:数据采集、特征提取:长度、宽度、磁性、磁性的位置,光反射亮度、光长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等等透射亮度等等 特征选择:特征选择:长度、磁性及位置、反射亮度长度、
15、磁性及位置、反射亮度分类识别:分类识别:确定纸币的面额及真伪确定纸币的面额及真伪221.1 概述系统实例训练集:训练集:是一个已知样本集,在监督学习方法是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。中,用它来开发出模式分类器。测试集:测试集:在设计识别和分类系统时没有用过的在设计识别和分类系统时没有用过的独立样本集。独立样本集。系统评价原则:系统评价原则:为了更好地对模式识别系统性为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。试集对系统进行测试。23要对这些动物进行分类,则不同的特征有不同的分法:如果
16、训练模式是线性可分的,则存在权矢量 使不等式组构成一个多级树结构:为表述简洁,虽然某些模式已选做聚类中心,但上面仍将所有模式下角标全部列写出来,因这并不影响算法的正确性。这类算法运行中模式的类别及类的中心一旦确定将不会改变。计算J(y1)与J(y2):第七章 特征提取与选择f(s)=-asb1-s(ln a-ln b)2 0 (ab)针对具体问题确定相似性阈值,将模式到各聚类中心间的距离与阈值比较,当大于阈值时该模式就作为另一类的类心,小于阈值时按最小距离原则将其分划到某一类中。权空间、解矢量与解空间1、按最小距离原则简单聚类方法求矩阵的广义逆计算量较大,引入的误差也可能很大,在实际中多采用下
17、面的梯度法。基于类的概率密度函数的可分性判据模糊集合 A=(a,a),(b,b),.该方法也称为顺序后退法(SBS)。试用K-L变换做一维特征提取。ISODATA算法举例即 等于 的整数部分;(1)最佳的bi可通过 求得多类问题图例(第一种情况)例:汽车车牌识别n从摄像头获取包含车牌的彩色图象从摄像头获取包含车牌的彩色图象n车牌定位和获取车牌定位和获取n字符分割和识别字符分割和识别输入图象输入图象特征提取特征提取粗略定位粗略定位分割字符分割字符确定类型确定类型精细定位精细定位识别、输出识别、输出2425261.1 概述模式识别的基本方法一、统计模式识别一、统计模式识别二、句法模式识别二、句法模
18、式识别三、模糊模式识别三、模糊模式识别四、人工神经网络法四、人工神经网络法五、人工智能方法五、人工智能方法271.1 概述模式识别的基本方法一、统计模式识别一、统计模式识别模式描述方法:模式描述方法:特征向量特征向量 模式判定:模式判定:模式类用条件概率分布模式类用条件概率分布P(X/P(X/i i)表示表示,m,m类就有类就有m m个分布,然后判定未知模式属于哪一个分布。个分布,然后判定未知模式属于哪一个分布。),(21nxxxx281.1 概述模式识别的基本方法一、统计模式识别一、统计模式识别理论基础:理论基础:概率论,数理统计概率论,数理统计主要方法:主要方法:线性、非线性分类、线性、非
19、线性分类、BayesBayes决策、聚类分析决策、聚类分析主要优点:主要优点:1 1)比较成熟)比较成熟 2 2)能考虑干扰噪声等影响)能考虑干扰噪声等影响 3 3)识别模式基元能力强)识别模式基元能力强主要缺点:主要缺点:1 1)对结构复杂的模式抽取特征困难)对结构复杂的模式抽取特征困难2 2)不能反映模式的结构特征,难以描述模式的性质)不能反映模式的结构特征,难以描述模式的性质3 3)难以从整体角度考虑识别问题)难以从整体角度考虑识别问题291.1 概述模式识别的基本方法二、句法模式识别二、句法模式识别模式描述方法:模式描述方法:符号串,树,图符号串,树,图模式判定:模式判定:是一种语言,
20、用一个文法表示一个类,是一种语言,用一个文法表示一个类,m m类就类就有有m m个文法,然后判定未知模式遵循哪一个文法。个文法,然后判定未知模式遵循哪一个文法。30例例2 2:如下图中一幅图形,要识别图中的物体,:如下图中一幅图形,要识别图中的物体,选用句法模式识别方法选用句法模式识别方法.1.1 概述模式识别的基本方法31解:解:图形结构复杂,首先应分解为简单的子图图形结构复杂,首先应分解为简单的子图(背景、物体)。(背景、物体)。构成一个多级树结构:构成一个多级树结构:1.1 概述模式识别的基本方法32n在学习过程中,确定基元与基元之间的在学习过程中,确定基元与基元之间的关系,推断出生成景
21、物的方法。关系,推断出生成景物的方法。n判决过程中,首先提取基元,识别基元判决过程中,首先提取基元,识别基元之间的连接关系,使用推断的文法规则之间的连接关系,使用推断的文法规则做句法分析。若分析成立,则判断输入做句法分析。若分析成立,则判断输入的景物属于相应的类型。的景物属于相应的类型。1.1 概述模式识别的基本方法33理论基础:理论基础:形式语言,自动机技术形式语言,自动机技术主要方法:主要方法:自动机技术、自动机技术、CYKCYK剖析算法、剖析算法、EarlyEarly算法、算法、转移图法转移图法主要优点主要优点:1 1)识别方便,可以从简单的基元开始,由简至繁。)识别方便,可以从简单的基
22、元开始,由简至繁。2 2)能反映模式的结构特征,能描述模式的性质。)能反映模式的结构特征,能描述模式的性质。3 3)对图象畸变的抗干扰能力较强。)对图象畸变的抗干扰能力较强。主要缺点:主要缺点:当存在干扰及噪声时,抽取特征基元困难,且易失误。当存在干扰及噪声时,抽取特征基元困难,且易失误。1.1 概述模式识别的基本方法341.1 概述模式识别的基本方法三、模糊模式识别三、模糊模式识别模式描述方法:模式描述方法:模糊集合模糊集合 A=(A=(a a,a),(,a),(b b,b),.(,b),.(n n,n),n)模式判定:模式判定:是一种集合运算。用隶属度将模糊集合划分是一种集合运算。用隶属度
23、将模糊集合划分为若干子集,为若干子集,m m类就有类就有m m个子集,然后根据择近原个子集,然后根据择近原则分类。则分类。35理论基础:理论基础:模糊数学模糊数学主要方法:主要方法:模糊统计法、二元对比排序法、推理法、模糊统计法、二元对比排序法、推理法、模糊集运算规则、模糊矩阵模糊集运算规则、模糊矩阵主要优点主要优点:由于隶属度函数作为样本与模板间相似程度的度量,由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。相当程度的干扰与畸变。主要缺点:主要缺点:准确合理的隶属度函数往往难以建立
24、,故限制了它的准确合理的隶属度函数往往难以建立,故限制了它的应用。应用。1.1 概述模式识别的基本方法361.1 概述模式识别的基本方法四、人工神经网络法四、人工神经网络法模式描述方法:模式描述方法:以不同活跃度表示的输入节点集(神经元)以不同活跃度表示的输入节点集(神经元)模式判定:模式判定:是一个非线性动态系统。通过对样本的学习是一个非线性动态系统。通过对样本的学习建立起记忆,然后将未知模式判决为其最接近的建立起记忆,然后将未知模式判决为其最接近的记忆。记忆。37第三章 判别域代数界面方程法为了减少计算量和存储量,可以仿照单样本修正法:6 二次准则函数及其解法自动细胞学、染色体特性研究、遗
25、传研究例:在军事目标识别中,假定有灌木丛和坦克两种类型,它们的先验概率分别是0.if(xki)and(di(xk)dl(xk)(li)then wi(k+1)=wi(k)+xk wl(k+1)=wl(k)-xkwj(k+1)=wj(k)(ji,l)最大似然估计(MLE)1 概述模式识别的发展简史且通常有 cre数据样本介绍:10个文本文件np,nq分别为类wp和wq的样本个数3 类的定义与类间距离主要优点:可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。因为cre,故0 t 1。这种具有上述特点的快速搜索方法,称为分支定界算法。随机矢量 的均值矢量 的各分量是相应的各随机分量
展开阅读全文