大学学习资料:模式识别考题总结(详细答案).doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学学习资料:模式识别考题总结(详细答案).doc》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 学习 资料 模式识别 考题 总结 详细 答案
- 资源描述:
-
1、模式识别考题总结模式识别考题总结( (详细答案详细答案) )1. 简述模式的概念及其直观特性,模式识别的分类,有哪几种方法简述模式的概念及其直观特性,模式识别的分类,有哪几种方法。 (6)答(1) :什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。模式的直观特性:可观察性;可区分性;相似性。模式的直观特性:可观察性;可区分性;相似性。答(2)
2、 :模式识别的分类:假说的两种获得方法(模式识别进行学习的两种方法) :监督学习监督学习、概念驱动或归纳假说;非监督学习非监督学习、数据驱动或演绎假说。模式分类的主要方法:数据聚类数据聚类: 用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。是一种非监督学习的方法,解决方案是数据驱动的。统计分类统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法,分类器是概念驱动的。结构模式识别结构模式识别: 该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。 (句法模式识别)神经网络神经网络
3、:由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。 增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分类。2. 什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素?(素?(8)答(1) :所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统(计算机理系统(计算机) 。由于我们建立的信息处理系统实际上是模仿生理神经网络,因此
4、称它为人工神经网络。 这种网络依靠系统的复杂程度, 通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络的两种操作过程:训练学习、正常操作(回忆操作) 。答(2) :人工神经网络的特点:固有的并行结构和并行处理;固有的并行结构和并行处理;知识的分布存储;知识的分布存储;有较强的容错性;有较强的容错性;有一定的自适应性;有一定的自适应性;人工神经网络的局限性:人工神经网络不适于高精度的计算;人工神经网络不适于做类似顺序计数的工作;人工神经网络的学习和训练往往是一个艰难的过程;人工神经网络必须克服时间域顺序处理方面的困难;硬件限制;正确的训练数据的收集。答(3) :选取人工
5、神经网络模型,要基于应用的要求和人工神经网络模型的能力间的选取人工神经网络模型,要基于应用的要求和人工神经网络模型的能力间的匹配,主要考虑因素包括:匹配,主要考虑因素包括:网络大小;网络大小;所需输出类型;所需输出类型;联想记忆类型;联想记忆类型;训练方法;训练方法;时间的限定。时间的限定。3. 画出句法模式识别的框图,并解释其工作原理画出句法模式识别的框图,并解释其工作原理。 (8)答(1) :句法模式识别框图如下:答(2) :句法模式识别系统的组成:图像预处理,图像分割,基元及其关系识别,句法分析。基于描述模式的结构信息, 用形式语言中的规则进行分类, 可以更典型地应用于景物图片的分析。因
6、为在这类问题中,所研究的模式通常十分复杂,需要的特征也很多,仅用数值上的特征不足以反映它们的类别。句法模式识别系统处理过程: 基元本身包含的结构信息已不多, 仅需少量特征即可识别。如果用有限个字符代表不同的基元, 则由基元按一定结构关系组成的子图或图形可以用一个有序的字符串来代表。假如事先用形式语言的规则从字符串中推断出能生成它的文法,则假如事先用形式语言的规则从字符串中推断出能生成它的文法,则可以通过句法分析,按给定的句法(文法)来辨识由基元字符组成的句子,从而判别它是可以通过句法分析,按给定的句法(文法)来辨识由基元字符组成的句子,从而判别它是否属于由该给定文法所能描述的模式类,达到分类的
7、目的。否属于由该给定文法所能描述的模式类,达到分类的目的。4. (1)解释线性判别函数进行模式分类的概念)解释线性判别函数进行模式分类的概念; (2)既然有了线性判别函数)既然有了线性判别函数,为什么还要用非线性判别函数进行模式分类?(为什么还要用非线性判别函数进行模式分类?(3)两类模式,每类包括)两类模式,每类包括 5 个个 3维不同的模式,且良好分布。如果它们是线性可分的,问权向量至少需要几个维不同的模式,且良好分布。如果它们是线性可分的,问权向量至少需要几个系数分量?假如要建立二次的多项式判别函数系数分量?假如要建立二次的多项式判别函数, 又至少需要几个系数分量?又至少需要几个系数分量
8、? (设设模式的良好分布不因模式变化而改变模式的良好分布不因模式变化而改变。 ) (8)答(1) :模式识别系统的主要作用是判别各个模式所属的类别。线性判别函数分类就是使用线性判别函数将多类样本模式分开。一个一个 n 维线性判别函数的一般形式:维线性判别函数的一般形式:1122101( )Tnnnnd xw xw xw xww xw其中012(,.,)Tnww ww称为权向量(或参数向量) ,12( ,.,)Tnxx xx。( )d x也可表示为:( )Td xw x其中,12( ,.,1)Tnxx xx称为增广模式向量,0121(,.,)Tnnww ww w称为增广权向量。两类情况两类情况:
9、判别函数( )d x:120( )0Tif xd xw xif x多类情况多类情况:设模式可分成12,.,M 共 M 类,则有三种划分方法:多类情况多类情况 1用线性判别函数将属于i类的模式与不属于i类的模式分开,其判别函数为:0( )0iTiiiif xd xw xif x这种情况称为/ii两分法,即把即把 M 类多类问题分成类多类问题分成 M 个两类问题个两类问题,因此共有因此共有 M 个个判别函数判别函数,对应的判别函数的权向量为,1,2,.,n 1iw i 。多类情况多类情况 2采用每对划分,即|ij 两分法,此时一个判别界面只能分开两种类别,但不能把它与其余所有的界面分开。其判别函数
10、为:( )Tijijdxw x若( )0ijdx ,ji ,则ix重要性质:重要性质:ijjidd 要分开要分开 M 类模式,共需类模式,共需 M(M-1)/2 个判别函数。个判别函数。不确定区域:若所有( )ijdx,找不到ji ,( )0ijdx 的情况。多类情况多类情况 3(多类情况(多类情况 2 的特例)的特例)这是没有不确定区域没有不确定区域的|ij 两分法。假若多类情况 2 中的ijd可分解成:( )( )( )()Tijijijdxd xdxwwx,则0ijd 相当于( )( )ijd xdx,ji 。这时不存在不确定区域。此时,对对 M 类情况应有类情况应有 M 个判别函数个判
11、别函数:( ),1,2,Tkkdxw x kM即( )( )ijd xdx,ji ,,1,2,.i jM, 则ix, 也 可 写 成 , 若( )max( ),1,2,.,ikd xdx kM,则ix。该分类的特点是把该分类的特点是把 M 类情况分成类情况分成 M-1 个两类问题。个两类问题。模式分类若可用任一个线性函数来划分, 则这些模式就称为线性可分的, 否则就是非线性可分的。一旦线性函数的系数 wk 被确定,这些函数就可用作模式分类的基础。对于 M 类模式的分类,多类情况 1 需要 M 个判别函数,而多类情况 2 需要 M*(M-1)/2个判别函数,当 M 较大时,后者需要更多的判别式(
12、这是多类情况 2 的一个缺点) 。采用多类情况 1 时,每一个判别函数都要把一种类别的模式与其余 M-1 种类别的模式分开,而不是将一种类别的模式仅与另一种类别的模式分开。由于一种模式的分布要比 M-1 种模式的分布更为聚集,因此多类情况 2 对模式是线性可分的可能性比多类情况 1 更大一些(这是多类情况 2 的一个优点) 。答(2)广义线性判别函数出发点:线性判别函数简单,容易实现;非线性判别函数复杂,不容易实现;若能将非线性判别函数转换为线性判别函数,则有利于模式分类的实现。采用广义线性判别函数的概念,可以通过增加维数来得到线性判别,但维数的大量增采用广义线性判别函数的概念,可以通过增加维
13、数来得到线性判别,但维数的大量增加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难,增加计算的复杂加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难,增加计算的复杂性。所以某些情况下使用非线性判别函数或分段线性判别函数效果更好。性。所以某些情况下使用非线性判别函数或分段线性判别函数效果更好。解(3)假设该两类模式是线性可分的,则在三维空间中一个线性平面可以将这两类模式分开,所以判别函数可以写成:1234( )d xw xw xw xw所以权向量需要 4 个系数。对于 n 维 x 向量,采用 r 次多项式,d(x)的权系数 w 的项数为:()! !rwn rnrNCr n
14、当 r=2,n=3 时,(2)!(2)(1)102! !2WnnnNn所以,此时权向量需要 10 个系数分量。5. 设一设一有限态有限态自动机自动机01202(0,1, ,Aq q qq q,定义如下:定义如下:021222011021(,0), (,0), (,0)(,1), (,1), (,1)qqqqqqqqqqqq试求等价的正则文法,使得试求等价的正则文法,使得 L(G)=T(A)。 (10)解: 设由 A 得一正则文法(,),NTGV V PS, 则12 ,NVS x x,0,1TV ,0Sq由01(,1)qq,得生成式11Sx 由02(,0)qq,得生成式20,0SSx 由10(
15、,1)qq,得生成式11xS 由12( ,0)qq,得生成式1120,0 xxx 由21(,1)qq,得生成式211xx 由22(,0)qq,得生成式2220,0 xxx 对比实例:当扫描字符串 1110 时,A 按以下状态序列接受该字符串201101110qqqqq用对应的正则文法 G 推导,得:111111111110SxSx按有限态自动机确定正则文法给定一个有限态自动机0( , ,)AQq F ,可确定一个正则文法(, , )NTGV V P S,使得 L(G) = T(A)。由0111,.,nnnQq qq qqF,可确定:121 ,.,x ,NnnVS x xx,0Sq,iixq,T
16、V 。从求 G 中的生成式 P 可按如下原则:(1)若( , )ijq aq,则ijxax(2)若1( , )inq aq,则1,iinxa xax6. K-均值算法聚类:均值算法聚类:K=2,初始聚类中心为,初始聚类中心为12,x x,数据为,数据为: (10)12345678910(0,0),(1,0),(0,1),(1,1),(8,7)(9,7),(8,8),(9,8),(8,9),(9,9)xxxxxxxxxx算法算法:第一步:选K个初始聚类中心,12(1),z (1),.,(1)kzz,其中括号内的序号为寻找聚类中心的迭代运算的次序号。 可选开始的K个模式样本的向量值作为初始聚类中心
17、。第二步:逐个将需分类的模式样本 x按最小距离准则分配给K个聚类中心中的某一个(1)jz。 即( )min( ) ,1,2,jiD kxz kiK, 则( )jxSk, 其中k为迭代运算的次序号,第一次迭代1k ,jS表示第j个聚类,其聚类中心为jz。第三步:计算各个聚类中心的新的向量值,(1),1,2,.,jz kjK求各聚类域中所包含样本的均值向量:( )1(1),1,2,jjx SkjzkxjKN其中jN为第j个聚类域jS中所包含的样本个数。以均值向量作为新的聚以均值向量作为新的聚类中心类中心,可使如下聚类准则函数最小:2( )(1) ,1,2,jjjx SkJxzkjK在这一步中要分别
18、计算在这一步中要分别计算 K 个聚类中的样本均值向量,所以称之为个聚类中的样本均值向量,所以称之为 K-均值均值算法。算法。第四步:若(1)( )jjzkzk,则返回第二步,将模式样本逐个重新分类,重复迭代运算;若(1)( )jjzkzk,则算法收敛,计算结束。7. 给出两类模式分布,每一列代表一个样本:给出两类模式分布,每一列代表一个样本:1:55456545651x2:55654565452x试用试用 K-L 变换来做一维特征的提取(变换来做一维特征的提取(12) 。解:首先将所有样本看作一个整体,求出样本均值向量:55111155jj1j2jmxx0由于均值为 0,符合 K-L 变换的最
19、佳条件。如果均值不为 0,则所有样本要减去均值向量。由于1和2的样本数相同,所以认为他们的先验概率相同,即:12()()0.5PP求出总体的自相关矩阵R或协方差矩阵C:2125.425() 2525.4TiiiiRPE x x解特征方程0RI,求出R的特征值:1250.4,0.4求出对应于特征值的特征向量iiiR:121111,1122 选取1对应的特征向量作为变换矩阵,由Tyx得出变换后的一维模式:1:1099111122222 1x 2:10111199222222x 8. 用第二类势函数的算法进行分类(用第二类势函数的算法进行分类(10)选择指数型势函数,取选择指数型势函数,取=1,在二
20、维情况下势函数为:,在二维情况下势函数为:)()(2222112),(kkkxxxxxxkeexxK这里:这里:1类为类为 x=(0 0)T, x=(2 0)T;2类为类为 x=(1 1)T, x=(1 -1)T解:可以看出,这两类模式是线性不可分的。算法步骤如下:第一步:取(1)1(0,0)Tx,则22221(1)1212( )( ,)exp (0)(0) exp ()K xK x xxxxx第二步:取(2)1(2,0)Tx因exp (40)exp( 4)0,故222112( )( )exp ()KxK xxx第三步:取(3)2(1,1)Tx因exp (1 1)exp( 2)0,故22223
21、2(3)1212( )( )( ,)exp () exp (1)(1) K xKxK x xxxxx后面同理,就是不断将样本带入,如果分类正确,则势函数保持不变,即:1( )( )kkKxKx如果分类错误,则有两种情况:(k 1)1(k 1),()0kxKx,则1(k 1)( )( )( ,)kkKxKxK x x(k 1)2(k 1),()0kxKx,则1(k 1)( )( )( ,)kkKxKxK x x经过迭代,全部模式都已正确分类,因此算法收敛于判别函数。得出:)2()1()1()1()1()(2221222122212221)(xxxxxxxxeeeexd9. 有一种病,正常为有一种
22、病,正常为1,不正常为,不正常为2,已知:,已知:12()0.9, ()0.1PP现对某人进行检查,结果为现对某人进行检查,结果为x,由概率曲线查出:,由概率曲线查出:12( |)0.2, ( |)0.4P xP x风险代价矩阵为:风险代价矩阵为:111221220610LLLLL对该检查者进行判决:对该检查者进行判决:(1) 用贝叶斯最小错误概率判别,求出判决函数和决策分界面。用贝叶斯最小错误概率判别,求出判决函数和决策分界面。(2) 用贝叶斯最小风险判别,求出判别函数和决策分界面。用贝叶斯最小风险判别,求出判别函数和决策分界面。解(1) :111222(| )() ( |)(| )() (
23、 |)PxPP xPxPP x由于1221( |)()11( |)2()9P xPlP xP所以1x。解(2) :21( )( |) (),1,2jijiiir xL P xPj由于122122211211( |)()11( |)2()54P xPLLlP xPLL所以1x。10. 阐述误差反传算法(阐述误差反传算法(BP 算法)的原理,并写出其训练步骤。算法)的原理,并写出其训练步骤。答(1) :BP 算法推算过程:算法推算过程:当加入第 k 个输入时,隐蔽层 h 结点的输入加权和为:kkhihiisw x如果令第一层的加权矩阵为1W,则还可以表示为:1kTkhsW x相应节点的输出为:()
24、()kkkhhihiiyF sFw x写成矩阵形式为:1()()kkTkhhFFysW x同样,输出层 j 结点的输入加权和为:()kkkjhjhhjihihhisw yw Fw x令第二次的加权矩阵为2W,则可以写成:221()kTkTTkjhFsW yWW x相应点的输出:()()()kkkkjjhjhhjihihhiyF sFw yFw Fw x写成矩阵形式为:21()kTTkjFFyWW x这里,各结点的阈值等效为一个连接的加权0hw或0 jw,这些连接由各结点连到具有固定值-1 的偏置结点,其连接加权也是可调的,同其它加权一样参与调节过程。误差函数为:jkhikiihhjkjjkkj
25、kjxwFwFTyTWE,2,2)(21)(21)(为了使误差函数最小,用梯度下降法求得最优的加权,权值先从输出层开始修正,然为了使误差函数最小,用梯度下降法求得最优的加权,权值先从输出层开始修正,然后依次修正前层权值,因此含有反传的含义。根据梯度下降法,由隐蔽层到输出层的连接后依次修正前层权值,因此含有反传的含义。根据梯度下降法,由隐蔽层到输出层的连接的加权调节量为:的加权调节量为:()()kkkkkkhjjjjhjhkkhjEwTyF syyw 其中kj为输出结点的误差信号:()()()kkkkkkjjjjjjF sTyF skkkjjjTy 在 BP 算法中常采用 Sigmoid 函数:
展开阅读全文