大学精品课件:模式识别pattern recognition c-7.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:模式识别pattern recognition c-7.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学精品课件:模式识别pattern recognition c-7 大学 精品 课件 模式识别 pattern
- 资源描述:
-
1、 句法模式识别句法模式识别 第七章第七章遥感信息工程学院1 7.1、形式语言基础和文法 7.2、一维及高维文法 7.3、基元提取和文法推断 7.4、句法分析 7.5、自动机识别 第七章第七章 句法模式识别句法模式识别 句法模式识别句法模式识别 第七章第七章遥感信息工程学院2n概述:概述:结构模式识别:结构模式识别:从模式的结构关系入手对模式进行分析是一个十分重要的方法,统计模式识别方法是不能完成这一任务的,因为它注重的只是模式的数值特征,孤立地分析每一个模式,仅仅对其量的特征进行辨别。能够进行结构分析的是句法模式识别方法,它是由模仿语言学中句法的层次结构而产生的一种方法。基本思想:基本思想:对
2、模式内部具有的结构特征进行分析和表示,并且将这些结构特征和已知类别中的结构特征进行比较,就可以分辨给定的模式从结构类似的意义上应该属于哪个类别。具体而言:将复杂模式分解为若干较简单的子模式的组合,而子模式又分为可以由更简单的子模式来描述,最简单的子模式称为模式基元。通过对模式基元的识别,进而识别子模式,最终识别该复杂模式。第七章第七章 句法模式识别句法模式识别 句法模式识别句法模式识别 第七章第七章遥感信息工程学院3n因此,有必要对模式内部具有的结构特征进行分析和表示,并且将这些结构特征和已知类别中的结构特征进行比较,就可以分辨给定的模式从结构类似的意义上应该属于哪个类别。这就是结构模式识别的
3、基本思想。怎么来表达模式的结构呢?下面我们会看到,结构的分析方式和自然语言的分析方式类似,因此也将结构模式识别称为句法模式识别。句法模式识别句法模式识别 第七章第七章遥感信息工程学院4 模式描述语言:模式描述语言:描述模式结构的语言。包括模式基元和对基元的合成操作规则。模式文法:模式文法:对基元作合成操作以构成模式的规则。多级树描述结构:多级树描述结构:地板地板M M墙壁墙壁N NL LT TB BD DE EX XZ ZY Y景物景物:A 景物景物A A物体物体B B背景背景C C三角体三角体D D长方体长方体E E三角形三角形T T面面L L面面Y Y地板地板M M墙壁墙壁N N面面Z Z
4、面面X X第七章第七章 句法模式识别句法模式识别 句法模式识别句法模式识别 第七章第七章遥感信息工程学院5结构模式识别系统框图结构模式识别系统框图:图像图像输入输入预处理预处理分割分割描述描述基元基元提取提取句法句法分析分析分类决策分类决策模式表示模式表示识别识别分析分析训练样本训练样本基元选择基元选择句法句法推断推断句法句法分析分析改进改进句法句法规则规则第七章第七章 句法模式识别句法模式识别 句法模式识别句法模式识别 第七章第七章遥感信息工程学院6n 所谓形式语言是一种抽象语言,它是从人类的自然语言,计算机使用的各种语言,数学中的公式语言等等中抽象概括出来的。形式语言的理论是句法模式识别的
5、基础。7.1、形式语言基础和文法一、基本概念一、基本概念1、字母表、字母表:与所研究的问题有关的符号集合。例:V1=A,B,C,D,V2=a,b,c,d2、句子句子(链链):由字母表中的符号所组成的有限长度的符号串。3、句子、句子(链链)的长度的长度:所包含的符号数目。例:|a3b3c3|=94、语言语言:由字母表中的符号组成的句子集合,用L表示。例:字母表V=a,bL1=ab,aab,abab 有限语言 L2=anbm|n,m=0,1,2.无限语言5、文法、文法:在一种语言中,构成句子所必须遵循的规则的集合,用G表示。L(G)表示由文法G构成的语言。句法模式识别句法模式识别 第七章第七章遥感
6、信息工程学院76、V*:由字母表V中的符号组成的所有句子的集合,包括空句子在内。例:V*,01,0017、V:不包括空句子在内的句子集合,即VV*()8、VT:终止符,不能再分割的最简基元的集合,用小写字母 表示。VT=a,b,c9、VN:非终止符,由基元组成的子模式和句子的集合。用大 写字母表示。VN=A,B,C VT,VN的关系:VTVN=(空集)VT VN=V(全部字母表)10、产生式、产生式(再写规则再写规则)P:存在于终止符和非终止符间的关系式。例:,VN,VN,VT.11、文法的数学定义文法的数学定义:它是一个四元式,由四个参数构成。G=VN,VT,P,S 7.1、形式语言基础和文
7、法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院8 二二.短语结构文法短语结构文法 1.0型文法(无限制)型文法(无限制)设文法G=(VN,VT,P,S)VN:非终止符,用大写字母表示 VT:终止符,用小写字符表示 P:产生式 S:起始符产生式P:,其中V+,V*,无任何限制 (V+不包括空符号串,V*包括空符号串)例:0型文法 G=(VN,VT,P,S)VN=S,A,B VP=a,b,cP:SaAbc AbbA AcBbcc bBBb aBaaA aB(空符号串)7.1、形式语言基础和文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院9SAabcabAcabBbccaBb
8、bcc bbcc 此文法可以产生:X=anbn+2cn+2 n0 X|n=0=bbcc由0型文法产生的语言称为0型语言。2.1型文法(上下文有关文法)型文法(上下文有关文法)设文法G=(VN,VT,P,S)产生式P:1A212 其中AVN,V+,1,2V*|1A2|12|,或|A|B|由上下文有关文法构成的语言称为上下文有关语言,用L(G1)表示,G1:上下文有关文法 7.1、形式语言基础和文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院10例:G=(VN,VT,P,S)VN=S,B,C VT=a,b,cP:SaSBC CBBC SabC bBbb bCbc cCcc1S21aSB
9、C2,bBbb对于SaSBC 1=,2=,A=S,B=aSBC,并且|S|0 解:G=(VN,VT,P,S)VT=(0,1)P:S0B B0B B1S B0 VN=(S,B)7.1、形式语言基础和文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院16四种文法的关系四种文法的关系:3型2型1型0型包含关系:限制不严格的文法必然包含限制严格的文法。7.1、形式语言基础和文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院17一一、串文法、串文法 1、定义:以字符串来描述模式,这样的文法常称为串文法。串文法是一种一维文法,也称为链文法。串文法被定义为四元组:G=(VN,VT,P,S
10、)VN:非终止符,用大写字母表示 VT:终止符,用小写字符表示 P:产生式(产生式P:)S:起始符2、应用实例:1964年Ledley等在自动处理染色体分类过程中提出的描述终端着丝点染色体和亚中央着丝点染色体的上下文无关文法。7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院18 顺时针跟踪染色体的边界,得到由基元连结而成的串,如亚中央着丝点染色体可以描述为babcbabdacadbabcbabdacad。染色体文法是 ,其中 SPVVGTN,AASbCCSSeBSSPedcbaVFEDCBASSSVTN12121,:,DcFBbBCDEbBBaDFDADbDDEA
11、bDDACAdCCAAbCBASCbC,2(1)染色体文法基元(2)亚中央着丝点染色体(3)终端着丝点染色体 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院19 区分不同的染色体,首先对它们进行轮廓扫描,自动形成由模式基元 所构成的不同的串。然后用上述文法G来检验,若某一个字符串可以由从第一个生成式 开始的推导得到,则该字符串表示亚中央着丝点染色体。若是由 开始推导得到的句子,则表示终端着丝点染色体。描述终端着丝点染色体的句子的最左推导如下:edcba,1SS 2SS ebabcbabebabcbDbebabcbDebabcDebabEebDbEebDEebAB
12、bABASS2 7.2、一维及高维文法 DcFBbBCDEbBBaDFDADbDDEAbDDACAdCCAAbCBASCbCAASbCCSSeBSSP,:2121 句法模式识别句法模式识别 第七章第七章遥感信息工程学院20二二、图象描述语言图象描述语言PDL(Picture Description LanguagePicture Description Language)串文法中字符串的连结只能表示基元的单向连结,不能表示基元同时在几个方向与其它基元的连结,也就是说,它只能表示一维连结方式,不能满足描述复杂图形的要求。为此,需要有高维文法。PDL语言就具有这种功能。1970年,Show提出图像
13、描述语言,任何图象都可用头尾来表示。PDL的基元是由两点(称为“头”和“尾”)构成的矢量,它可组成任意一个n维结构的图形。这是一种用于模式识别比较成功的语言。ht基元 a,b头头尾尾 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院21 连接规则:定义了四种二元连接算子1.a+b2.a x b3.a b4.a*ba头与b尾相连a尾与b尾相连,形成两个头a头与b头相连,形成一头二尾a头连b头,a尾连b尾,形成一头一尾一元算子htahta 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院22例:文法G=(VN,VT,P,S)VT=,(),
14、+,-,x,*,VN=S,A,B,C P:SA SB A(b+(C+c)B(d+(a+(d)*C),C(b+c)*a)ab cd 一个基元的头或尾可以与另一基元的头或尾相连而成为模式串,并可设置一些较复杂的联结关系和进行各种运算。7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院23L(G)=(b+(b+c)*a)+c);(d+(a+(d)*(b+c)*a)bcaaddbbccaCBSdb+导出过程da+c*aSAb+c+Cb+c*a 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院24 求表达式的规则:n 脱括号由内往外的次序进行,无
15、括号由左向右进行n 对于连接基元组成基元结构,必须符合规定的连接 点头,尾数目例:给出一个PDL文法G=(S,A,B,C,D,E,a ,b ,d,(,),+,*,P,S)P:S(A+(B)B(C)+D D b E(a+b)A d C E*c D (d)A ac 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院25可以导出手写大写字符“A”的四种表达式 S(A+(B)(a+(B)(a+(C)+D)(a+(E*c)+D)(a+(a+b)*c)+D)(a+(a+b)*c)+(d)(d+(a+b)*c)+b),(a+(a+b)*c)+b),(d+(a+b)*c)+(d)a
16、dbbaabbbaddcdaabc 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院26标准形式文法标准形式文法*在句法分析和自动机的一些算法中,有时要求标准化文法,下面介绍二种标准文法。1.乔姆斯基(Chomsky)范式,一种上下文无关文法如果它的每个 产生式P都符合二种形式:ABC(A,B,CVN)或Aa(AVN,aVT)该文法称Chomsky范式 已知上下文无关文法 G=(VN,VT,P,S)用以下步骤产生Chomsky范式的等价文法 G=(VN,VT,S)若中已经是ABC,Aa形式放入 中中其它的产生式形式为A 12.n 其中iVN或 iVTPP 句法模式
17、识别句法模式识别 第七章第七章遥感信息工程学院27用下面的产生式集合代替:AY1Y2.n Y2.nY2Y3.n Yn-1.nYn,n-1 YiVN若i VN,则令Yi=i;若i VT,再引入Yii 句法模式识别句法模式识别 第七章第七章遥感信息工程学院28例:把文法G=(VN,VT,P,S)变成Chomsky范式 VN=S,A,B VP=a,bP:SAB,Aa,AabABa,Bb 把SAB,Aa,Bb放入 中AabABa,A12345,其中1=5=a,2=b,3=A,4=BAY1Y2345,Y2345Y2Y345,Y345Y3Y45,Y45Y4Y5,3,4VN Y345AY45,Y45BY5,
18、125VT引入新的产生式,Y1a,Y2b,Y5a P 句法模式识别句法模式识别 第七章第七章遥感信息工程学院29符合chomsky范式文法,文法G2=(VN,VT,S)VN=Y1Y2345,Y2Y345,Y45,Y5,S,A,B AY1Y2345,Y1a,Y2345Y2Y345,Y2b,Y345AY45,Y45BY5,Y5a,SBA,Aa,Bb若x=bababa用G1导出:SBAbAbabABabababa,用G2导出:SBAb Y1Y2345.baY2345 baY2Y345 babY345 babAY45 babaY5 bababY5 bababa用原文法G1 只用四步可以导出bababa
19、而用标准文法G2则用九步才导出P 句法模式识别句法模式识别 第七章第七章遥感信息工程学院302.格雷巴赫范式格雷巴赫范式(Greibach)若一个上下文无关文法具有P形式:Aa,AVN,aVT,VN*(带空格)则此文法称为Greibach范式。例:上下文无关文法 G=(VN,VT,P,S)VN=S,C,VT=a,b,cP形式:SaCbb,CaCbb Cc变成Greibach范式:Cc即Cc符合Greibach范式,不变SaCbb,用SaCBB,Bb代替CaCbb,用CaCBB,Bb代替符合Greibach范式:P:SaCBB,CaCBB,Cc,Bb,句法模式识别句法模式识别 第七章第七章遥感信
20、息工程学院31三三、树文法、树文法 树文法也是一种高维文法,它是以树的杆、枝、根、叶结构形式来直观地描述基元的多向性联系和结构,表现多维结构特点的文法。1.1.树文法的定义:树文法的定义:定义:四元组 Gt=(v,r,P,S)其中V=VNVT,r:秩(一个节点的直接分支数)P形式:TiTj Ti,Tj都是树由Gt产生的语言叫树语言。L(Gt)=T|TT,TiT TiS,T是带有VT中结点的树集合Gt 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院32 扩展树文法扩展树文法:全部产生式形式Xxx1,x2 xn其中x1,x2.xnVN,xVT,nr(x)具有上面产生
21、式形式的树文法称扩展的树文法。2.2.应用举例:应用举例:例1:Gt=(v,r,P,S)V=VNVT(S,A,B,K,a,b)VT(,),r(a)=(2,0),r(b)=(2,0),r(k)=2ab 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院33 P:SK Aa Bb Aa Bb SK ABABABABababkABSKabABABabk导出树导出图bbaa 7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院34例2:在氢云室内用正粒子打击核目标碰撞发出的射线可以用 树文法来描述。树文法Gt=(v,r,P,S),VN(S,A,B)
22、,VT(a,b)基本定义:ab(凸弧)(凹弧)S a|S S a A BS a A BBA S a A BBA A BA a|AA a B a|BB a P:7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院35r(a)=(0,1,2,4,6),r(b)=(0,1)射线导出树:S a a a a a a a a a a a a a a a a a a a bbbbb bbbb bbbbaab射线图:7.2、一维及高维文法 句法模式识别句法模式识别 第七章第七章遥感信息工程学院36一、基元提取、基元提取 基元是句法模式识别的基础。它对应于文法中的终止符,是构成句子的最
23、基本单位。1 1、基元的选择:、基元的选择:基元的选择需要根据识别对象的具体情况、模式的性质以及实现识别系统所具备的技术等因素而定。建议:1)所选取的基元应是精简的,以易于语法描述与分析。2)能用非语言学的方法方便地抽取。例如:语音识别音素 文字识别笔划 图形基元的选择有两个途径,一是基于图形边界(或轮廓线)或骨架的分析,二是基于组成图形的基本组成区域。7.3、基元提取和文法推断 句法模式识别句法模式识别 第七章第七章遥感信息工程学院37 基于图形边界或骨架,是将各类图形的边界线或脊线分解成直线段或弧线段。比如染色体。按图形的区域提取基元的方法,是将图形近似地(因为许多图形的边界不一定是直线)
24、,看成一个大的多边形,这个大多边形可以分割成许多小的凸多边形,那么我们将凸多边形作为基元。2 2、基元提取:、基元提取:1)骨架法 2)边界提取法 3)区域分割法 7.3、基元提取和文法推断 句法模式识别句法模式识别 第七章第七章遥感信息工程学院38二、文法推断二、文法推断 基元是句法模式识别的基础。它对应于文法中的终止符,是构成句子的最基本单位。在确定了基元之后,需要将已知的各类样本集作为学习的基础,分析、归纳出各类模式的文法,根据各类模式的文法进行分类。这就是所谓的文法推断。7.3、基元提取和文法推断 假定已知某类模式的文法G,则生成的语言为 ,即由这一文法G所产生的句子一定是终止符所组成
25、的所 有 字 符 串 的 一 部 分,而 不 是 全 部。比如 ,其中TVGL)(SPVVGTN,BASVN,baVT,bBbBBaBAaASP,:句法模式识别句法模式识别 第七章第七章遥感信息工程学院39文法推断就是根据样本集 推导出文法G。这就如同统计模式识别中提供样本集以作训练时,每一类的样本不一定绝对纯一样。,3,2,1;,3,2,1;,)(nmVbabaGLTnm,aaabbaaabbaVTTV)()(GLVGLT)(;,2,1)(;,2,1GLxljxRGLxkixRjjiiRRR则:而:将 中不属于L(G)的字符串子集定义为:如果提供学习用的字符串集是R,它可能包括两部分,即 但
展开阅读全文