下推自动机与上下文无关文法的对应关系课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《下推自动机与上下文无关文法的对应关系课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 下推自动机 上下文 无关 文法 对应 关系 课件
- 资源描述:
-
1、6.1 句法模式识别概述句法模式识别概述6.2 形式语言的基本概念形式语言的基本概念6.3 模式的描述方法模式的描述方法6.4 文法推断文法推断6.5 句法分析句法分析6.6 句法结构的自动机识别句法结构的自动机识别第第6章章 句法模式识别句法模式识别6.1 句法模式识别概述句法模式识别概述模式用句子形式描述,结构信息十分重要。模式子模式基元句子词组单词组合关系自然语言的文法 句法模式识别用小而简单的基元与语法规则描述和识别大而复杂的模式,通过对基元的识别,进而识别子模式,最终识别复杂模式。符合某个文法的所有句子的集合一个模式类(b)墙壁 f地板 gEDBbadce(c)图6.1 景物结构描述
2、与英文句子句法描述的对比句法模式识别系统的组成:句法模式识别的理论基础:形式语言 20世纪50年代中期乔姆斯基(Chomsky)。*基元选择尚无通用的方法;*文法推断理论远不及统计学习发展得成熟。句法模式识别存在的主要问题:6.2 形式语言的基本概念形式语言的基本概念6.2.1 基本定义基本定义1字母表与问题有关的符号的有限集合,用V或表示。2句子 由字母表中符号组成的有限长度的符号串,又称链。空句用表示。组成:英文小写字母、数字。例:由 中元素可组成句子:,cbaV,1ZCBAV2,1,03V例:abc,aacc,重写次数句子的长度:句子包含符号的数目,用|表示。9|333cba3语言由字母
3、表中的符号根据某种文法组成的句子的集合。V*:V中符号组成的所有句子的集合,包括空句;V+:不包含空句的句子集合。*VV,*aabbccabV,aabbccabV例:4文法构成一种语言的句子所必须遵守的规则。),(SPVVGTNVN:非终止符的有限集,子模式的集合,大写字母表示。VT:终止符有限集,基元的集合,字母表起始部分的小写 字母表示。终止符和非终止符组成的混合字符串:用英文字母表尾部的小写字母x,y,v,w等表示。终止符组成的字符串:用希腊字母,等表示。性质:VVVTNTNVV(字母表)(空集)P:生成式的有限集。用文法产生句子时的重写规则。:P字符串 字符串 替换 S:起始符,代表模
4、式本身,特殊的非终止符。用生成式构成句子时,必须由左边是S的生成式开始。一种语言有一种文法,由文法G构成的语言用L(G)表示:,|)(*xSVxxGLGT且文法G构成的句子由终止符组成VT中字符组成的所有句子的集合 文法G的推导关系 aabccaaBccaaAccaAcS 利用文法构成句子时,除第一个生成式必须利用左边为起始符 S 的生成式外,其余生成式使用的先后次序及重复使用的次数都不受限制。是说明:解:6.2.2 文法分类文法分类四种类型:0型文法、1型文法、2型文法和3型文法。10型文法:型文法:无约束文法。P:其中,。V*V21型文法:型文法:上下文有关文法。含意:32型文法:型文法:
5、上下文无关文法。解:每个生成式的左边都是单变量,右边是非空字符串,故G是上下文无关文法。属于L(G)的句子:结果不唯一。43型文法:型文法:正则文法、有限态文法。是 后一种文法的限制比前一种文法的限制严格;限制愈多的文法愈容易推断;句法模式识别中多采用上下文无关文法和正则文法。6.3 模式的描述方法模式的描述方法6.3.1 基元的确定基元的确定根据结构特征对模式进行描述。结构描述法,又称句法表示法。模式的表示:链表示法、树表示法、图表示法。对应的文法:链文法(串文法)、树文法、图文法。还有网文法、阵列文法等。目前关于基元的确定没有一个通用的解决办法。基元的选择遵循两个基本原则。1基元应是模式的
6、基本单元,能够通过一定的结构关系对数 据进行紧凑、方便地描述。2基元应该容易用现有的非句法方法进行提取或识别。例如:语音识别中 音素;识别手写文字 笔划。6.3.2 模式的链表示法模式的链表示法1链码法链码法链码:用不同斜率的直线段或曲线段为基元表示图形模式。弗利曼链码:以八个基本方向的有向线段为基元,用07八个数字符号表示。用字符表示基元后,被描述的图形表示成的字符串。弗利曼链码基元 数字“2”的折线化和量化结果编码:矩形网格覆盖;折线化和量化;形成链码(有序结构)。例:“2”的链码表示为1075456000 x2图形描述语言法图形描述语言法简称PDL(Picture Description
7、 Language,PDL)。基本基元:有向线段(直线段、弧线段)。由“头(箭头端)”和“尾”构成。关系基元:表示基元之间连接关系的算子。头尾相接 头头相接 尾尾相接 头头 且尾尾相接头尾颠倒()组合关系(配合使用)例:用PDL法表示大写英文字母A。(a+b)(a+b)*c)(a+b)*c)+b)(a+(a+b)*c)+b)链表示法:只能从左边或右边与其它符号相连,一维连接方式。6.3.3 模式的树表示法模式的树表示法高维表示法。1树的定义树的定义树T是一个或一个以上结点的有限集合,并且满足:1)存在一个唯一的指定为根的结点;2)其余结点分为m个不相交的集合T1,T2,Tm,其中 每一个集合本
8、身都是一个树,称为T的子树。同一层上各子树交换位置构成的树不同。树的有序性:一个结点具有子树的个数,结点a的秩记为 r(a)。叶结点的秩为零。秩:长方体 基元 树结构描述 结点a的秩可能是2,l或0。0,1,2)(ar例:结点a可能有2,1或0个分枝树文法定义为四元式),(SPrVGt2树文法树文法字母表 以字母表中字母为根结点的树的秩 起始树的有限集 VTS 生成式的有限集由树文法Gt产生的语言L(Gt)是一些树的集合即模式集:,|)(*STTTTTTGLitGiTt所有结点都是终止符的树的集合树T由S中的起始树Ti开始,用文法Gt的生成式逐步导出图6.7 模式的树状表示解:生成式 中右边的
展开阅读全文