自动化系形式语言配套全册教学课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《自动化系形式语言配套全册教学课件.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自动化 形式语言 配套 教学 课件
- 资源描述:
-
1、 形式语言形式语言-研究字符串集合及其性质的学科 计算机处理的主要对象 语言 自然语言(字符串) 人工语言(符号串) 自然语言自然语言:人与人之间交流的基本手段。 如:汉语、英语、俄语、法语、等 人工语言人工语言:主要用于人与计算机之间的交流。 如:程序设计语言 (也有例外,如世界语) 形式语言形式语言:研究自然语言和人工语言都必须遵循的一般规律 自动机:自动机:语言(形式语言)识别器 可见,本课程是计算机科学的基本理论 1、编译理论的发展过程: 汇编=编译或解释 =CC Compiler(YACC) 上述过程中无不运用某些形式语言的理论结果。 2、形式语言的研究价值。 (1)程序语言的设计
2、(2)Compiler技术方法改进 (3)计算复杂性:算法与自动机 (4)NP问题(多项式时间复杂度问题) (4)人工智能技术发展: 专家系统中知识表示(规则表示)及推理(规则推导) 程序正确性证明,前置条件=结果分析 软件自动生成,如CC Compiler、应用软件自动 构造技术等 自然语言理解,语言识别及分析技术 3、形式语言与自动机关系 形式语言研究引入了自动机进行语言识别。 自动机就是一种自动识别句子的构造或程序。 形式语言中的文法与自动机之间存在不可分割的关系。 每一种文法(四种典型文法)=一种自动机 4、本课程只介绍一般的形式语言基本概念和理论 “入门性” 参考书 1、计算理论基础
3、计算理论基础(第二版),Harry R. L., Christos H. P.,清华大学出版 社,1999年9月 2、 计算理论基础(第2版)中文翻译版,张立昂、刘田 译,清华大学出 版社, 2000年7月 3、 形式语言与自动机理论形式语言与自动机理论吴哲辉,吴振寰 编著,机械工业出版社, 2007年4月 4、形式语言与自动机理论教学参考书形式语言与自动机理论教学参考书,蒋宗礼 ,清华大学出版社,2007 年7月 5、形式语言及其与自动机的关系形式语言及其与自动机的关系,美 J.E. 霍普克罗夫特,J.D. 厄儿曼 著;莫绍揆、段祥、顾秀芳 译,科学出版社出版, 1979年 6、形式语言及其
4、句法分析形式语言及其句法分析, 美 A.V. 阿霍, J.D. 厄儿曼 著, 石青云 译 科学出版社出版, 1987年 7、无论其它有关形式语言与自动机理论的书。 0.2、语言及其表示、语言及其表示 提要:本节将从一般的观点来讨论定义语言的两种主要方法:提要:本节将从一般的观点来讨论定义语言的两种主要方法:产生程序产生程序和和 识别程序识别程序 。产生程序主要介绍。产生程序主要介绍Chomsky文法,而识别程序则介绍各种已文法,而识别程序则介绍各种已 研究过的识别程序。研究过的识别程序。 1、过程和算法 在讨论有穷表示的概念以前,我们非形式地介绍一下过程和算法。 一个过程过程就是一个能被机械地
5、执行的指令有穷系列。如一个计算机 的程序。 总是要终止的过程叫做总是要终止的过程叫做算法算法。 2、语言的表示 语言定义:(非形式)一个语言L是在某个有限字母表 上的有限长符号串的集合。 1)罗列法罗列法: 当L由有限符号串组成时,则一个显然的表示法是把L中所有的符 号串罗列出来。 L为无穷集时,怎么表示? 假定要求(规定)语言的表示是有限的。 2)产生系统产生系统:也称为文法系统。 即可给予一种算法或过程,它依某种次序可系统地依次产生语言的 句子。 优点:文法=句子结构 句法分析和翻译简单 3)识别法识别法: 给出一个过程,当输入一个任意的符号串时,它能判定该符号串 (或句子)是否在语言中。
6、 实际上,我们必须要求该过程是一个算法算法。 什么是语言理论?什么是语言理论? 语言理论就是对符号行的集合、它们的表示法、结构以及 特性的研究。 0.3、文法文法 1、启示启示 自然语言研究自然语言研究:文法的概念由语言学家在研究自然语 言的过程中形式化了的。他们不但关心正确句子的识 别,而且也关心提供句子的结构性描述。 目的目的:目标之一是发展一种能够描述自然语言(英语) 的形式文法,从而解决自然语言的计算机化理解、翻 译和解决文字问题。 但目前自然语言研究还不成熟,而计算机语言形式化 已经成熟。 例1. 1 The little boy ran quickly。 The little bo
7、y ranQuickly. 图1、句子分析图解句子分析 分析上述句子的规则如下: The little boy ran quickly 注意:注意: 目的目的:我们不但要能够检查句子的语法是否正确,而且还要能产生语 法上正确的句子。 方法方法:从开始,利用规则到结束。这样可以导出无穷多个句子 中任何一个句子。 一般形式一般形式: The, little + boy ran quickly 例如:little The The boy ran quickly. 这里,虽然大部分句子都没有意义,然而在广义上说还是语法上 正确的句子。 2、文法的形式概念、文法的形式概念 文法是语言的产生程序中最重要的
8、一类,一个文法是定义语言 的一个数学系统。 这里,我们先考察一类文法,也称为乔姆斯基文法 或 短语结 构文法。(0型文法) 1)一个语言的文法文法需要用两个不想交的符号集: 终结符终结符 与 非终结符非终结符N 2)文法的核心是产生式规则集产生式规则集P: (N)* N (N)* (N)* 3)文法定义文法定义: 约定约定:如果(,)是一个产生式,则用缩写 来表示。 定义定义:一个文法是一个四元组一个文法是一个四元组G=(N,P,S),),其中:其中: (1)N是非终结符的有限集(变量集是非终结符的有限集(变量集 或或 句法种类集)。句法种类集)。 (2)是终结符的有限集,与是终结符的有限集,
9、与N不相交。不相交。 (3)P是(是(N)* N (N)* (N)* 的有限子集,的有限子集, (,)P,可以写成:,可以写成:;称为一个产生式。;称为一个产生式。 (4)S是是N的一个特定符号,称为句子符或起始符。的一个特定符号,称为句子符或起始符。 例子例子1.2 G1 =(A, S,0, 1,P,S)是一个文法,)是一个文法, 其中:其中:P有下列产生式组成:有下列产生式组成: S 0A1 0A 00A1 A e 这里,非终结符是这里,非终结符是A和和S;终结符是;终结符是0和和1。 问题:问题:1、该语言是什么样?、该语言是什么样?2、如何修改更简单?、如何修改更简单? 讨论讨论 句子
10、形式句子形式:一个文法按递归方式定义语言。递归地定义如下:一个文法按递归方式定义语言。递归地定义如下: (1)S是一个句子形式。是一个句子形式。 (2)如果)如果是一个句子形式,且是一个句子形式,且是是P中的产生式中的产生式 则则也是一个句子形式。也是一个句子形式。 或或 ,则,则叫作句型。其中叫作句型。其中(N)* 句子句子:文法:文法G的不含非终结符的一个句子形式称由的不含非终结符的一个句子形式称由G生成的一个句子。生成的一个句子。 语言语言:由文法:由文法G生成的语言记为生成的语言记为L(G),它是由,它是由G生成的所有句子的生成的所有句子的 集集 合。合。 即:即: L(G) = w
11、| w S= * S= w * G 0.4、文法分类、文法分类 按文法的产生式形式产生式形式可以对文法进行分类。 乔姆斯基(Chomsky)文法分为四类:即 0型、1型、2型、3型 0型型 1型型 2型型 3型型 -依次条件强硬 0型文法 设G=(N,P,S)为一文法,若其产生式均为如下结构: 其中: (N)* ,且至少含有一个非终结符。 (N)* 则称此文法为0型文法。或称短语文法,或无(条件)限制文法。 如果对0型文法分别加上下列第i条限制,则就可得到相应的i型文法: 1、若P,则 ,仅Se例外(空句子)。 2、对于任何P,则=AN,(N)* 3、P中任何产生式均为AB,A;其中:* ,A
12、,BN 文法分类文法分类: 0型文法型文法:若P,其中,(N)*, 称为无限制文法无限制文法,或称短语文法短语文法。 1型文法型文法:若P,则 , 称为上下文敏感的上下文敏感的,或前后文有关文法前后文有关文法。 2型文法型文法:若P,则=AN,(N)*, 称为上下文无关的上下文无关的,或前后文无关文法前后文无关文法。 3型文法型文法:若P中产生式均为AB,A; 其中:* ,A,BN; 称为右线性的右线性的,或正规文法正规文法。 例子1.2是一个上下文有关的文法,即1型文法。(可改造成3型) 例子1.3 一个文法具有下列产生式规则: S 0S | 1S | e 此文法生成的语言是0,1*。该文法
13、是一个右线性文法, 即3型文法。 约定约定: 如果语言L能由x型的文法生成,就称L是x型语言。 比如:L(3)就由3型文法生成的语言,也就是3型语言。 语言集合之关系语言集合之关系: L(3) L(2) L(1) L(0) 0.5、识别程序识别程序-自动机自动机 自动机与文法、语言的关系。 对语言提供有限规定的另一种常用方法另一种常用方法:对语言定义一个识别程序。对语言定义一个识别程序。 也就是定义一个集合的高度格式化过程。 1、识别程序的组成、识别程序的组成 识别程序有三个部分三个部分: a)一个输入磁带(字母表的线 性序列) b)一个有限状态控制 c)一个辅助存储(按某种结构 组织的存储字
14、母集合) a0 a1 a2 a3 an 有限状态 控制 辅助存储 输入头 输入磁带 图示 一个识别程序 其中: 输入头输入头,一次可读一个字母(方格) 识别程序的一次移动识别程序的一次移动:左移一格、不动、右移一格 辅助存储辅助存储:可由两个函数(即存函数和取函数)来刻画其性能。 例如:下推表。 取函数 f : -为存储字母表 f(Z1Z2Zn)= Z1 - 唯一能取最上端符号 存函数:假定用一个有限长符号串代替下推表最上端的符号。 g : * * g(Z1Z2Zn, Y1Yk)= Y1Yk Z2Zn 辅助存储的类型决定一个识别程序的名称。辅助存储的类型决定一个识别程序的名称。 如:以下推表为
15、辅助存储的识别程序称为:下推识别程序(或叫下推自 动机)。 识别程序的识别程序的核心核心是一个一个有限状态控制有限状态控制。可表示为状态的一个有限 集,连同一个描述状态如何随当前输入符号当前输入符号(输入头处符号) 和取自辅助存储的当前信息当前信息而改变的映射映射。同时,也决定输入输入 头移动头移动及存储存储什么信息。 识别程序的运算运算是作一系列移动移动。 移动移动: 输入头向左移、向右移、保持不动。 将信息存入辅助存储。 改变控制的状态。 组态组态:一个识别程序的行为可由其组态来描述。 组态描述组态描述: 有限控制的状态。 输入磁带的内容,以及输入头的位置。 辅助存储的内容。 确定性的确定
16、性的:在每一组态中最多存在一个可能的移动。 有限控制有限控制: 非确定性的非确定性的:在每一组态,移动不只一种,而属于一个有限集。 有限控制处于特定的初始状态。 初始组态初始组态: 输入头处在最左边的符号。 辅存中有特定的初始内容。 有限控制处于特定的最终状态集中一个状态。 最终组态最终组态: 输入头处在右边的结束标记。 辅助存储也满足一定的条件(最终)。 接受符号串接受符号串w: 在输入串w的条件下,能够从初始组态开始作一系列移动, (确定性) 并结束于一个最终组态,则称该识别程序接受输入符号串w。 接受符号串接受符号串w: 识别程序从初始组态开始,作许多不同的移动序列。只要其中 (非确定性
17、) 至少有一个序列结束于一个最终组态,则认为符号串w被接受。 例1.4 设M是确定型有穷自动机(K, , , s , F ),没有存储能力。 其中: K = q0,q1, = a,b, s = q0, F = q0, 是状态转移由右表给出的函数。 可以看出L(M)是有偶数个b的a,b*串。 如果给输入aabba,则它的初始格局为( q0 ,aabba)。于是 ( q0,aabba) M (q0,abba) M (q0,bba) M (q1,ba) M (q0,a) M (q0,e) 因此( q0 ,aabba) *M (q0,e) ,从而aabba被接受。 一般的,转移函数可以表示成状态图形式
18、,右上表对应的状态图如右下。 q() q0aq0 q0bq1 q1aq1 q1bq0 a a b b q0 q1 状态图 语言语言:由一个识别程序定义的语言就是它所接受的输入符号串的所接受的输入符号串的集合集合。 Chomsky语言有下列特性语言有下列特性: 1、语言L是右线性的右线性的3型,当且仅当L由一个(单向确定性)有限自动机 所定义。 2、语言L是上下文无关的上下文无关的2型,当且仅当L由一个(单向非确定性)下推 自动机所定义。 3、语言L是上下文敏感的上下文敏感的1型,当且仅当L由一个(双向非确定性)线性 有界自动机所定义。 4、语言L是递归可数的递归可数的0型,当且仅当L由一个图灵
19、机所定义。 最后,关于识别程序的精确定义可在我们课程教材中详细讨论。 1.1、集合、集合 集合集合:对象的汇集。 如:L=a,b,c,d 就是四个字母的汇集形成的集合。 元素或成员元素或成员:构成集合的所有对象。 如:b是集合L的一个元素,表示成:bL 另一方面z不是L的元素,记作:z L 单元素集单元素集:集合中只有一个元素,即有一个元素构成的集合。 空集空集:集合中没有一个元素,用表示。 集合元素性质定义:设集合A已经定义,P是A的元素具有的性 质,则可以定义一个新集合B如下: B=x:x A且x具有性质P 子集子集:如果集合A的每一个元素都是集合B的元素,则称A是B 的子集,记作:A B
20、 真子集真子集: 如果A B,但AB,则称A是B的真子集。 集合的性质集合的性质:设A、B和C是集合,则下述算律成立 1、幂等率 AA=A AA=A 2、交换律 AB=BA AB=BA 3、结合律 (AB)C= A(BC) (AB)C= A(BC) 4、分配律 (AB)C=(AC)(BC) (AB)C=(AC)(BC) 5、吸收律 (AB)A=A (AB)A=A 6、De Morgan律 A-(BC)=(A-B)(A-C) A-(BC)=(A-B)(A-C) 幂集:集合A的所有子集所有子集的汇集本身是一个集合,叫做A的幂集 记作:2A 非空集合的非空集合的划分划分:如果是A的一些子集的集合,使
21、得满足 (1) 的每一个元素非空,即非空集合; (2) 的不同元素是不相交的; (3) =A,其中表示中所有元素的汇集 则是A的一个划分。 例如:(a,b),c,d是a,b,c,d的一个划分; 奇自然数集合和偶自然数集合构成自然数N的一 个划分。 1.2、关系与函数、关系与函数 :由两个元素构成的对,前后有别。 如a和b的有序对记作(a,b),a和b叫做它的。 :两个集合A和B的迪卡儿积是aA且bB的所有有序对(a,b)构 成的集合,记作AB。 :两个集合A和B的二元关系是AB的子集。 :设n是任一自然数,如果a1,a2,an是任意n个对象,也可以有相 同对象,则(a1,a2,an)是一个。n
22、叫做序列长度长度。 从而就有:有序2元组、有序3元组、。有序n元组 :集合A1,An上的n元关系就是A1。An一个子集。 即有序n元组的集合。 :集合A到集合B的函数是A和B上的具有下述特殊性质的二元关系R: 对于每一个元素aA,在R中恰好存在一个有序对以a为第一分量, 第二分量bB。 一般的,设f: A1An|B是一个函数,f(a1,an)=b, 其中: aiAi,且bB,有时称a1,an是f的自变量,b是f对应的值。 :如果对任意两个不同的值a,aA,f(a) f(a) 则称函数f: A|B是一对一的。 :如果B的每一个元素都是A的某一个元素在f下的值或叫象, 则称函数f: A|B满射到B
23、。 : 如果函数f: A|B既是一对一的,又是满射到B的, 则称f是A与B之间的双射。 :记作R-1, R-1 =(a,b): (b,a)R 显然,若R AB,则R-1 BA。 :设Q和R是两个二元关系,他们的合成Q。R(简记QR)为: QR=(a,b): 对于某个c,(a,c)Q且(c,b)R 注意:两个函数f: A|B和g: B|C的合成是一个函数h: A|C, 使得对每一个aA,h(a)=g( f(a) ) 1.3、特殊类型的二元关系、特殊类型的二元关系 1、AA的二元关系二元关系 设A是一个集合,R AA是A上的一个二元关系,可以用一个有向 图表示关系R。 A的每一个元素用一个小圆圈表
24、示(叫做有向图的顶点),从a到b画一 个箭头当且仅当(a,b)R,这些箭头是该有向图的边。 例如:用图1-1中图表示关系R= (a,b),(b,a),(a,d),(d,c),(c,c),(c,a) a d c b 图1-1 二元关系的有向图表示 自反关系自反关系:如果对于每一个aA,(a,a)R,则称关系R AA 是自反自反的 对称关系对称关系:如果只要(a,b)R就有(b,a)R,则称关系R AA 是对称对称的 没有(a,a)形式的有序对的对称关系可以表示成或称。 反对称关系反对称关系:如果当(a,b)R且ab时,(b,a)R,则称关系R是反对称反对称的 传递关系传递关系:如果只要(a,b)
25、R且(b,c)R就有(a,c)R ,则称关系R是传递传递的 等价关系等价关系:把自反、对称、传递的关系叫做等价关系等价关系。如书上图1-6。 等价类等价类:表示等价关系的无向图由若干个集团组成,把等价关系的这种集团 叫做等价类等价类。 定理1.3.1 设R是非空集合A上的等价关系,则R的等价类构成A的一个划分。 (证明:利用等价关系性质采用反证法,略) 另外,由于二元关系R可以表示成图,所以也有类似于图的、。 1.4、有穷集合与无穷集合 :如果存在双射函数f: A|B,则称集合A与B等势。 :一般的,如果对某个自然数n,一个集合与1,2,n等势, 则称这个集合是有穷的有穷的。 :如果一个集合不
展开阅读全文