1形式语言与自动机-2015-第01讲-概论.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《1形式语言与自动机-2015-第01讲-概论.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 形式语言 自动机 2015 01 概论
- 资源描述:
-
1、形式语言与自动机形式语言与自动机Formal Languages and Automata Theory教师:胡春明、赵永望、邓婷教师:胡春明、赵永望、邓婷课程定位:课程定位:揭示计算机科学与技术学科中计算的揭示计算机科学与技术学科中计算的本质问题本质问题 什么能且如何什么能且如何被(有效地)自动计算。被(有效地)自动计算。主要讨论计算机理论与应用中常用的各语言类对应的主要讨论计算机理论与应用中常用的各语言类对应的计算模型计算模型以及以及模型之间的联系与相互转换模型之间的联系与相互转换。形式语言与自动机形式语言与自动机课程目的:课程目的: 培养计算机科学方面的理论素养,提高逻辑思维和培养计算机
2、科学方面的理论素养,提高逻辑思维和解决相关问题的解决相关问题的能力,为今后从事科学研究或技术开发打下扎实的基础。能力,为今后从事科学研究或技术开发打下扎实的基础。教材教材: : 1 1、形式语言与自动机理论(第二版),蒋宗礼等,清华出版社,形式语言与自动机理论(第二版),蒋宗礼等,清华出版社,20072007参考教材:参考教材: 2、形式语言与自动机理论形式语言与自动机理论”,吴哲辉等编著,机械工业出版社,吴哲辉等编著,机械工业出版社,2008 “自动机理论、语言和计算导论自动机理论、语言和计算导论”,孙家啸等译,机械工业出版社,孙家啸等译,机械工业出版社形式语言与自动机形式语言与自动机前续课
3、程:前续课程: 离散数学离散数学 数理逻辑、集合论等数理逻辑、集合论等MOOCMOOC素材素材: : 1 1、自动机、自动机(Automate(Automate),斯坦福大学),斯坦福大学CS154CS154 http:/ 形式语言与自动机形式语言与自动机形式文法与自动机理论的发展概况形式文法与自动机理论的发展概况学习意义与课程特点学习意义与课程特点课程教学内容与前期准备课程教学内容与前期准备符号语言符号语言第一章第一章 课程概述及预备知识课程概述及预备知识形式语言与自动机理论的发展概况形式语言与自动机理论的发展概况何为形式语言何为形式语言形式语言的研究概况形式语言的研究概况计算模型相关研究领
4、域计算模型相关研究领域何为何为“语言语言”:斯大林斯大林 语言是人们所理解的字和组合这些字的方法。语言是人们所理解的字和组合这些字的方法。韦波斯特韦波斯特 语言是为大范围人群懂得、并能使用的字符以语言是为大范围人群懂得、并能使用的字符以及组合这些字符的方法的一个统一体。及组合这些字符的方法的一个统一体。形式语言形式语言语言:语言:自然语言(自然语言( 英语、汉语)、英语、汉语)、 符号语言(符号语言( 程序设计语言、标记语言、算法程序设计语言、标记语言、算法 等)等)形式语言形式语言 元语言:元语言:用数学方法将符号语言抽象成一个数学系统,对其进行严格用数学方法将符号语言抽象成一个数学系统,对
5、其进行严格的形式化定义,并构建适当的描述模型,发展相关的知识和的形式化定义,并构建适当的描述模型,发展相关的知识和理论,使之在科学实践中具有良好的指导作用。理论,使之在科学实践中具有良好的指导作用。形式语言形式语言形式语言与自动机理论的发展概况形式语言与自动机理论的发展概况何为形式语言何为形式语言形式语言的研究概况形式语言的研究概况计算模型相关研究领域计算模型相关研究领域 数理语言学家致力于用数学方法研究数理语言学家致力于用数学方法研究自然语言自然语言的结构,试的结构,试图用计算机模拟。图用计算机模拟。研究概况研究概况 1956年,宾夕法尼亚大学的语言学家年,宾夕法尼亚大学的语言学家 N. C
6、homsky 第一次第一次提出用形式语言研究自然语言的方法。提出用形式语言研究自然语言的方法。N. Chomsky 关于关于用形式文法派生语言的思路用形式文法派生语言的思路: 一组有限多个符号构成的集合一组有限多个符号构成的集合 ,称为字母表,称为字母表 ; 中所有符号串构成集合中所有符号串构成集合 *, * 每一个子集可视为每一个子集可视为上的一个语言上的一个语言 L; 一个语言一个语言 L(所有句子)(所有句子) 可以按照文法可以按照文法 G L 的一系列描的一系列描述规则(算法)形式化地派生出来。述规则(算法)形式化地派生出来。并给出了并给出了文法的乔姆斯基(文法的乔姆斯基(Chomsk
7、y)体系。)体系。研究概况研究概况0 型文法(短语结构文法或无限制文法)型文法(短语结构文法或无限制文法)1 型文法(上下文有关文法)型文法(上下文有关文法)2 型文法(上下文无关文法)型文法(上下文无关文法) 3 型文法(正则文法)型文法(正则文法)派生符号语言的乔姆斯基(派生符号语言的乔姆斯基(Chomsky)文法体系:)文法体系:研究概况研究概况研究概况研究概况 1936年,英国数学家阿兰年,英国数学家阿兰.图灵图灵(A. M. Turing, 1912-1954)提出提出一种抽象计算模型一种抽象计算模型 图灵机图灵机( TM ),能根据,能根据内部状态,在一个无限内部状态,在一个无限长
8、磁带上进行读、写、移动等简单操作,计算所有可计算的函数;长磁带上进行读、写、移动等简单操作,计算所有可计算的函数;是是模拟计算机算法的计算逻辑和研究可计算性的形式化描述工具。模拟计算机算法的计算逻辑和研究可计算性的形式化描述工具。 TM 的两个基本性质的两个基本性质: 计算对象能用有穷方式描述计算对象能用有穷方式描述; 计算过程必须由一系列离散的、可以机械执行的步骤组成。计算过程必须由一系列离散的、可以机械执行的步骤组成。识别符号语言的识别符号语言的 A. Turing自动机体系:自动机体系:基本的图灵机模型的物理装置:基本的图灵机模型的物理装置:控制器:左右移动、读字符、修改方格字符、改变控
9、制器状态控制器:左右移动、读字符、修改方格字符、改变控制器状态 ; 模拟计算机的基本操作。模拟计算机的基本操作。装置改进:装置改进:单带多道;子程序功能;单带无穷;多带;多维;通用 TM。研究概况研究概况研究概况研究概况1943年,年,McCulloch-Pitts神经模型:莫克罗神经模型:莫克罗(WSMcCulloch)和彼特()和彼特(WPitts)1951- 1956年,数学家克林(年,数学家克林(Kleene):研究神经细胞):研究神经细胞时,基于图灵机建立了确定有穷状态自动机时,基于图灵机建立了确定有穷状态自动机 DFA,用其,用其识别语言;识别语言; 并证明并证明DFA与与RE的等
10、价性。的等价性。 1957年,年,米凯尔米凯尔.拉宾拉宾 & 达纳达纳.斯科特斯科特(Dana Stewart Scott,1976年图灵奖年图灵奖)将确定状态自动机)将确定状态自动机 DFA 扩展为扩展为非确定有穷状态自动机非确定有穷状态自动机 NFA,从而,从而简化了机器的描述建简化了机器的描述建模过程,提高了解题(识别语言)速度,模过程,提高了解题(识别语言)速度,为其在机器翻为其在机器翻译、文献检索的语言识别及符号处理等中的应用奠定了译、文献检索的语言识别及符号处理等中的应用奠定了基础。基础。识别符号语言的识别符号语言的 A. Turing 自动机体系:自动机体系:问题:问题:给定的给
11、定的形式文法形式文法和和自动机自动机描述的是否是同一符号语言;两种形式化描述的是否是同一符号语言;两种形式化方法是否等价;如何证明?二者能否在等价基础上相互模拟与转换?方法是否等价;如何证明?二者能否在等价基础上相互模拟与转换?如何证明这种转换的正确性?如何实现转换的形式化和自动化,即,如何证明这种转换的正确性?如何实现转换的形式化和自动化,即,是否能用计算机的算法实现?是否能用计算机的算法实现? 1959年,年,N.乔姆斯基发现:文法和自动机分别从派生和识别角度乔姆斯基发现:文法和自动机分别从派生和识别角度表达语言,并证明文法和自动机的等价性,开启了用数学方法研表达语言,并证明文法和自动机的
12、等价性,开启了用数学方法研究形式语言的先河。究形式语言的先河。研究概况研究概况0 型文法(无限制文法)型文法(无限制文法) 图灵机图灵机 1 型文法(上下文有关文法)型文法(上下文有关文法) 线性有界自动机线性有界自动机 2 型文法(上下文无关文法)型文法(上下文无关文法) 下推自动机下推自动机 3 型文法(正则文法)型文法(正则文法) 有穷状态自动机有穷状态自动机 两种计算模型的对应关系:两种计算模型的对应关系:研究概况研究概况1977 Amir Pnueli.将自动机与逻辑建立关系,基于此发展将自动机与逻辑建立关系,基于此发展了模型检测技术了模型检测技术 * 判定性、复杂性、表达能力判定性
13、、复杂性、表达能力研究概况研究概况形式语言与自动机理论的发展概况形式语言与自动机理论的发展概况何为形式语言何为形式语言形式语言的研究概况形式语言的研究概况计算模型相关研究领域计算模型相关研究领域计算模型相关研究领域计算模型相关研究领域1 1、可计算性问题的提出:、可计算性问题的提出:希尔伯特(希尔伯特(D. Hilbert, 1862-1943D. Hilbert, 1862-1943)纲领)纲领 是否对各个数学分支都能建立一套形式化的公理系统,使得所涉及领域是否对各个数学分支都能建立一套形式化的公理系统,使得所涉及领域内的任何命题,都可通过系统的有限步推导,判断命题是否正确。内的任何命题,都
14、可通过系统的有限步推导,判断命题是否正确。2 2、存在不可判定命题:、存在不可判定命题:歌德尔(歌德尔(K. Godel, 1906-1978K. Godel, 1906-1978) 在包含初等数论的协调的形式系统中,存在不可判定问题;即,存在包含初等数论的协调的形式系统中,存在不可判定问题;即,存在一个命题在一个命题 A A,无法在该系统内证明,无法在该系统内证明 A A 或或 A A 为真。为真。3 3、可计算问题转换为:、可计算问题转换为: 是否存在这样一种抽象的形式系统,它可以衡量什么问题是可以判定是否存在这样一种抽象的形式系统,它可以衡量什么问题是可以判定(可计算)的,什么问题是不可
15、判定(不可计算)的。(可计算)的,什么问题是不可判定(不可计算)的。若干可计算模型:若干可计算模型:1 1、英国数学家图灵、英国数学家图灵 1936 1936 年提出图灵机年提出图灵机 2 2、赫尔布拉德、赫尔布拉德(1932)(1932)、哥德尔(、哥德尔(19361936)、克林尼()、克林尼(19361936)提出一般递归函数)提出一般递归函数 3 3、邱奇(、邱奇(1933-1935 1933-1935 )提出)提出 - - 演算演算 成果:成果:1 1、邱奇证明:一般递归函数、邱奇证明:一般递归函数 同同 - - 可定义的等价性;可定义的等价性;2 2、克林尼证明:图灵可计算、克林尼
16、证明:图灵可计算 同同 - - 可定义的等价性;可定义的等价性;邱奇邱奇 - - 图灵论题:图灵论题:一个函数是可计算的当且仅当它是图灵机可计算的一个函数是可计算的当且仅当它是图灵机可计算的(或(或 - - 可定义的)。可定义的)。计算模型的相关研究领域计算模型的相关研究领域形式文法与自动机理论的发展概况形式文法与自动机理论的发展概况学习意义与课程特点学习意义与课程特点课程教学内容与前期准备课程教学内容与前期准备符号语言符号语言第一章第一章 课程概述及预备知识课程概述及预备知识一、深化计算机基础理论学习:一、深化计算机基础理论学习: 1、形式语言形式语言为计算机程序语言编译过程提供了理论基础;
17、 3、有限状态自动机有限状态自动机为数字逻辑电路等设计提供了描述手段; 2、图灵机模型图灵机模型为计算机的计算理论提供了模型基础。学习意义学习意义与课程特点与课程特点三、人才培养:三、人才培养: 形式语言与自动机理论对于计算机领域人才的计算思维能力的培养起到至关重要的作用。二、应用拓展:二、应用拓展: 1、在人工智能的自然语言理解与翻译、WEB服务标注语言词法及语法结构与模式识别等方面有着广泛的应用。 2、为操作系统的状态变换,网络状态描述等各种模型系统的建模提供方法。学习意义学习意义与课程特点与课程特点“计算思维能力计算思维能力”梯级式训练过程:梯级式训练过程:学习意义学习意义与课程特点与课
18、程特点本课程强调:本课程强调:1、抽象性:抽象性:形式语言研究如何利用数学方法抽象出符号语言的结构特征及相关的文法规则;自动机理论研究各种能自动处理符号串的计算模型;二者描述的理论基础是离散数学,内容具有一定抽象性。2、构造性:构造性:课程包含大量的构造性内容,如给定语言构造生成语言的形式文法或识别语言的自动机;给定文法构造等价的自动机等3、理论性:理论性:形式语言与自动机理论的大部分内容属于理论形态,拥有完整的理论体系;包含许多定义、定理及其相关的递归证明。学习意义与学习意义与课程特点课程特点形式文法与自动机理论的发展概况形式文法与自动机理论的发展概况学习意义与课程特点学习意义与课程特点课程
展开阅读全文