第10章自然语言理解及其应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第10章自然语言理解及其应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 10 自然语言 理解 及其 应用 课件
- 资源描述:
-
1、第第 10 章章 自然语言理解及其应用自然语言理解及其应用 教材:教材:王万良人工智能及其应用(第王万良人工智能及其应用(第2版版)高等教育出版社,高等教育出版社,2008.6第10章 自然语言理解及其应用10.1 自然语言理解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别第10章 自然语言理解及其应用10.1 自然语言理解的概念与发展历史自然语言理解的概念与发展
2、历史 10.2 语音分析语音分析10.3 词法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别10.1.1 自然语言理解的概念微观角度:从自然语言到机器内部的一个映射。微观角度:从自然语言到机器内部的一个映射。宏观角度:使机器能够执行人类所期望的某种语言宏观角度:使机器能够执行人类所期望的某种语言功能。功能。(1)回答问题:计算机正确地回答用自然语言输入的有关问)回答问题:计算机正确地回答用自然语言输入的有关问题。题。(2)文摘生成:机器能产生输入文
3、本的摘要。)文摘生成:机器能产生输入文本的摘要。(3)释义:机器能用不同的词语和句型来复述输入的自然语)释义:机器能用不同的词语和句型来复述输入的自然语言信息言信息。(4)翻译:机器能)翻译:机器能把一种语言翻译成另外一种语言。把一种语言翻译成另外一种语言。10.1.2 自然语言理解研究的产生与发展 1.萌芽时期萌芽时期(20世纪世纪40年代末年代末50年代初)年代初)2.以关键词匹配技术为主的时期以关键词匹配技术为主的时期(20世纪世纪60年代始年代始)A.Donald Booth&W.Weaver M.Chomsky 形式语言和文法形式语言和文法3.以句法语义分析技术为主的时期以句法语义分
4、析技术为主的时期(20世纪世纪70年代后)年代后)4.基于知识的自然语言理解发展时期基于知识的自然语言理解发展时期 5.基于大规模语料库的自然语言理解发展时期基于大规模语料库的自然语言理解发展时期 68年B.Raphael:语义检索系统SIRJ.Weizenbaum:心理医疗ELIZA 72年W.Woods:语音接口LUNART.Winograd:英语对话SHEDLU第10章 自然语言理解及其应用10.1自然语言理解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模
5、真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别文字表达句子的层次:词素词或词形词组或句子。声音表达句子的层次:音素音节音词音句。语言处理过程分为五个层次:语音分析、词法分析、句法分析、语义分析和语用分析。语用分析:研究语言所存在的外界环境对语言使用产语用分析:研究语言所存在的外界环境对语言使用产生的影响。生的影响。构成单词发音的独立单元是音素。上下文不同而发音不同。语音分析就是根据音位规则,从语言流中区分出一个个独立的音素,再根据音位形态规则找出一个个音节及其对应的词素或词。10.2 语音分析第10章 自然语言理解及其应用10.1自然语言理
6、解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别10.3 词法分析 定义定义:从句子中切分出单词,找出词汇的各个词素,并确定其词义。例:例:unchangeable:un-change-able 英语词法分析英语词法分析 特点:切分单词容易,找出词素复杂。特点:切分单词容易,找出词素复杂。例:例:importable分为分为 import-able或或 im-po
7、rt-able词法分析算法举例:词法分析算法举例:repeatlook for word in dictionary if not found then modify the wordUntil word is found or no further modification possible 10.3 词法分析例如例如:对于单词对于单词catches、ladies可以做如下的分析。可以做如下的分析。catches ladies,词典中查不到词典中查不到 catche ladie 修改修改1:去掉:去掉s catch ladi 修改修改2:去掉:去掉e lady 修改修改3:把:把i变成变成y
8、这样,在修改这样,在修改2的时候,就可以找到的时候,就可以找到catch,在修改,在修改3的时候就可以找到的时候就可以找到lady。例如:优秀人才学人才学例如:优秀人才学人才学1.优秀人才学人才学优秀人才学人才学2.优秀人才学人才学优秀人才学人才学 汉语词法分析汉语词法分析 特点:找出词素简单,切分出词困难。ly副词后辍;ed动词过去分词第10章 自然语言理解及其应用10.1自然语言理解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规
9、模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别10.4 句法分析10.4.1 乔姆斯基的形式文法乔姆斯基的形式文法 10.4.2 句法分析树句法分析树10.4.3 转移网络转移网络10.4.4 扩充转移网络扩充转移网络10.4.1 乔姆斯基的形式文法1950年提出,表示形式:年提出,表示形式:G=(T,N,S,P)T:终结符集合:终结符集合 N:非终结符集合:非终结符集合 S:起始符:起始符 P:产生式规则集:产生式规则集 T=(the,man,killed,a,deer,likes)N=(S,NP,VP,N,ART,V,Prep,PP)S=S P:(1)SNP+VP
10、(2)NPN (3)NPART+N (4)VPV (5)VPV+NP (6)ARTthe|a (7)Nman|deer (8)Vkilled|likes例例 1 G=(T,N,S,P)n 1型文法型文法:上下文有关文法上下文有关文法n 2型文法:上下文无关文法型文法:上下文无关文法 n 3型文法:正则文法型文法:正则文法 左左线性文法:线性文法:ABt 或或 At(ABtCt*t)右线性文法右线性文法:AtB或或At产生式规则产生式规则:xy 产生式规则产生式规则:xy例:例:ABCDE ABCDE XaYXbY 产生式规则:产生式规则:Axn 0型文法:无约束短语结构文法型文法:无约束短语结
11、构文法10.4.1 乔姆斯基的形式文法10.4.2 句法分析树 例如例如:The man killed a deer.S NP+VP ART+N+VP The man+VP The man+V+NP The man killed+NP The man killed+ART+N The man killed a deer.在对一个句子进行分析的过程中,如果把分析句子各在对一个句子进行分析的过程中,如果把分析句子各成分间关系的推导过程用树形图表示出来,那么这种图成分间关系的推导过程用树形图表示出来,那么这种图称为句法分析树。称为句法分析树。10.4.2 句法分析树句法分析树举例句法分析树举例10.
12、4.3 转移网络例:例:转移网络的一般结构转移网络的一般结构由结点和带有标记的弧构成,其中结点表示状态,弧对由结点和带有标记的弧构成,其中结点表示状态,弧对应于符号,实现从一个状态转移到另一个状态。应于符号,实现从一个状态转移到另一个状态。开始状态中间状态终止状态NPVP开始状态开始状态中间状态中间状态终止状态终止状态ARTNVNPVNSNP+VPNPART+NNPNNPV+NPNPV10.4.3 转移网络例例 The man laughed.10.4.4 扩充转移网络ATN(augmented transition network)ATN由一组转移网络组成:每个由一组转移网络组成:每个TN都
13、有一个网络名,都有一个网络名,弧上的条件扩充为条件加上操作。由寄存器的方式实现。弧上的条件扩充为条件加上操作。由寄存器的方式实现。数:单数和复数,缺省为空数:单数和复数,缺省为空 ATN的寄存器构成:句法特征寄存器和句法功能寄存器。的寄存器构成:句法特征寄存器和句法功能寄存器。n 特征寄存器:每一维特征都由一个特征名和一组特征特征寄存器:每一维特征都由一个特征名和一组特征值以及一个缺省值来表示。值以及一个缺省值来表示。n 功能寄存器:反映了句法成分之间的关系和功能功能寄存器:反映了句法成分之间的关系和功能。10.4.4 扩充转移网络短语(短语(NP)的扩充转移网络)的扩充转移网络:fg A:N
14、umber*.Number gh C:Number*.Number or q 应用:检查应用:检查NP中数的一致问题,其中特征是中数的一致问题,其中特征是“数数”,值为单数和复数。值为单数和复数。C是弧上的条件,是弧上的条件,A是弧上的操作。是弧上的操作。*是当前值。是当前值。q this book,the book,the books,these books 可以顺利可以顺利通过,而通过,而this books或或these book就无法通过。就无法通过。第10章 自然语言理解及其应用10.1 自然语言理解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词
15、法分析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别10.5 语义分析 语义分析是将句法成分与应用领域中的目标表示语义分析是将句法成分与应用领域中的目标表示相关联。相关联。简单做法:依次使用独立的句法分析程序和语义解释程序。缺点:使句法分析、语义分析分离语义文法格文法10.5.1 语义文法 语义文法是将文法知识和语义知识组合起来,以统语义文法是将文法知识和语义知识组合起来,以统一的方式定义为文法规则集。一的方式定义为文法规则集。舰船信息:SPRESEN
16、T the ATTRIBUTE OF SHIPPRESENTWhat is|Can you tell meATTRIBUTElength|classSHIPthe SHIPNAME|CLASSNAMESHIPNAMEHUANGHE|CHANGJIANGCLASSNAMEcarrier|submarine10.5.2 格文法 目的:目的:为了找出动词和跟动词处在结构关系中的名词的为了找出动词和跟动词处在结构关系中的名词的语义关系,同时也涉及动词或动词短语与其他的各种名词语义关系,同时也涉及动词或动词短语与其他的各种名词短语之间的关系。短语之间的关系。特点:允许以动词为中心构造分析结果,尽管文法规
17、则特点:允许以动词为中心构造分析结果,尽管文法规则只描述句法,但分析结果产生的结构却对应于语义关系,只描述句法,但分析结果产生的结构却对应于语义关系,而非严格的句法关系。而非严格的句法关系。例:例:Mary hit Bill Bill was hit by Mary (Hit(Agent Mary)(Dative Bill)10.5.2 格文法SSNPNPVPVPVNPVPPBillMaryhitwas hitbyBillMary主动句和被动句的句法分析树第10章 自然语言理解及其应用10.1 自然语言理解的概念与发展历史自然语言理解的概念与发展历史 10.2 语音分析语音分析10.3 词法分
18、析词法分析10.4 句法分析句法分析10.5 语义分析语义分析 10.6 基于语料库的大规模真实文本的处理基于语料库的大规模真实文本的处理 10.7 机器翻译机器翻译10.8 语音识别语音识别10.6.1 语料库及其特征1990年l 3届国际计算机语言学大会提出大规模真实文本目标基于规则方法的缺点:自然语言理解的复杂性,各种基于规则方法的缺点:自然语言理解的复杂性,各种知识的知识的“数量数量”繁多,高度的不确定性和模糊性。繁多,高度的不确定性和模糊性。传统词典特征及不足:传统词典特征及不足:l 特征:把各类不同的信息放入一个词汇单元中,包特征:把各类不同的信息放入一个词汇单元中,包括拼音、读音
展开阅读全文