自然语言理解句法分析算法..课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《自然语言理解句法分析算法..课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 理解 句法 分析 算法 课件
- 资源描述:
-
1、句法分析算法上海交通大学陈玉泉第1页,共49页。内容提要n概述n带回溯的LR 分析法nCYKnEarley nChart Parsing第2页,共49页。概述第3页,共49页。程序设计语言分析算法n递归下降nLLnLR第4页,共49页。特点n高效n排歧策略简单nFirst集nFollow集n算符优先级第5页,共49页。自然语言文法的特点n歧义n歧义最大数量:n真歧义和伪歧义n咬死猎人的狗(v n 的 n)n建设公路的需要(v n 的 n)n他和我的爸爸(r 和 r 的 n)n他和他的爸爸(r 和 r 的 n)第6页,共49页。算法应该n容纳歧义n允许二义文法n任何可能结果都应计算到n高效n在多
2、项式时间内得到结果n具备排序机制,启发式搜索策略第7页,共49页。一些算法n自顶向下n自底向上n带回溯的LR 分析法nCYKnEarley nChart Parsing第8页,共49页。使用的例子n输入:n一/m 张/q 火车/n 票/nn文法:nNP NP NP(1)nNP MP NP(2)nNP n(3)nMP m q(4)第9页,共49页。期望分析结果第10页,共49页。Top-down自顶向下的方法又称为基于预测的方法。这种方法是先产生对后面将要出现的成分的预期,然后再通过逐步吃进待分析的字符串来验证预期。n如果预期得到了证明,就说明待分析的字符串可以被分析为所预期的句法结构。n如果某
3、一个环节上预期出了差错,那就要用另外的预期来替换(即回溯)。n如果所有环节上所有可能的预期都被吃进的待分析字符串所“反驳”,那就说明待分析的字符串不可能是一个合法的句子,分析失败。第11页,共49页。Top-downNP MPNPNP MP NP(2)第12页,共49页。Top-downNPNPNPNP MP NP(s)MP m q(4)mq一张第13页,共49页。Top-downNPNPNPNP MP NP(s)MP m q(4)mq一张NPNPnNP NP NP(1)第14页,共49页。Top-downNPNPNPNP MP NP(s)MP m q(4)mq一张NPNPnNP NP NP(
4、1)nn火车票第15页,共49页。Bottom-up自底向上的方法也叫基于归约的方法。这种方法是先逐步吃进待分析字符串,把它们从局部到整体层层归约为可能的成分。n如果整个待分析字符串被归约为开始符号S,那么分析成功。n如果在某个局部证明不可能有任何从这里把整个待分析字符串归约为句子的方案,那么就需要回溯。n如果经过回溯始终无法将待分析字符串归约为S,那么分析失败。第16页,共49页。Bottom-up一张火车票mqnn第17页,共49页。Bottom-up一张火车票mqnnMP第18页,共49页。Bottom-up一张火车票mqnnMPNP第19页,共49页。Bottom-up一张火车票mqn
5、nMPNPNP第20页,共49页。Bottom-up一张火车票mqnnMPNPNPNP第21页,共49页。Bottom-up一张火车票mqnnMPNPNPNPNP第22页,共49页。带回溯的LR第23页,共49页。组成部分nShift-Reduce-Goto 表n分析栈n输入队列n引入备份状态,解决移进规约冲突第24页,共49页。LR 分析表的构造n0nS .NPnNP .NP NPnNP .nnNP .MP NPnMP .m qn4nS NP.nNP NP.NPnNP .NP NPnNP .nnNP .MP NPnMP .m qn3nNP MP.NPnNP .NP NPnNP .nnNP .
6、MP NPnMP .m qn5nNP MP NP.nNP NP.NPnNP .NP NPnNP .nnNP .MP NPnMP .m qn6nNP NP NP.nNP NP.NPnNP .NP NPnNP .nnNP .MP NPnMP .m qn1nMP m.qn2nMP m q.n7nNP n.第25页,共49页。过程nThe Shift-reduce Table and the parsing processstatusmqn$NPMP0s1s7431s22r4r4r4r43s1s7534s1s7acc635s1 r2r2s7 r2r2636s1 r1r1s7 r1r1637r3r3r3
7、r3StackInput QueueBackup Status$0 m q n n$0 m 1q n n$0 m 1 q 2n n$0 MP 3n n$0 MP 3 n 7n$0 MP 3 NP 5n$0 MP 3 NP 5 n 7$($0 NP 4)(n$)$0 MP 3 NP 5 NP 6$($0 NP 4)(n$)$0 MP 3 NP 5$($0 NP 4)(n$)$0 NP 4$($0 NP 4)(n$)$0 acc$($0 NP 4)(n$)$0 NP 4 n$0 NP 4 n 7$0 NP 4 NP 6$0 NP 4$0 acc$(1)NP NP NP(2)NP MP NP(3)N
8、P n(4)MP m q第26页,共49页。过程(cont.)$0 m q n n$0 m 1q n n$0 m 1 q 2n n$0 MP 3n n$0 MP 3 n 7n$0 MP 3 NP 5 n$0 MP 3 NP 5 n 7$0 MP 3 NP 5 NP 6$0 MP 3 NP 5$0 NP 4$0 acc$0 NP 4n$0 NP 4 n 7$0 NP 4 NP 6$0 NP 4$0 acc$第27页,共49页。算法分析n类似深度优先搜索n如果改变备份栈顺序,可以实现其它搜索策略。(agenda)n自底向上n复杂度为指数n思考:有没有办法变成多项式?(GLR)第28页,共49页。C
展开阅读全文