融入句型信息的汉英双向调序模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《融入句型信息的汉英双向调序模型课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融入 句型 信息 汉英 双向 模型 课件
- 资源描述:
-
1、1融入句型信息的汉英双向调序模融入句型信息的汉英双向调序模型型 张家俊、宗成庆 中科院自动化所 2008.11.282背景o 自从IBM翻译模型的提取,特别是基于短语的翻译模型提出后,调序模型始终是统计机器翻译的关键问题,是研究的热点o 从基于距离的扭曲模型、词汇化的调序模型到层次化的短语翻译模型、最大熵调序模型,都非常有效地提高了翻译质量3想法o 这些模型没有充分利用语言所固有的语法信息,在不需要调序的地方浪费了大量的计算时间o 这些模型没有充分利用句子的先验知识,譬如句型,因为不同的句型具有不同的调序策略4句型在调序中的作用o 几个例子:5句型调序分析o 特殊疑问句中至少有一固定的短语(我
2、们称为特殊疑问短语)在翻译成英语时通常出现在句首;o 一般疑问句在翻译时有特定的例如can,do,is等引导词;o 在非疑问句中,有很大比例的句子中出现介词短语、时间地点短语,这些短语在汉语中出现在动词前,而在翻译时一般出现在动词的后面6口语语料分析o 我们分析277k 中英对齐句对发现,大约 17.2%是特殊疑问句,约 25.5%为一般疑问句,其余为非疑问句。o 可见在口语翻译中,基于句型的调序是非常有意义且具有研究价值的7基于句型调序的翻译框架(汉英)英 语 输出C1C3C2汉 语 输入句子后向、前向调序模型 后向调序模型翻译引擎分类器后向调序模型8基于句型调序的翻译框架(英汉)o C1、
3、C2和C3的意义同上图,“逆”表示与上图的算法相似但调序方向相反 C1C3C2英 语 输入句子逆后向、前向调序模型 逆后向调序模型汉语结果输出分类器逆后向调序模型英 汉 翻译引擎9模型与算法o 句型的分类算法:SVM-basedo 前向调序模型、逆前向调序模型o 后向调序算法、逆后向调序模型10句型分类算法o SVM的优势,分类准确,几乎不受标点的影响(我们知道标点是句型关键性的特征)o 实验:n 语料:三类句型分别问1000句,80%作为训练,20%作为测试n 实验结果:11前向调序模型o 适用句型:特殊疑问句o 调序对象:特殊疑问短语o 调序的两个关键问题:u 特殊疑问短语的识别u 正确的
4、调序位置12调序的两个关键问题o 特殊疑问短语的识别u 我们在语法上给特殊疑问短语一个定义:包含特殊疑问词的完整的语法成分。u 特殊疑问词是利用互信息得到的一个闭集:什么、哪、多(多长、多久)、怎、谁、几、为什么、何u 在汉语中,从语法层面看来,特殊疑问短语可能会是任何一类语法成分,从语法层无法识别u 我们采用chunking的浅层句法分析来识别特殊疑问短语13调序的两个关键问题o 正确的调序位置u 分析翻译实例我们发现,调序的位置分为3类:句首、子句首、特定模板短语(从对齐语料习得)后u 分别举例:这个 味道 怎么样?=怎么样 这个 味道?请问,去 海滩 怎么 走?=请问,怎么 走去 海滩?
展开阅读全文