自然语言理解讲义第三章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《自然语言理解讲义第三章课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 理解 讲义 第三 课件
- 资源描述:
-
1、自然语言理解讲义自然语言理解讲义第三章第三章 特征与扩充文法特征与扩充文法主要内容主要内容o 特征系统与扩充文法特征系统与扩充文法o 英语基本特征系统英语基本特征系统o 词语形态分析与词典词语形态分析与词典o 一个带特征的文法及其分析一个带特征的文法及其分析o 扩充转移网络扩充转移网络o 通用特征系统与合一文法通用特征系统与合一文法特征系统与扩充文法特征系统与扩充文法(1)o语言中成分之间的搭配需要满足一定的约束,普通的上下语言中成分之间的搭配需要满足一定的约束,普通的上下文不容易处理这样的情况,需要进行扩充。例如,对于规文不容易处理这样的情况,需要进行扩充。例如,对于规则则NPART N,在
2、处理英语句子时可改写为,在处理英语句子时可改写为 NP-sART-s N-s 及及 NP-pART-p N-ps与与p分别表示单数与复数。分别表示单数与复数。这样显然很麻烦。这样显然很麻烦。o另一种方法是定义成分的特征。例如用特征另一种方法是定义成分的特征。例如用特征NUMBER(取取值可以是值可以是s(单数单数)或或p(复数复数)可对上诉特征进行如下扩充可对上诉特征进行如下扩充 NPART N仅当NUMBER1与NUMBER2一致时适用 特征系统与扩充文法特征系统与扩充文法(2)更方便的是使用一种更方便的是使用一种特征结构特征结构(feature structure)来定义成分。来定义成分。
3、一特征结构是一个从特征到定义某成分的相关特征的值的映射。例如,一特征结构是一个从特征到定义某成分的相关特征的值的映射。例如,冠词冠词a的特征结构可表示为的特征结构可表示为ART1:(CAT ART ROOT a NUMBER s)通常词性特征的名省略。于是上述特征结构又可表示为 ART1:(ART ROOT a NUMBER s)特征系统与扩充文法特征系统与扩充文法(3)o 某些复杂特征结构的特征值可以是另一特征结构。这时需要用一些特殊的特征名:1、2、3等等,来表示第一个子成分、第二个子成分、第三个子成分。例如名词短语a fish的特征结构可表示如下NP1:(NP NUMBER s 1(AR
4、T ROOT a NUMBER s)2(N ROOT fish NUMBER s)也可以用后面的分析树的形式来表示。特征系统与扩充文法特征系统与扩充文法(4)fishssaROOTROOTNUMBERNUMBER21ARTNNUMBERNPs特征系统与扩充文法特征系统与扩充文法(5)o 扩充文法中的重写规则将采用特征结构。而且,规则中的特征值往往需要采用变量的形式,例如关于简单名词短语的规则可表示为(NP NUMBER?n)(ART NUMBER?n)(N NUMBER?n)这就是说,NP成分可以包含两个子成分,其中第一个子成分是ART,第二个是N;而这三个成分的NUMBER(数)特征必须相同
5、。在规则中引入特征值变量,使规则的适用范围更广泛。特征系统与扩充文法特征系统与扩充文法(6)o 根据这条规则,NP1是合法的成分。而 *(NP 1(ART NUMBER s)2(N NUMBER s)不能被规则所接受,因为NP没有NUMBER特征。成分 *(NP NUMBER s 1(ART NUMBER s)2(N NUMBER p)也不合理,因为N的NUMBER特征的值与其他成分的NUMBER特征值不同。特征系统与扩充文法特征系统与扩充文法(7)o 变量在表达成分的二义性方面也很有用。例如单词fish既可以是单数也可以是复数,这样在词典中可表示为 (N ROOT fish NUMBER?n
6、)以说明fish的NUMBER特征可取(取值范围内的)任意值。o 在更多情况下,某特征能取的值是一个范围(可能取值集合的子集),而不是任意值。这时可采用约束变元约束变元来进行表示:在变元后面用一个表将变元能取的值全部列出来。例如?ns p表示变元?n只能取值s或p。因而单词fish可表示为 (N ROOT fish NUMBER?ns p)甚至简单表示为(N ROOT fish NUMBER s p)英语基本特征系统英语基本特征系统(1)o 人称和数人称和数 主语和(主)动词除了在数上要一致以外,在人称(person)上也要一致。特征person的可能值包括:第一人称(First Person
7、(1):第二人称(Second Person(2):第三人称(Third Person(3):人称和数经常一起出现,所以通常把它们合在一起用一个特征AGR来表示。AGR有6个可能值:第一人称单数(1s),第二人称单数(2s),第三人称单数(3s),第一人称复数(1p),第二人称复数(2p),第三人称复数(3p)。are的AGR特征的取值可为2s,1p,2p,3p。英语基本特征系统英语基本特征系统(2)o 动词形式动词形式 英语中动词有时态的变化,动词形式用特征英语中动词有时态的变化,动词形式用特征VFORM表示,表示,其取值包括:其取值包括:base动词原型动词原型pres一般现在时一般现在时
8、past一般过去时一般过去时fin限定式限定式(finite,等价于,等价于pres,past)ing现在进行时现在进行时pastprt过去完成时过去完成时inf不定式不定式英语基本特征系统英语基本特征系统(3)o 动词次范畴动词次范畴 动词次范畴特征,SUBCAT,用来处理词与其补足语之间的相互作用。为方便记忆,SUBCAT的值由补足语中各部分的主要语法类所组成。若某语法类的值被限定为一特征值,则在类名之后加一冒号,然后紧跟该值。如SUBCAT值_np_vp:inf用来表示由一NP跟一个动词不定式(即VFORM为inf的VP)所组成。而关于VP的规则 (VP)(V SUBCAT _np_vp
9、:inf)(NP)(VP VFORM inf)表示包含一SUBCAT值为_np_vp:inf的动词的VP,动词后面应该有一个NP,然后跟一个VFORM值为inf的VP(即一动词不定式)。英语基本特征系统英语基本特征系统(4)o 动词次范畴动词次范畴 很多动词后面的补语结构需要特定介词的短语,或者具有特定功能的介词短语。下面用PP表示介词短语。而关于PP的特征是PFORM。若PFORM的值为TO,表示介词短语必须以to开头;若值为LOC,则必须是描述地点的PP;若值为MOT,则描述的是路径或运动方向,如We walked to the store.英语基本特征系统英语基本特征系统(5)o 关于L
10、OC与MOT的区别,可比较 Jack put the box in on by the corner.(OK)*Jack put the box to from along the corner.(ill-formed)英语基本特征系统英语基本特征系统(6)值值 动词例子动词例子例句例句_none laughJack laughed._np findJack found a key._np_np giveJack gave Sue the paper._vp:inf wantJack wants to fly._np_vp:inf tell Jack told the man to go._v
11、p:ing keepJack keeps hoping for the best._np_vp:ing catchJack caught Sam looking at his desk._np_vp:base watchJack watched Sam look at his desk.以NP/VP组合为值的SUBCAT 英语基本特征系统英语基本特征系统(7)值值介词例子介词例子 例句例句TOto I gave it to the bank.LOCin,on,by,inside,on top ofI put it on the desk.MOTto,from,along I walked to
12、 the store.介词短语PFORM特征的某些值 英语基本特征系统英语基本特征系统(8)o 有些动词可带从句作补足语。例如,动词tell可带以that开头的从句;这样tell的一个SUBCAT值为_s:that。类似地,wish的补语从句以for开头(We wished for the rain to stop),wish的一个SUBCAT值为_s:for。句子及从句的结构统称S结构。英语基本特征系统英语基本特征系统(9)值值 动词例子动词例子例句例句_np_pp:togive Jack gave the key to the man._pp:loc be Jack is at the s
13、tore._np_pp:locput Jack put the box in the corner._pp:mot go Jack went to the store._np_pp:mottake Jack took the hat to the party._adjp be,seem Jack is happy._np_adjpkeep Jack kept the dinner hot._s:that believe Jack believed that the world was flat._s:for hope Jack hoped the man to win the prize.更多
14、的SUBCAT值 英语基本特征系统英语基本特征系统(10)o 有些特征只有两种可能的取值,称为布尔特征布尔特征。相应的两个特征值用和来表示。例如,我们将用特征INV来表示一个S结构是否为倒装的。句子Jack laughed的S结构的INV特征值是;而句子Did Jack laugh?的S结构的INV特征值是。通常会把布尔特征的值放在特征名之前作为前缀,这样就可以说一个结构具有特征INV或INV。其他布尔特征也可以类似地进行表示。o 在很多情况下给特征指定默认值默认值会很有用,特别是对于布尔特征,经常指定其默认值为。词语形态分析与词典词语形态分析与词典(1)o 词典须包含所有能被使用的不同词的信
15、息,这包括对每个词的相关特征的取值限制。对于多义词,在词典中应该有多个条目,每个条目对应一种用法。o 英语中词语大多遵循一些有规律的词语形态模式。如果没有词语形态分析,词典中就必须包含词的每一种变换形式。例如,动词“want”就需要有六个词条,分别是:want(基本形式和现在时),wants,wanting,wanted(过去时和过去分词形式)。这显然是不必要的。o 实际上,结合前面讲过的有限自动转录机的方法,将句子中词的后缀剥离出来,则词典中只须存储词的基本形式,然后使用上下文无关规则将词与后缀相结合,从而派生出其他词条。词语形态分析与词典词语形态分析与词典(2)o例如下面是产生动词现在时的
16、规则:(V ROOT?r SUBCAT?s VFORM pres AGR 3s)(V ROOT?r SUBCAT?s VFORM base)+S在这里,+S是一种只包含后缀词素“s”的新词类。给定输入串want+s,该规则结合下面的词条:want:(V ROOT want SUBCAT _np _vp:inf _np_vp:inf VFORM base)会生成下面的语法成分:want:(V ROOT want SUBCAT _np _vp:inf _np_vp:inf VFORM pres AGR 3s)词语形态分析与词典词语形态分析与词典(3)o 另外一条规则可以生成非第三人称单数情况下的一
17、般现在时成分,对于大部分动词来说,该成分与词根形式一致:(V ROOT?r SUBCAT?s VFORM pres AGR 1s 2s 1p 2p 3p)(V ROOT?r SUBCAT?s VFORM base)这条规则可以把任意的动词基本形式直接转化为现在时,但这对不规则变化的动词是不适用的。例如,动词be就不能用作一般现在时(*We be at the store)。要处理这种情况可以引入二元特征IRREG-PRES。具体地说,特征为+IRREG-PRES的动词存在不规则的现在时形式。因此上诉规则可正确表述如下:(V ROOT?r SUBCAT?s VFORM pres AGR 1s 2
18、s 1p 2p 3p)(V ROOT?r SUBCAT?s VFORM base IRREG-PRES)词语形态分析与词典词语形态分析与词典(4)o 对于变化比较规则的词,可以通过句法规则来把握。而不规则的词则需要在词典中指明。是否规则变化将分别用特征IRREG-PRES(现在时)、IRREG-PAST(过去时)、IRREG-PL(复数)等来表示。对于这几个特征,特征值将作为后缀。o 例如,IRREG-PRES表示现在时态是规则变化的。对于完成时,将用特征EN-PASTPRT来区分加-en(EN-PASTPRT)与加-ed(EN-PASTPRT)两种完成时后缀。o 在词典中将采取默认机制,以上
19、二元特征只需对不规则动词进行说明,规则动词的默认值设为“”。词语形态分析与词典词语形态分析与词典(5)现在时现在时1.(V ROOT?r SUBCAT?s VFORM pres AGR 3s)(V ROOT?r SUBCAT?s VFORM base IRREG-PRES)+S2.(V ROOT?r SUBCAT?s VFORM pres AGR 1s 2s 1p 2p 3p)(V ROOT?r SUBCAT?s VFORM base IRREG-PRES)过去时过去时3.(V ROOT?r SUBCAT?s VFORM past AGR 1s 2s 3s 1p 2p 3p)(V ROOT?r
20、 SUBCAT?s VFORM base IRREG-PAST)+ED词语形态分析与词典词语形态分析与词典(6)过去完成时过去完成时4.(V ROOT?r SUBCAT?s VFORM pastprt)(V ROOT?r SUBCAT?s VFORM base EN-PASTPRT)+ED5.(V ROOT?r SUBCAT?s VFORM past)(V ROOT?r SUBCAT?s VFORM base EN-PASTPRT)+EN现在进行时现在进行时6.(V ROOT?r SUBCAT?s VFORM ing)(V ROOT?r SUBCAT?s VFORM base)+ING名词复数
21、名词复数7.(N ROOT?r AGR 3p)(N ROOT?r AGR 3p IRREG-PL)+S词语形态分析与词典词语形态分析与词典(7)a:(CAT ART ROOT A1 AGR 3s)saw:(CAT N ROOT SAW1 AGR 3s)be:(CAT V ROOT BE1 VFORM base IRREG-PRES IRREG-PAST EN-PASTPRT SUBCAT _adjp _np)see:(CAT V ROOT SEE1 VFORM base IRREG-PRES IRREG-PAST EN-PASTPRT SUBCAT _np)cry:(CAT V ROOT CR
22、Y1 VFORM base SUBCAT _none)saw:(CAT V ROOT SEE1 VFORM past SUBCAT _np)词语形态分析与词典词语形态分析与词典(8)dog:fish:(CAT N ROOT DOG1 AGR 3s)(CAT N ROOT FISH1AGR3s 3pIRREG_PL)saw:(CAT V ROOT SAW2 VFORM base SUBCAT _np)seed:the:(CAT N ROOT SEED1AGR 3s)(CAT ART ROOT THE1 AGR3s 3p)happy:he:(CAT ADJ SUBCAT _vp:inf)(CAT
23、PRO ROOT HE1 AGR 3s)一个带特征的文法及其分析一个带特征的文法及其分析(1)o一些约定一些约定n若某特征值只会作为一个特征的值,则当规则中有这样的值时,可省去特征名。如inf只能是特征VFORM的值,则(VP VFORM inf)将被简记为VPinf。n布尔特征的表示也可简化:对于布尔特征B,将用C+B表示成分(C B)。n通常限定重写规则左边成分很多特征的取值为规则右边主要子成分相应特征的值相同,这些特征称为中心特征中心特征(head feature)。如下面规则所示,在所有关于动词短语的规则中,VP和VP中的主动词的VFORM与AGR值是相同的:(VP VFORM?v A
24、GR?a)(V VFORM?v AGR?a SUBCAT _np_vp:inf)(NP)(VP VFORM inf)一个带特征的文法及其分析一个带特征的文法及其分析(2)如果中心特征被独立地定义,则系统可在需要的时侯自动地将这些特征加到规则中。在VFORM与AGR被定义为中心特征的情况下,上面的规则可简化为VP(V SUBCAT _np_vp:inf)NP(VP VFORM inf)若加上所有约定,则此规则还可简化为VPV_np_vp:inf NP VPinf 一个带特征的文法及其分析一个带特征的文法及其分析(3)1.SINV (NP AGR?a)(VPpres past AGR?a)2.NP
25、 (ART AGR?a)(N AGR?a)3.NP PRO4.VP V_none5.VP V_np NP6.VP V_vp:inf VPinf7.VP V_np_vp:inf NP VPinf8.VP V_adjp ADJP9.VPinf TO VPbase10.ADJP ADJ11.ADJP ADJ_vp:inf VPinfS和VP的中心特征:VFORM,AGRNP的中心特征:AGR一个带特征的文法及其分析一个带特征的文法及其分析(4)1.(S INV VFORM?vpres past)(NP AGR?a)(VP VFORM?vpres past AGR?a)2.(NP AGR?a)(ART
展开阅读全文