知网HowNet介绍课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《知网HowNet介绍课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知网 HowNet 介绍 课件
- 资源描述:
-
1、知网知网 HowNet 介绍介绍ukeenage u2019-11-18导论导论u 需求需求-研究的题目研究的题目u 知识知识-资源的建设资源的建设 需求需求-研究的题目研究的题目(1)(1)u可应用于某一个搜索引擎的可应用于某一个搜索引擎的“询问扩展询问扩展”功能;功能;u商品化商品化的垃圾邮件的清除器;功能要求:在用的垃圾邮件的清除器;功能要求:在用户自己清除两个月之后,它开始工作,自动识户自己清除两个月之后,它开始工作,自动识别垃圾并清除,并可以在与用户的交互中,变别垃圾并清除,并可以在与用户的交互中,变得愈加聪明;得愈加聪明;u商品化商品化的命名实体抽取器,它为用户提供选择的命名实体抽
2、取器,它为用户提供选择命名实体类型的功能,即用户可指定要抽取哪命名实体类型的功能,即用户可指定要抽取哪类的命名实体,如机构名字,日期,地名等;类的命名实体,如机构名字,日期,地名等;u用户可以自己定义所需内容的信息过滤器,例用户可以自己定义所需内容的信息过滤器,例如要求从报纸的电子版本中抽取到某个国家或如要求从报纸的电子版本中抽取到某个国家或某个地区的新武器研究与制造的信息;某个地区的新武器研究与制造的信息;需求需求-研究的题目研究的题目(2)(2)u可以将信息过滤器抽取到的外语的信息,以可以将信息过滤器抽取到的外语的信息,以“信息信息表表”的形式提供相对应的中文,例如:事件、时间的形式提供相
3、对应的中文,例如:事件、时间发生的时间、地点、关系者、结果等等。发生的时间、地点、关系者、结果等等。u可以从电子版的文学作品中提取用户可以自己定义可以从电子版的文学作品中提取用户可以自己定义的信息,如红楼梦中有关食物的信息如菜肴及的信息,如红楼梦中有关食物的信息如菜肴及其烹饪;或者某个或某些作品中关于疾病的信息,其烹饪;或者某个或某些作品中关于疾病的信息,或有关女子容貌描述的内容等等;或有关女子容貌描述的内容等等;u可以自动分辨出中文的错别字,并随机加以替换而可以自动分辨出中文的错别字,并随机加以替换而不会影响到以后的加工的工具;不会影响到以后的加工的工具;u可以自动向用户报告在某一个特定领域
4、中又有新的可以自动向用户报告在某一个特定领域中又有新的术语在流通,例如通讯领域中的术语在流通,例如通讯领域中的“CDMA”或或“码码分多址分多址”,足球领域中的,足球领域中的“乌龙球乌龙球”、“后腰后腰”等等等;等;u可以对任何一个词语进行歧义排除的工具,并使之可以对任何一个词语进行歧义排除的工具,并使之成为可以嫁接到其他实用系统上面的;成为可以嫁接到其他实用系统上面的;知识知识-资源的建设资源的建设 知识是一个知识是一个系统系统,是一个包含着各种概念与概念之间,是一个包含着各种概念与概念之间u 的关系,以及概念的属性与属性之间的关系的的关系,以及概念的属性与属性之间的关系的系统系统 世界上一
5、切事物(物质的和世界上一切事物(物质的和精神精神的)都在特定的时间的)都在特定的时间u 和空间内不停地运动和变化。和空间内不停地运动和变化。它们通常是从一种状态变化到另一种状态,它们通常是从一种状态变化到另一种状态,并通常由并通常由u 其属性值的改变来体现其属性值的改变来体现 知识的基本单位:知识的基本单位:u万物(包括物质的和精神的)、部件、万物(包括物质的和精神的)、部件、属性、时间、空间、属性值、事件属性、时间、空间、属性值、事件知网的规模知网的规模 2019-10Chinese words 74046English words 71919Chinese entries 88433Eng
6、lish entries 90939DEF count 22140Record count 147979知网的架构知网的架构Basic Data(Concept Definitions/Taxonomies)S-relation Trigger(Browser)D-relation Trigger(Application Tools)知网浏览器详解义原义原u 什么是义原什么是义原u 义原采用的例子义原采用的例子u 汉语的字和词语的启发汉语的字和词语的启发u 知网的义原的确定知网的义原的确定u 知网的义原的类别知网的义原的类别义原分类义原分类 2234Entity154 thing(physic
7、al,mental,fact)component(part,fitting)time space(direction,location)Event(relation,state、action)819Attribute248Value 892Secondary feature121分类体系详解分类体系详解 uEntityuEventuAttributeuAttribute valueEntity -上位,属性继承上位,属性继承-entity|实体 thing|万物 entity|实体:ExistAppear|存现:existent=physical|物质 thing|万物:HostOf=Appe
8、arance|外观,perception|感知:content=animate|生物 physical|物质:HostOf=Age|年龄,alive|活着:experiencer=,die|死:experiencer=,metabolize|代谢:experiencer=,reproduce|生殖:PatientProduct=,agent=AnimalHuman|动物 animate|生物:HostOf=Sex|性别,AlterLocation|变空间位置:agent=,StateMental|精神状态:experiencer=human|人 AnimalHuman|动物:HostOf=Ab
9、ility|能力Name|姓名Wisdom|智慧,speak|说:agent=,think|思考:agent=humanized|拟人 human|人:modifier=fake|伪,forge|伪造:PatientProduct=Event(1)关系关系/状态与行动的对应状态与行动的对应-event|事件 static|静态 event|事件 relation|关系 static|静态 possession|领属关系 relation|关系 own|有 possession|领属关系:possession=*,possessor=*obtain|得到 own|有:possession=*,p
10、ossessor=*,source=*receive|收受 own|有:possession=*,possessor=*,source=*BelongTo|属于 possession|领属关系:possession=*,possessor=*OwnNot|无 possession|领属关系:possession=*,possessor=*lose|失去 OwnNot|无:possession=*,possessor=*InDebt|亏损 lose|失去:domain=finance|金融,possession=*,possessor=*owe|欠 possession|领属关系:possess
11、ion=*,possessor=*,target=*Event(2)act|行动 event|事件:agent=*ActGeneral|泛动 act|行动:agent=*start|开始 ActGeneral|泛动:agent=*,content=*do|做 ActGeneral|泛动:agent=*,content=*,manner=*DoNot|不做 ActGeneral|泛动:agent=*,content=*refuse|拒做 DoNot|不做:agent=*,content=*evade|回避 refuse|拒做:agent=*,content=*slack|偷懒 DoNot|不做:
12、agent=*,content=*cease|停做 ActGeneral|泛动:agent=*,content=*GiveUp|戒除 cease|停做:agent=*,content=*pause|暂停 cease|停做:agent=*,content=*rest|休息 cease|停做:agent=*sleep|睡 rest|休息:agent=*wait|等待 ActGeneral|泛动:TimeFin=*,TimeIni=*,agent=*,content=*,duration=*ActSpecific|实动 act|行动:agent=*Event(3)角色框架的语义突出角色框架的语义突出
13、 ActSpecific|实动 act|行动:agent=*AlterGeneral|泛变 ActSpecific|实动:agent=*,patient=*,result=*AlterSpecific|实变 ActSpecific|实动:agent=*AlterRelation|变关系 AlterSpecific|实变:agent=*AlterPossession|变领属 AlterRelation|变关 系:agent=*,possession=*take|取 AlterPossession|变领属:agent=*,possession=*,source=*steal|偷 take|取:ag
14、ent=*,manner=covert|隐秘,possession=*,source=*buy|买 take|取:agent=*,beneficiary=*,cost=*,domain=commerce|商业,possession=*,source=*事件关系和角色转换事件关系和角色转换(1)buy|买买 obtain|得到得到 consequence;agent OF buy|买买=possessor OF obtain|得到得到;possession OF buy|买买=possession OF obtain|得到得到.buy|买买(X)sell|卖卖(Y)mutual implicat
15、ion;agent OF buy|买买=target OF sell|卖卖;source OF buy|买买=agent OF sell|卖卖;possession OF buy|买买=possession OF sell|卖卖;cost OF buy|买买=cost OF sell|卖卖.事件关系和角色转换事件关系和角色转换(2)buy|买买 entailment choose|选择选择entailment;agent OF buy|买买=agent OF choose|选择选择;possession OF buy|买买=content OF choose|选择选择;source OF bu
展开阅读全文