书签 分享 收藏 举报 版权申诉 / 34
上传文档赚钱

类型一种基于实体的邮件任务提取策略课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4994386
  • 上传时间:2023-01-31
  • 格式:PPTX
  • 页数:34
  • 大小:548.46KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《一种基于实体的邮件任务提取策略课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    一种 基于 实体 邮件 任务 提取 策略 课件
    资源描述:

    1、TEXEM:一种基于实体的邮件任务提取策略张相於,陈继东,李玉坤,孟小峰中国人民大学WAMDM实验室2019EMC中国实验室1谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作2谢谢你的阅读2019-10-20演示纲要 研究动机研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作3谢谢你的阅读2019-10-20研究动机(1)电子邮件数据量剧增 IDC:5 Exabyte商业邮件(1 Exabyte=1 billion Gigabyte),2007四月

    2、。电子邮件作用越来越丰富 任务管理任务管理,协作管理,存档管理,联系人管理 人们处理邮件的时间十分有限 现有工具不能满足需求 Outlook,Gmail 人们仍需要手工管理邮件中的任务。4谢谢你的阅读2019-10-20研究动机(2)dear bhaiya i was making a list of all my contact addresses in USA.could u pls send ur complete address&ph/mobile.i am scheduled to come to US on 25th.regardsgautam5三个事件:1.Making a li

    3、st.2.Send your address&number3.Scheduled to come to US on 25th谢谢你的阅读2019-10-20研究动机(3)我们提出一种基于实体的邮件任务提取框架TEXEM。充分考虑电子邮件中的结构信息。从邮件中提取属于不同实体的任务。对任务进行重要性评估。提高用户邮件管理的效率。6谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作7谢谢你的阅读2019-10-20相关工作(1)Gmail,Hotmail 可以提取形式较为规范的事件信息。8谢谢你的

    4、阅读2019-10-20相关工作(2)9谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作10谢谢你的阅读2019-10-20处理流程事件提取任务构造重要性评估11谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作12谢谢你的阅读2019-10-20事件提取(1)每句话都可能包含一个事件。一个事件具有如下结构:Event=O,V,T,L,P,DO:事件所有者V:事件中的动词集合T:事件发生的时

    5、间L:事件发生的地点P:事件涉及的人的集合D:事件中的其他关键字13谢谢你的阅读2019-10-20事件提取(2)电子邮件词性标注标识实意动词标识人名标识地名标识时间事件集合14谢谢你的阅读2019-10-20事件提取(3)事件合并 将不含有实意动词的句子与离它最近的事件合并:He is busy tomorrow for the meeting.事件分解 如果句子含有and或but等连词,并且连接的是分句而不是短语或词。15谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造基于事件聚类的任务构造 任务空间向量 实验评估 总结&未来工作16

    6、谢谢你的阅读2019-10-20基于事件聚类的任务构造(1)实体识别 I,We,You。第三人称实体。基于实体的事件聚类 将属于某个实体的事件进行聚类。17谢谢你的阅读2019-10-20基于事件聚类的任务构造(2)实体识别 识别出I,we和you。识别出第三人称的名字:人名,组织名。识别出第三人称代词指代的实体:在该代词前面,并且离它最近的对应实体。Mike is coming tomorrow,and he will bring some beers.18谢谢你的阅读2019-10-20基于事件聚类的任务构造(3)基于实体的事件聚类 基于事件构造阶段提取出来的事件所有者,进行事件聚类。属于

    7、同一实体的事件被聚类到一起。所有者为代词的按照上述方法识别所有者。无法识别的事件聚到一起。19谢谢你的阅读2019-10-20基于事件聚类的任务构造(2)20谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量任务空间向量 实验评估 总结&未来工作21谢谢你的阅读2019-10-20任务空间向量(1)每个人任务中的事件具有不同的重要性。基于TF-IDF对任务中的事件进行排序:Score(e)=Mean(weight(term in e)Weight(term)=factor*(TF(term)*log(N/DF(term)22谢

    8、谢你的阅读2019-10-20任务空间向量(2)23谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估实验评估 总结&未来工作24谢谢你的阅读2019-10-20实验评估(1)实验环境 实验平台:Java 数据集:Enron邮件数据集,1.2GB,150个用户的500 000封邮件。词性标注:PoSTagger。实体标注:ANNIE。25谢谢你的阅读2019-10-20实验评估(2)Enron邮件数据集 在安然公司出事后为调查案件被向公共开放。被MIT的研究者加工整理形成。已知的最大的真实邮件数据集。26谢谢你的阅读

    9、2019-10-20实验评估(3)27谢谢你的阅读2019-10-20实验评估(4)28谢谢你的阅读2019-10-20实验评估(5)以人工对邮件进行处理的结果为基准值,对我们的方法从三个方面进行评估:任务提取召回率:能够提取出多少任务。任务评估准确率:事件排序的准确率。实体识别准确率:能正确识别多少实体。29任务提取召回率任务提取召回率73.27%任务评估准确率任务评估准确率54.49%实体识别准确率实体识别准确率66.48%谢谢你的阅读2019-10-20演示纲要 研究动机 相关工作 处理流程 事件提取 基于事件聚类的任务构造 任务空间向量 实验评估 总结总结&未来工作未来工作30谢谢你的阅读2019-10-20总结&未来工作 总结 提出了一种基于实体的邮件任务提取框架。对任务进行了重要性评估。提高用户邮件处理的效率。未来工作 考虑更多邮件元信息。通过合并相似事件来提高事件重要性。处理结果的更好展示。31谢谢你的阅读2019-10-2032谢谢你的阅读2019-10-20谢谢33谢谢你的阅读2019-10-2034谢谢你的阅读2019-10-20

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种基于实体的邮件任务提取策略课件.pptx
    链接地址:https://www.163wenku.com/p-4994386.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库