书签 分享 收藏 举报 版权申诉 / 26
上传文档赚钱

类型垃圾邮件过滤之初步研究课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4752186
  • 上传时间:2023-01-07
  • 格式:PPT
  • 页数:26
  • 大小:364.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《垃圾邮件过滤之初步研究课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    垃圾邮件 过滤 初步 研究 课件
    资源描述:

    1、2023/1/7Speech Lab.NTNUSpeech Lab.NTNUSpeech Lab.NTNUSpeech Lab.NTNUCPT:Conditional Probability TableSpeech Lab.NTNU22.07.0*)8.01(1.0*8.0)|()|()|()|(),|()|(),|()|()(),|()|()()(),|()|()()(),()(),()|,()|,()|(RFPCRPRFPCRPCRFPCRPCRFPCRPCPCRFPCRPCPCPCRFPCRPCPCPCRFPCPCRFPCRFPCRFPCFPSpeech Lab.NTNU57.03.01

    2、71.05.0*)5.01(5.0*1.0)7.0*)5.0(*)1.01(*)5.01(1.0*5.0*1.0*)5.01(7.0*1.0*)8.01(*5.01.0*1.0*8.0*5.0)()|()()|()|()|()|()()()|()()|()|()|()|()()()|()()|()|()|()|()()()|()()|()|()|()|()()()|()()|()|()|()|()(),(),()|()|()|()()()|()|()|()()(),|(),|()|()()(),()|,()|,()|(CPCSPCPCSPRFPCSPCRPCPCPCSPCPCSPRFPCSPC

    3、RPCPCPCSPCPCSPRFPCSPCRPCPCPCSPCPCSPRFPCSPCRPCPCPCSPCPCSPRFPCSPCRPCPCSPCSPRFPCSPCRPCPSPRFPCSPCRPCPSPSRCFPRCSPCRPCPSPSCRFPSCRFPSRFPSFPCRCRCRCRCRCRRSpeech Lab.NTNUw2Cw1w3wnw2Cw1w3wn簡單貝式分類器複雜貝式分類器Speech Lab.NTNU dPCPCdPdCPkkk)(kCP)|(kCdPjlkkkkCNCNCP,)|(kCdPSpeech Lab.NTNU VtkttdkttdkCwPICwPICdP1,11kCdit

    4、ktCNdwICwPki,Speech Lab.NTNUdwnVtktVttVttktCwPdwndwndPCdP,111!,!,|)(|jlkCditCditktkikidwndwnCwP,Speech Lab.NTNUkkjlkCPCdPk,*maxargSpeech Lab.NTNUSpeech Lab.NTNUkttktCwPg1,jlkktktjlkjlkktkttCwnCwnCwnCwn,log,2log1Speech Lab.NTNUTUSVM SvvllSvvjjSpeech Lab.NTNUUdSvvTdSvSvvSvSvS,vv,vkTk2kk cosRSpeech Lab

    5、.NTNUSpeech Lab.NTNUmiikikGwPCwPCdP121)|()|()|(),|()|()|()|()|()|(132211211kiimiikikkCwwPGwPCwPGwPCwPCdP),|(),|()|()|()|()|()|(14132211211GwwPCwwPGwPCwPGwPCwPCdPiikiiniikikkSpeech Lab.NTNU表表 1 Ling-Spam郵件郵件語料資料表語料資料表類別合法郵件垃圾郵件數量2412481總詞數1,531,209439,040平均長度634.83912.77收錄時期July 17,2000表表 2 2 中文訓練中文訓

    6、練郵件郵件語料資料語料資料表表類別合法郵件垃圾郵件數量1188430總詞數157,86174,197平均長度132.88172.55收錄時期March 2005June 2005表表 3 3 中文測試中文測試郵件郵件語料資料表語料資料表類別合法郵件垃圾郵件數量17183總詞數11,8445,174平均長度69.2662.34收錄時期April 2005July 2005Speech Lab.NTNUjlktCCCftktktktkfPCPfCPfCPWCMI,1,0)()(),(log),();(),(tkfCP)(kCP)(tfP),(tkfCP)(kCP)(tfPSpeech Lab.NT

    7、NU(多項式模型)特徵數量與正確率關係圖30%40%50%60%70%80%90%100%100014000310004600058000特徵數量正確率合法郵件垃圾郵件Speech Lab.NTNU表表 4LSA維度與正確率實驗結果維度與正確率實驗結果(使用使用Ling-Spam語料語料)合法郵件正確率(%)垃圾郵件正確率(%)整體正確率(%)d=2604,r=2585.4966.3482.31d=2604,r=10085.6668.4282.79d=2604,r=25085.7468.4282.86d=2604,r=50085.7868.4282.89d=2,r=294.3691.0793.

    8、81d表示訓練郵件總數,r表示SVD的維度Speech Lab.NTNU表表 5隱藏式馬可夫模型各類型比較隱藏式馬可夫模型各類型比較(使用使用Ling-Spam語料語料)合法郵件正確率(%)垃圾郵件正確率(%)整體正確率(%)型I99.4296.6898.96型II99.9697.3099.52型III99.9698.3499.69Speech Lab.NTNU表表 6 各種模型正確率各種模型正確率(使用使用Ling-Spam語料語料)合法郵件正確率(%)垃圾郵件正確率(%)整體正確率(%)MVB99.5064.6793.71MN99.4297.7399.14LSA94.3691.0793.81HMM99.9698.3499.69Speech Lab.NTNU表表7 各種模型正確率各種模型正確率(使用中文語料使用中文語料)合法郵件正確率(%)垃圾郵件正確率(%)整體正確率(%)MVB99.4249.4086.12MN98.2560.0288.15LSA99.4267.4790.93HMM98.2574.7091.99Speech Lab.NTNU

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:垃圾邮件过滤之初步研究课件.ppt
    链接地址:https://www.163wenku.com/p-4752186.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库