贝叶斯信念网络课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《贝叶斯信念网络课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 信念 网络 课件
- 资源描述:
-
1、1Bayes Classifier 贝叶斯分类2022-8-1422022-8-14一、何谓贝叶斯分类?数据挖掘中以贝叶斯定理为基础,用于分类的技术有朴素贝叶斯分类和贝叶斯信念网络两种。朴素贝叶斯分类假定一个属性值对给定类的影响独立于其他属性的值,即在属性间不存在依赖关系,也因此称为“朴素的”。贝叶斯信念网络也可以用于分类,它是图形模型。它优于朴素贝叶斯,它能够处理属性子集间有依赖关系的分类。它采用监督式的学习方式。二、基本知识32022-8-141、事件概率联合概率(joint probability)表示A事件和B事件同时发生的概率,P(A B)。边际概率(marginal probabi
2、lity)在A和B的样本空间中,只看A或B的概率,称之边际概率。条件概率(conditional probability)在发生A的条件下,发生B的概率,称为P(B|A)。赞成(B1)反对(B2)合计男性(A1)40120160女性(A2)103040合计501502004联合概率:P(男性,赞成)=P(A1B1)=40/200 =0.2边际概率:P(赞成)=P(B1)=P(A1B1)+P(A2B1)=0.25条件概率:P(赞成|男性)=P(B1|A1)=P(A1B1)/P(A1)=0.252022-8-14举例:2、乘法法则(Multiplicative rule)52022-8-14()(
3、)(),()()()()()()()()P ABP ABP B AP A BP AP BP ABP BP A BP AP B A3、独立事件设事件和事件满足以下条件:则称与为独立事件。()()()()0,()()()0,()()P ABP AP BP AP B AP BP BP A BP A或:三、贝叶斯定理6 表示先验概率(Prior probability)。表示后验概率(Posteriori probability),先验概率是由以往的数据分析得到的。根据样本数据得到更多的信息后,对其重新修正,即是后验概率。2022-8-14()()()()()()iiiiP CP X CP CXP C
4、 XP XP X()iP C()iP C X7例:旅客搭乘飞机必须经电子仪器检查是否身上携带金属物品。如果携带金属,仪器会发出声音的概率是97%,但身上无金属物品仪器会发出声音的概率是5%。已知一般乘客身上带有金属物品的概率是30%,若某旅客经过仪器检查时发出声音,请问他身上有金属物品的概率是多少?11111122()()()()()0.3 0.970.89260.3 0.970.7 0.05P X CP CP CXP C XP XP X CP CP X CP C2022-8-14解:设C1=“有金属物”,X=“仪器会发声”,则四、朴素贝叶斯分类的工作过程2022-8-14812121=,nn
5、nXx xxnA AAn、每个数据样本用一个 维特征向量表示,分别描述对 个属性样本的 个度量。2022-8-149122,()(),1,()()=()()()miijiiiiimC CCXXXCP C XP C Xjm jiP X CP CP C XP XP XP X CP C、假定有 个类。给定一个未知的数据样本,分类法将预测 属于具有最高后验概率(条件 下)的类。即是说,朴素贝叶斯分类将未知的样本分配给类,当且仅当根据贝叶斯定理()因此,由于对于所有类为常数,只需要()最大即可。2022-8-141013()()()1()=,nikikkiikkkiiikkkiiiP X CP x CP
6、 x CsAP x CssAxCsC、假定属性值相互条件独立,即在属性间不存在依赖关系,这样,概率可以由训练样本估值,其中()如果是离散型属性,则其中是在属性上具有 的类 的训练样本数,而 是 中的训练样本数。2022-8-1411222()1()=(,)22(,)iiiiiiikkCkikCCCCikkCCkAxP x Cg xeCAg xA()如果是连续型属性,则通常假定该属性服从高斯分布。因而,其中,给定类 的训练样本属性 的值,是属性 的高斯密度函数。2022-8-14124()()()()()()()()iiiiiijjiiXCP X C P CCP X C P CP X CP CX
7、P X C P C、为对未知样本 分类,对每个类,计算。样本被指派到类,当且仅当即是说,被指派到最大的类。五、朴素贝氏分类的实例办信用卡意愿:项目项目性别性别年龄年龄学生身分学生身分收入收入办卡办卡1 1男男4545否否高高 会会2 2女女31453145否否高高会会3 3女女20302030是是低低会会4 4男男2020是是低低不会不会5 5女女20302030是是中中不会不会6 6女女20302030否否中中会会7 7女女31453145否否高高会会8 8男男31453145是是中中不会不会9 9男男31453145否否中中会会1010女女200152022-8-141()=()()nii
展开阅读全文