机器学习导论-第5章贝叶斯分类器与贝叶斯网络.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《机器学习导论-第5章贝叶斯分类器与贝叶斯网络.ppt》由用户(最好的沉淀)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习导论-第5章 贝叶斯分类器与贝叶斯网络 机器 学习 导论 贝叶斯 分类 网络
- 资源描述:
-
1、第第5章章 贝叶斯分类器与贝叶斯网络贝叶斯分类器与贝叶斯网络n掌握贝叶斯公式和朴素贝叶斯分类器原理。掌握贝叶斯公式和朴素贝叶斯分类器原理。n熟悉朴素贝叶斯分类器的优缺点及应用领域。熟悉朴素贝叶斯分类器的优缺点及应用领域。n了解贝叶斯网络的构建方法及推理过程。了解贝叶斯网络的构建方法及推理过程。本章学习目标本章学习目标n5.1 贝叶斯方法贝叶斯方法n5.2 贝叶斯分类器贝叶斯分类器n5.3 贝叶斯网络贝叶斯网络第第5章章贝叶斯分类器与贝叶斯贝叶斯分类器与贝叶斯网络网络n贝叶斯贝叶斯(1702-1761)Thomas Bayes,英国英国数学家。数学家。1742年成为年成为英国皇家学会英国皇家学会
2、会员。会员。1761年年4月月7日逝世。贝叶斯在日逝世。贝叶斯在数学数学方面主要研究概率论。他首先将方面主要研究概率论。他首先将归纳推理归纳推理法用于概率论法用于概率论基础理论,并创立了基础理论,并创立了贝叶斯统计贝叶斯统计理论,对于统计决策理论,对于统计决策函数函数、统计推断、统计的估算等做出了贡献。他死后,理查德统计推断、统计的估算等做出了贡献。他死后,理查德普莱普莱斯斯(Richard Price)于于1763年将他的著作年将他的著作 An essay towards solving a problem in the doctrine of chances寄给了英国皇家学会,对于现代寄给
3、了英国皇家学会,对于现代概率论和数理统计概率论和数理统计产生了产生了重要的影响。重要的影响。5.1 贝叶斯方法贝叶斯方法例例:假设某个动物园里的雌性和雄性熊猫的比例是4:6,雌性熊猫中90%的熊猫是干净整洁的,雄性熊猫中20%是干净整洁的。1.求解“正向概率”:在动物园中看到一只干净整洁的雄性熊猫的概率是多少?2.求解“逆向概率”:如果看到一只熊猫是干净整洁的,它是雄性的概率是多少?贝叶斯公式5.1 贝叶斯方法贝叶斯方法贝叶斯公式5.1 贝叶斯方法贝叶斯方法12001212,1,1,2,;2,.nijnnEB BBEB Bi jnBBBB BB 定义设为试验 的样本空间为的一组事件 若则称为样
4、本空间的一个划分样本空间的划分样本空间的划分1B2B3BnB1nB5.1 贝叶斯方法贝叶斯方法条件独立公式条件独立公式:如果如果 和和 相互独立,则有:相互独立,则有:其中,其中,是事件发生的概率。是事件发生的概率。条件概率公式条件概率公式:其中,其中,表示事件表示事件 已发生的条件下,事件已发生的条件下,事件 发生的概发生的概率,也称为条件概率。率,也称为条件概率。可以通过全概率公式计算。可以通过全概率公式计算。(,)()()P X YP X P Y P ()()()P X Y P YP Y XP X()P Y XXYXY()PX数学基础数学基础5.1 贝叶斯方法贝叶斯方法全概率公式全概率公
5、式:其中,事件 构成一个完备事件组,即 。数学基础数学基础5.1 贝叶斯方法贝叶斯方法1()(|)()kiiiP XP X YY P Y12,kY YY11kiiY5.1 贝叶斯方法贝叶斯方法n贝叶斯方法的贝叶斯方法的特点是用概率表示不确定性,概率规则表示推理或特点是用概率表示不确定性,概率规则表示推理或学习,学习,随机变量的概率分布表示推理或学习的最终随机变量的概率分布表示推理或学习的最终结果。结果。n贝叶斯理论源于贝叶斯提出的贝叶斯定理贝叶斯理论源于贝叶斯提出的贝叶斯定理。贝叶斯定理是关于随贝叶斯定理是关于随机事件机事件 和和 的条件概率的一则定理,它基于下述贝叶斯公式的条件概率的一则定理
6、,它基于下述贝叶斯公式:n如果我们已经知道事件如果我们已经知道事件 和和 各自发生的各自发生的概率,已知概率,已知当事件当事件 发生发生前提下事件前提下事件 也也发生发生的的条件概率,那么条件概率,那么就可以用贝叶斯公式求就可以用贝叶斯公式求得在事件得在事件 发生前提下事件发生前提下事件 发生的发生的概率。概率。n贝叶斯公式提供了从先验概率计算后验概率的方法。贝叶斯公式提供了从先验概率计算后验概率的方法。5.1 贝叶斯方法贝叶斯方法由全概率公式可以得到如下贝叶斯公式贝叶斯公式:1()()()iiikiiiP X Y P YP Y XP X YY P Yn5.1 贝叶斯方法贝叶斯方法n5.2 贝
7、叶斯分类器贝叶斯分类器n5.3 贝叶斯网络贝叶斯网络第第5章章贝叶斯分类器与贝叶斯贝叶斯分类器与贝叶斯网络网络n训练数据集:训练数据集:n由由X和和Y的联合概率分布的联合概率分布P(X,Y)独立同分布产生独立同分布产生n朴素贝叶斯通过训练数据集学习联合概率分布朴素贝叶斯通过训练数据集学习联合概率分布P(X,Y),n即先验概率分布:即先验概率分布:n及条件概率分布:及条件概率分布:5.2 贝叶斯分类器贝叶斯分类器n条件独立性假设:条件独立性假设:n“朴素朴素”贝叶斯名字由来,牺牲分类准确性。贝叶斯名字由来,牺牲分类准确性。n贝叶斯定理:贝叶斯定理:n代入上式:代入上式:5.2 贝叶斯分类器贝叶斯
8、分类器n贝叶斯分类器:贝叶斯分类器:n分母对所有分母对所有ck都相同:都相同:5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类模型朴素贝叶斯分类模型是一种简单的构造分类器的方法。朴素贝叶是一种简单的构造分类器的方法。朴素贝叶斯分类模型是将问题分为特征向量和决策向量两类,并假设问题斯分类模型是将问题分为特征向量和决策向量两类,并假设问题的特征向量都是相互独立地作用于决策向量的,即问题的特征之的特征向量都是相互独立地作用于决策向量的,即问题的特征之间都是互不相关的。间都是互不相关的。n尽管有这样过于简单的假设,但朴素贝叶斯分类模型能指数级降尽管有这样过于简单的假设,但朴素贝叶斯分类模型能指数级降低
9、贝叶斯网络构建的复杂性,同时还能较好地处理训练样本的噪低贝叶斯网络构建的复杂性,同时还能较好地处理训练样本的噪声和无关属性,所以朴素贝叶斯分类模型仍然在很多现实问题中声和无关属性,所以朴素贝叶斯分类模型仍然在很多现实问题中有着高效的应用,例如入侵检测和垃圾邮件过滤等领域。有着高效的应用,例如入侵检测和垃圾邮件过滤等领域。n目前许多研究学者也在致力于改善特征变量间的独立性的限制使目前许多研究学者也在致力于改善特征变量间的独立性的限制使得朴素贝叶斯分类模型可以应用到更多问题上。得朴素贝叶斯分类模型可以应用到更多问题上。5.2 贝叶斯分类器贝叶斯分类器1.原理:原理:对于待分类的样本,假设各个特征之
10、间满足朴素独立的条件,对于待分类的样本,假设各个特征之间满足朴素独立的条件,基于贝叶斯公式,通过训练样本的特征概率,求解未知样本的概基于贝叶斯公式,通过训练样本的特征概率,求解未知样本的概率分布,从而预测样本的分类。率分布,从而预测样本的分类。2.步骤:步骤:对于训练样本集包含分类标签,其中有对于训练样本集包含分类标签,其中有 个样本,每个样本包个样本,每个样本包含含 个特征,表示如下:个特征,表示如下:对应的训练集有对应的训练集有 个输出类别,表示为个输出类别,表示为 。nm 11121121222212,mmnnnmnx xxyxxxyxxxyk12,kC CC5.2 贝叶斯分类器贝叶斯分
11、类器n朴素贝叶斯分类朴素贝叶斯分类 对于测试样本集对于测试样本集 ,分别,分别统计每个样本对应标签的所有输出类别对应的概率:统计每个样本对应标签的所有输出类别对应的概率:由于每个样本的特征独立,根据条件独立公式,计算样本中由于每个样本的特征独立,根据条件独立公式,计算样本中每个特征的条件概率,再计算出对应标签的所有类别的概率,如每个特征的条件概率,再计算出对应标签的所有类别的概率,如下所示:下所示:11121121222212,mmpppmptttrtttrtttr1,2,ip12,iiiiiikP t rCP t rCP t rC 111121111111211221212121112111
12、1()()()miiiiimijjmiiiiimijjmiikikikimkijkjP t rCP trCP trCP trCP t rCP t rCP trCP trCP trCP t rCP t rCP trCP trCP trCP t rC5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类 对于新的测试样本集对于新的测试样本集 ,根据贝叶斯公式可以得到:,根据贝叶斯公式可以得到:如果如果 ,其中,其中 ,则则 ,即认为,即认为 。衡量分类器精度,可以利用衡量分类器精度,可以利用 统计分类器计算与真实标签对比统计分类器计算与真实标签对比的正确率。的正确率。1122()()()(
13、)()()iiiiiiiiiiiiiikiikiiP trCPrPrCtPtP trCPrPrCtPtP trCPrPrCtPtx 12max,hiiikiP rC tP rC tP rC tP rC t1,2,hkihtCihrCir5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类数据数据 以以上表格通过不同的天气特征来预测球赛是否可以进行,数据集中可以比上表格通过不同的天气特征来预测球赛是否可以进行,数据集中可以比赛(赛(Yes)的样本有)的样本有 9 个,而不能比赛的样本(个,而不能比赛的样本(No)有)有 5 个,对于一组新个,对于一组新的天气数据,采用贝叶斯理论基于以前
14、的经验数据,预测为的天气数据,采用贝叶斯理论基于以前的经验数据,预测为可以比赛可以比赛的概的概率要比预测为率要比预测为不能比赛不能比赛的概率高几乎两倍,这就称为先验概率的概率高几乎两倍,这就称为先验概率(Prior probability)。5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类对于以上数据集,求先验概率如下:对于以上数据集,求先验概率如下:对对于新样本:于新样本:采用贝叶斯分类法来预测采用贝叶斯分类法来预测首先需要统计数据集,计算如下的条件概率:首先需要统计数据集,计算如下的条件概率:()9 14()5 14P PlayYesP PlayNo,XOutlookOver
15、cast TemperatureMild HumidityNormal WindyFalsePlayYesPlayNo或()2 9 ()3 5()4 9 ()0 5()3 9 ()2 5OutlookP Sunny PlayYesP Sunny PlayNoP Overcast PlayYesP Overcast PlayNoP Rain PlayYesP Rain PlayNo5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类()2 9 ()2 5()4 9 ()2 5()3 9 ()1 5()3 9 ()4 5()6 9 TemperatureP Hot PlayYesP Ho
16、t PlayNoP Mild PlayYesP Mild PlayNoP Cool PlayYesP Cool PlayNoHumidityP High PlayYesP High PlayNoP Normal PlayYes ()1 5()3 9 ()3 5()6 9 ()2 5P Normal PlayNoWindyP True PlayYesP True PlayNoP False PlayYesP False PlayNo5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类根据贝叶斯公式可以计算出新样本根据贝叶斯公式可以计算出新样本X的两个似然概率的两个似然概率(Likeli
17、hood Probability)如下所示:如下所示:对于以上两个算式,发现对于以上两个算式,发现 的乘积项中出现了的乘积项中出现了0,这,这是因为训练数据集中的是因为训练数据集中的 这个条件概率为这个条件概率为0而而导致的,这时候如果增加有效的训练数据,就需要采取拉普拉斯导致的,这时候如果增加有效的训练数据,就需要采取拉普拉斯修正修正(Laplace correction)。()()*()*()*()(4 9)*(4 9)*(6 9)*(6 9)()()*(P X PlayYesP OutlookOvercast PlayYesP TemperatureMild PlayYesP Humid
18、ityNormal PlayYesP WindyFalse PlayYesP X PlayNoP OutlookOvercast PlayNoP TemperatureMild Play)*()*()(0 5)*(2 5)*(1 5)*(2 5)NoP HumidityNormal PlayNoP WindyFalse PlayNo()P X Play No()P OutlookOvercast PlayNo5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类修正后重新计算先验概率如下:修正后重新计算先验概率如下:修正后重新计算条件概率如下:修正后重新计算条件概率如下:()(9 1)
19、/(142)10 16()(5 1)/(142)6 16P PlayYesP PlayNo()312 ()4 8()512 ()18()412 ()3 8()312 ()3 8(OutlookP Sunny PlayYesP Sunny PlayNoP Overcast PlayYesP Overcast PlayNoP Rain PlayYesP Rain PlayNoTemperatureP Hot PlayYesP Hot PlayNoP Mild Pla)512 ()3 8()412 ()2 8yYesP Mild PlayNoP Cool PlayYesP Cool PlayNo5.
20、2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类修正后重新计算似然概率如下:修正后重新计算似然概率如下:()4 11 ()5 7()7 11 ()2 7()4 11 ()4 7()7 11 ()3 7HumidityP High PlayYesP High PlayNoP Normal PlayYesP Normal PlayNoWindyP True PlayYesP True PlayNoP False PlayYesP False PlayNo()()*()*()*()(512)*(512)*(711)*(711)0.07030533P X Play YesPOutlook O
21、vercast Play Yes PTemperature Mild Play YesPHumidity Normal Play Yes PWindy FalsePlay Yes5.2 贝叶斯分类器贝叶斯分类器n朴素贝叶斯分类朴素贝叶斯分类回顾贝叶斯公式构建分类器的数学模型:回顾贝叶斯公式构建分类器的数学模型:其中上式的分子项,其中上式的分子项,为先验概率为先验概率(Prior probability),为通过条件概率为通过条件概率(Conditional probability)计算出来的似然计算出来的似然概率概率(Likelihood Probability)。()()*()*()*()(
展开阅读全文