第1章贝叶斯分类课件.pptx(49页)
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第1章贝叶斯分类课件.pptx(49页)》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章贝叶斯 分类 课件
- 资源描述:
-
1、1.1.概率论基本知识概率论基本知识 1.11.1事件事件 确定事件:概念是确定的,发生也是确定的;确定事件:概念是确定的,发生也是确定的;随机事件:概念是确定的,发生是不确定的;随机事件:概念是确定的,发生是不确定的;模糊事件:概念本身就不确定。模糊事件:概念本身就不确定。1.21.2 随机变量随机变量 随机变量:随机事件的数量表示;随机变量:随机事件的数量表示;离散随机变量:取值为离散的随机变量离散随机变量:取值为离散的随机变量 ;连续随机变量:取值为连续的随机变量连续随机变量:取值为连续的随机变量 ;1.1.概率论基本知识概率论基本知识 1.31.3 频率和概率频率和概率(1)(1)频率
2、:试验在相同的条件下重复频率:试验在相同的条件下重复N N次,次,其中其中M M次事件次事件A A发生,则发生,则A A发生的频率为:发生的频率为:f fN N(A)=M/N(A)=M/N;(2)(2)概率:当概率:当N N很大时,频率会趋向一个很大时,频率会趋向一个稳定值,称为稳定值,称为A A的概率:的概率:limNNP AfA 1.41.4 联合概率和条件概率联合概率和条件概率 联合概率:设联合概率:设A A,B B是两个随机事件,是两个随机事件,A A和和B B同时发生的概率称为联合概率,记为:同时发生的概率称为联合概率,记为:P(A,B)P(A,B);条件概率:在条件概率:在B B事
3、件发生的条件下,事件发生的条件下,A A事事件发生的概率称为条件概率,记为:件发生的概率称为条件概率,记为:P(A|B)P(A|B);乘法定理:乘法定理:P(A|B)=P(A,B)/P(B)P(A|B)=P(A,B)/P(B)。1.1.概率论基本知识概率论基本知识1.1.概率论基本知识概率论基本知识 1.5.1.5.先验概率和后验概率先验概率和后验概率 事情还没有发生事情还没有发生,要求这件事情发生的可能性的要求这件事情发生的可能性的大小大小,是是先验概率先验概率.事情已经发生事情已经发生,要求这件事情发生的原因是由某要求这件事情发生的原因是由某个因素引起的可能性的大小个因素引起的可能性的大小
4、,是是后验概率后验概率.先验概率是在缺乏某个事实的情况下描述一个先验概率是在缺乏某个事实的情况下描述一个变量;而后验概率是在考虑了一个事实之后的变量;而后验概率是在考虑了一个事实之后的条件概率。条件概率。先验概率通常是经验丰富的专家的纯主观的估先验概率通常是经验丰富的专家的纯主观的估计。后验概率可以根据通过贝叶斯公式,用先计。后验概率可以根据通过贝叶斯公式,用先验概率和似然函数计算出来。验概率和似然函数计算出来。1.1.概率论基本知识概率论基本知识 1.61.6概率密度函数概率密度函数 概率分布函数:设概率分布函数:设X X为连续型随机变量,为连续型随机变量,定义分布函数;定义分布函数;F(x
5、)=P(XF(x)=P(Xx)x);概率密度函数:如果存在一个非负函数概率密度函数:如果存在一个非负函数p(x)p(x)使得下式成立,则使得下式成立,则p(x)p(x)称为的概率称为的概率密度函数:密度函数:xF xp t dt Fxp x P Xxp x dx 1.61.6 全概公式全概公式 互不相容事件:如果试验时,若干个随互不相容事件:如果试验时,若干个随机事件中任何两个事件都不可能同时发机事件中任何两个事件都不可能同时发生,则称它们是互不相容的。生,则称它们是互不相容的。全概公式:若事件全概公式:若事件B只能与两两不相容的只能与两两不相容的事件事件A A1 1,A,A2 2,A,AN
6、N之一同时发生,则有:之一同时发生,则有:1NiiiP BP A P B A1.1.概率论基本知识概率论基本知识1.1.概率论基本知识概率论基本知识 1.71.7 贝叶斯公式贝叶斯公式 离散形式:离散形式:A,BA,B为离散随机变量:为离散随机变量:P B A P AP A BP B 连续形式:连续形式:A A为离散随机变量,为离散随机变量,B B为连续随机为连续随机变量:变量:p B A P AP A Bp BP(A,B)=P(B,A)2 2 BayesBayes概率分类器概率分类器 2.12.1 问题提出问题提出 已知:已知:c c个类别的先验概率个类别的先验概率P(P(i i)类条件概率
7、类条件概率密度函数密度函数p p(x|(x|i i);对对类别未知样本类别未知样本x x进行分类。进行分类。2 2 BayesBayes概率分类器概率分类器 2.22.2 采用采用BayesBayes分类器的先决条件分类器的先决条件 决策分类的类别数是一定的决策分类的类别数是一定的 设有设有c c个模式类个模式类i i(i=1i=1,2 2,c c)各类出现的先验概率各类出现的先验概率P(P(i i)已知已知 类条件概率密度函数类条件概率密度函数p p(x|(x|i i)已知已知使用什么样的原则可以做到错误概率最小呢?使用什么样的原则可以做到错误概率最小呢?前提就是要知道一个样品分属于不同类别
8、的可能性,表示成前提就是要知道一个样品分属于不同类别的可能性,表示成p(i|x)计算后验概率最大的类来分类,这样就是错误最小的方式。计算后验概率最大的类来分类,这样就是错误最小的方式。2.32.3 两类分类的最小错误率两类分类的最小错误率BayesBayes分类决策规则分类决策规则的后验概率形式的后验概率形式设设N个样本分为两类个样本分为两类1,2。每个样本抽出每个样本抽出n个特征,个特征,x=(x1,x2,x3,xn)T221121),()(),()(xxPxPxxPxP则若则若 其中,其中,P P(i i|x)为状态后验概率由为状态后验概率由BayesBayes公式计算:公式计算:21)(
9、)()()()(jjjiiiPxpPxpxP2 2 BayesBayes概率分类器概率分类器2.42.4决策规则的类条件概率密度形式决策规则的类条件概率密度形式 两类最小错误率两类最小错误率BayesBayes分类决策规则的等价条分类决策规则的等价条件概率密度形式:件概率密度形式:2221112211)()|()()|()()|()()|(xPxpPxpxPxpPxp,则若,则若2 2 BayesBayes概率分类器概率分类器2.42.4决策规则的似然比形式决策规则的似然比形式21221112211221)()()()()()()()()()()()()()()(xPPxpxpxlxPPxpx
10、pxlPPxpxpxl,则:,则:若:似然比阈值:似然比:2 2 BayesBayes概率分类器概率分类器2.52.5决策规则的似然比对数形式决策规则的似然比对数形式 两类最小错误率两类最小错误率BayesBayes分类决策规则的等分类决策规则的等价似然比取自然对数形式:价似然比取自然对数形式:2221112211)(ln)(ln)(ln)(ln)(ln)(ln)(ln)(lnxPxpPxpxPxpPxp,则:若:,则:若:2 2 BayesBayes概率分类器概率分类器 2.62.6贝叶斯决策函数贝叶斯决策函数 2 2类分类的贝叶斯决策函数类分类的贝叶斯决策函数)(,)()(ln)()(ln
11、)()4()(,)()()()()()3()(),()()()()()2()(),()()()1(12211221221121取对数方法似然比形式类条件概率密度后验概率PPxpxpxgPPxpxpxgPxpPxpxgxPxPxg 决策函数表述的决策规则:210)(xxg,则:若:2 2 BayesBayes概率分类器概率分类器2.72.7决策域与决策边界决策域与决策边界 2 2类贝叶斯决策规则把类贝叶斯决策规则把n n维特征空间分成了维特征空间分成了2 2个决策域个决策域 决策域的边界称为决策边界,边界方程(或决策面方程)决策域的边界称为决策边界,边界方程(或决策面方程)满足:满足:g(x)=
12、0g(x)=0 决策边界(特征空间为决策边界(特征空间为n n维)维)n=1n=1时,决策边界为分界点时,决策边界为分界点 n=2n=2时,决策边界为曲线时,决策边界为曲线 n=3n=3时,决策边界为曲面时,决策边界为曲面 n3n3时,决策边界为超曲面时,决策边界为超曲面2 2 BayesBayes概率分类器概率分类器g(x)nxxxX.21特征向量判别计算决策21x阈值单元2 2类分类的类分类的BayesBayes分类器分类器2 2 BayesBayes概率分类器概率分类器3.13.1多类情况下的最小错误率多类情况下的最小错误率BayesBayes分类决策规则分类决策规则设设N个样本分为个样
13、本分为c类类1,2,c。每个样本抽出每个样本抽出n个特征,个特征,x=(x1,x2,x3,xn)TijjiiijxjicjPxpPxpxjicjxPxP则:),(若:)类条件概率密度形式(则:),(若:)后验概率形式(;.21)()()()(2;.21)()(1i3 3 多类多类BayesBayes分类器分类器3 3 多类多类BayesBayes分类器分类器ijjiiiijjixjicjPxpPxpxjicjPPxpxpxl则:),()自然对数形式(则:),()似然比形式(;.21)()()(ln)(ln4;.21)()()()()(3 3.23.2 C C类情况下的贝叶斯决策函数类情况下的贝
14、叶斯决策函数 3.33.3 C C类情况下的贝叶斯决策规则类情况下的贝叶斯决策规则 ijcjixxgxg,则:若:)(max)(,.,1),()自然对数形式(),()类条件概率密度形式(),()后验概率形式(ciPxpxgciPxpxgcixPxgiiiiiii.21)(ln)(ln)(3.21)()()(2.21)()(1i3 3 多类多类BayesBayes分类器分类器3.43.4多类情况下的决策域与决策边界多类情况下的决策域与决策边界 c c类贝叶斯决策规则把类贝叶斯决策规则把n n维特征空间分成维特征空间分成了了c c个决策域个决策域 决策域的边界由决策函数确定决策域的边界由决策函数确
15、定 对于对于2 2个相邻的决策域个相邻的决策域RiRi和和RjRj,其边界方,其边界方程满足:程满足:g gi i(x)=g(x)=gj j(x)(x)3 3 多类多类BayesBayes分类器分类器多类多类BayesBayes分类器分类器g1(x)Maxg(x)nxxxX.21特征向量判别计算决策ixg2(x)gn(x)最大值选择器.3 3 多类多类BayesBayes分类器分类器4 4 最小风险率最小风险率BayesBayes分类分类 风险即为损失风险即为损失 条件风险条件风险 将样本向量将样本向量x x判属某类所造成的损失的条件判属某类所造成的损失的条件数学期望数学期望 2 2类分类的最
展开阅读全文