书签 分享 收藏 举报 版权申诉 / 60
上传文档赚钱

类型贝叶斯决策规则课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4929324
  • 上传时间:2023-01-26
  • 格式:PPT
  • 页数:60
  • 大小:3.52MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《贝叶斯决策规则课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    贝叶斯 决策 规则 课件
    资源描述:

    1、Ch 02.贝叶斯决策论符号表示 表示类别的随机变量 类别标记例如:鲑鱼;:鲈鱼 类别先验概率当所有类别互斥并且完备的情况下 类条件概率密度函数()()iiPP,1,2,3,.ii(|)ip x121()1ciiP进行观察之前 问题给定所有可能类别的先验概率,在不进行观察的情况下,预测下一个可能出现的模式的类别 最佳决策规则 在没有对新出现的模式进行任何观察情况下,该决策规则造成错误的概率最小,因此为最优决策规则;如果先验概率不变,则每次的预测均相同。如果有更多的信息,是否可以做出更好的预测?如果 ,则预测下一个模式为 ()(),jiPPij j 在类别为 的情况下,观察到特征 的概率为 可用

    2、于分类的特征x在类别不同的情况下,其概率分布应有所不同进行观察之后(|)ip xix 目标:在观察到 的情况下,类别为 的概率 判决规则(|)(|),jiPxPxij 从样本中观察到 的情况下,如果 ,则预测该模式为 根据观察到的特征做出预测j(|),1,2,3.,iPxicixx 利用先验概率(观察到x之前)计算后验概率(观察到x之后)贝叶斯公式(|)()(|)()iiip xPPxp x1()(|)()ciiip xp xP可被视为常量约掉!可被视为常量约掉!1(|)1ciiPx贝叶斯公式(|)iPx(|)ip xx()iP贝叶斯公式贝叶斯公式贝叶斯决策的特例 特例1 均匀先验概率:决策仅

    3、仅依赖于(|)ip x从样本中观察到 的情况下,如果 ,则预测该模式为 (|)(|),jiP xP xij xj贝叶斯决策的特例 特例2 相同的类条件概率密度函数:决策仅仅依赖于先验概率如果 ,则预测模式为 ()(),jiPPij j例子(1)2()1/3P类条件概率密度函数图后验概率图1()2/3P例子(2)问题有某种医学测试方法,在患有某种癌症的病人身上测试,返回阳性的概率为98%,在没有这种癌症的病人身上测试,返回阴性的概率为97%。经专家统计,所有人口中患这种癌症的概率为约0.8%。请问,如果某人的检测结果为阳性,他到底有没有得这种癌症?解答已知计算由于 ,根据贝叶斯决策规则,该病人没

    4、有得癌症 如何确定概率?应用贝叶斯决策规则,需已知如下概率 对于某个具体问题,常常需要通过实验统计相对实验统计相对频率频率,或者利用概率密度估计概率密度估计技术来确定如上概率(|)ip x()iP例子 问题:在某大学校园内,根据轿车车身高度判断其价格是否超过5万美元?C1:price$50K C2:price$50K)中共有221个样本,其中,0.95x1.05(离散化后即x=1.0)的样本有46个样本,则:146(1.0|)2210.2081p xC259(1.0|)9880.0597p xC例子 车身高度为1米的轿车价格是否高于5万美元?1111122(1.0|)()(|1.0)(1.0|

    5、)()(1.0|)()0.2081*0.1830.4380.2081*0.1830.0597*0.817p xC P CP Cxp xC P Cp xCP C结论:低于结论:低于5万美元万美元贝叶斯决策的最优性 从最小化误差概率的意义上讲,贝叶斯决策是最优决策 先来看两类情况 条件误差概率 平均误差概率 在贝叶斯决策中,对每一个x,P(error|x)都能被最小化,因此P(error)被最小化。贝叶斯决策的最优性 对问题作如下泛化:允许多类情况;允许其他行为而不仅仅是判定类别;引入更一般的损失函数来替代误差概率。损失函数 当真实类别为 时,采取行动 所带来的损失 允许某种分类错误的代价高于其他

    6、分类错误 条件风险(期望损失)当观察到x的时候,采取行动 造成的期望损失贝叶斯决策的最优性 判决规则函数 将观察到的特征x映射到应采取的行动的函数 总风险某个判决规则的期望损失 最优决策最优决策 使得总风险最低的判决规则 对任意给定的特征x,如果判决规则 选择的行动能够最小化条件风险 ,那么总风险将最小化贝叶斯决策规则贝叶斯决策规则:对所有i=1,2,a,计算条件风险 ,选择行动 使得条件风险 最小化贝叶斯决策得到的最小总风险被称为贝叶斯风险贝叶斯风险,表示为R*两类分类问题 行动 :判决为类别 :判决为类别 损失 条件风险 最小风险决策规则如果 ,则模式为 两类分类问题 等价的最小风险决策规

    7、则 通常情况下,分类错误的损失要大于正确的损失(正确时往往无损失)似然比与与x无关,对某无关,对某个问题来讲,个问题来讲,是可预先计算是可预先计算的常量的常量两类分类问题 基于似然比的贝叶斯决策规则如果 ,则模式为否则,模式为 例子不同的损失函数决定了不同的判决阈值 和 :“0-1”损失 :每一类的判决域可能是不连续的aba1221b损失函数的特例:“0-1损失”“0-1”损失(对称损失)函数 决策正确时无损失,任何一种错误的损失都等于一个单位,即所有误判都是等价的“0-1”损失的条件风险 该条件风险即误差率(error rate)最小化条件风险 等于最大化后验概率最小误差率分类 最小误差率分

    8、类是采用“0-1”损失函数时的最小风险分类 两类情况下的最小误差率分类判决规则 多类情况下的最小误差率分类判决规则如果 ,则模式为否则,模式为 如果 ,则预测该模式为 (|)(|),jiPxPxij j极小化极大准则 最小风险分类器依赖于先验概率 在先验概率未知的情况下,如何设计风险较小的分类器?使先验概率取任何一种值时所引起的总风险的最坏情况尽可能小最小化最大可能的总风险最小化最大可能的总风险 极小化极大(极小化极大(Minimax)准则)准则极小化极大准则 总风险对两类问题来讲:代入 以及 ,可重写总风险公式:R与 成线性关系 选择使 的 和 ,则总风险与 无关,此时的总风险称为极小化极大

    9、风险极小化极大准则1()mmRPR一旦 和 确定,为常数0极小化极大准则 极小化极大风险通过交换两种类别,极小化极大风险也可表示为 例子极小化极大风险极小化极大风险(不依赖于先验概率)(不依赖于先验概率)回顾 贝叶斯公式 从最小化误差概率的意义上讲,贝叶斯决策是最优决策(|)()(|)()iiip xPPxp x回顾 对问题作如下泛化:允许多类情况;允许其他行为而不仅仅是判定类别;引入更一般的损失函数来替代误差概率。损失函数 当真实类别为 时,采取行动 所带来的损失 允许某种分类错误的代价高于其他分类错误 条件风险(期望损失)当观察到x的时候,采取行动 造成的期望损失回顾 判决规则函数 将观察

    10、到的特征x映射到应采取的行动的函数 总风险某个判决规则的期望损失 最优决策最优决策 使得总风险最低的判决规则 对任意给定的特征x,如果判决规则 选择的行动能够最小化条件风险 ,那么总风险将最小化贝叶斯决策规则贝叶斯决策规则:对所有i=1,2,a,计算条件风险 ,选择行动 使得条件风险 最小化贝叶斯决策得到的最小总风险被称为贝叶斯风险贝叶斯风险,表示为R*回顾 基于似然比的贝叶斯决策规则 在先验概率未知的情况下,如何设计风险较小的分类器?使先验概率取任何一种值时所引起的总风险的最坏情况尽可能小最小化最大可能的总风险最小化最大可能的总风险 极小化极大(极小化极大(Minimax)准则)准则如果 ,

    11、则模式为否则,模式为 判别函数 分类器最常用的表述方式为判别函数 ,每个类别对应一个判别函数 基于判别函数的判决规则如果 ,则模式为判别函数 基于最小总风险的贝叶斯分类器 基于最小误差概率的贝叶斯分类器 表达同样的判决规则可能采用不同的判别函数,只要满足如下条件:用 替换 ,其中 为单调递增函数 例如 ,其中k为正数常数 ,其中k为任意常数 判别函数 两类情况下 仅需要一个判别函数 判决规则 例如 如果 ,则模式为 ,否则为判决区域和判决边界 判决区域 判决区域 是特征空间中的一个子空间,判决规则将所有落入 的样本x分类为类别 判决边界 判决边界是特征空间中划分判决区域的(超)平面 在判决边界

    12、上,通常有两类或多类的判别函数值相等多元高斯密度函数 d-维高斯(正态)密度函数 为d维均值向量 为 的协方差矩阵,通常为对称半正定矩阵 表示为 取log正态分布的判别函数 类条件概率密度函数 基于最小误差概率分类的判别函数(|)(,)iiipNx 可忽略的常量可忽略的常量特例 情况1:均匀先验概率 情况1a:均匀先验概率,并且 各特征统计独立 所有特征具有相同的方差2212i x平方欧几里德平方欧几里德距离距离特例 情况1:均匀先验概率 情况1b:均匀先验概率,并且 各类数据具有相同的协方差矩阵i平方平方Mahalanobis距距离(马氏距离)离(马氏距离)情况1a和1b可被视为最小距离分类

    13、器,即将x划分为最近的均值 所属的类别特例 情况2:212log()2tttiiiiP x x x 对所有对所有i均相同均相同令 ,则得到线性判别函数21iiw021log()2tiiiiwP 0()tiiigwxw x采用采用线性判别函数线性判别函数的分类器称为的分类器称为线性分类器(线性机器)线性分类器(线性机器)第第i个方向上的个方向上的阈值(偏置)阈值(偏置)特例 情况2:一个线性机器的判决面是一些超平面,其中每一个超平面是由具有最大后验概率的两种类别的判别函数相等确定的:该超平面通过该超平面通过x0,并且,并且垂直垂直于于 ,即两类均值点之间的连线,即两类均值点之间的连线x0特例R1

    14、R2R3特例 回到情况1a:均匀先验概率,并且 判别函数仅与各类均值有关 判决面判决面为连接两类均值点连线的判决面为连接两类均值点连线的垂直中分线垂直中分线()2ttiiiig xx 特例 回到情况1a:均匀先验概率,并且特例 如果先验概率不同?一维情况1()0.7P2()0.3P1()0.9P2()0.1P特例 如果先验概率不同?二维情况1()0.8P2()0.2P1()0.99P2()0.01P特例 如果先验概率不同?三维情况1()0.8P2()0.2P1()0.99P2()0.01P特例 情况3:i对所有对所有i均相同均相同特例 情况3:判决面由如下形式的超平面组成ix0该超平面通过该超

    15、平面通过x0,并且一般情况下,并且一般情况下不垂直不垂直于于特例 回到情况1b:均匀先验概率,并且 判决面判决面通过连接两类均值点连线的中点判决面通过连接两类均值点连线的中点i特例 回到情况1b:均匀先验概率,并且i特例 如果先验概率不同?一般情况 任意高斯密度函数111()()()loglog()22iiiiiigP xxx令 ,则得到二次型判别函数112ii W1iii w1011loglog()22tiiiiiiwP 0()ttiiiigwxx Wxw x一般情况 任意高斯密度函数两类情况下,判决面为超二次曲面一般情况 任意高斯密度函数(多类情况下)例子判决边界判决边界判决边界并未经过判决边界并未经过1,2的中点的中点 ,而是偏,而是偏下一点下一点小结 贝叶斯规则 基于观察值,将类先验概率类先验概率 和类条件密度类条件密度 转化为后验概率后验概率 贝叶斯决策 最小化总风险总风险 最小化误差概率误差概率:选择最大后验概率的类别 贝叶斯决策是理论上的最优决策最优决策,贝叶斯风险贝叶斯风险是理论上的最小风险 判别函数 判决区域和判决边界(|)ip x()iP(|)iPx(|)Rx小结 多元高斯概率密度函数 假设类条件概率密度满足高斯分布 判别函数 判决面

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:贝叶斯决策规则课件.ppt
    链接地址:https://www.163wenku.com/p-4929324.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库