第2章+正态分布时的统计决策3课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第2章+正态分布时的统计决策3课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正态分布 统计 决策 课件
- 资源描述:
-
1、Made in CV&PRLab of Shandong University2.10 正态分布时的统计决策正态分布时的统计决策2.10.1 正态分布概率密度函数的定义及性质正态分布概率密度函数的定义及性质12.10.2 正态分布中的正态分布中的Bayes分类方法分类方法2Made in CV&PRLab of Shandong Universityv 在统计决策理论中,涉及到类条件概率密度函数在统计决策理论中,涉及到类条件概率密度函数 。对许多。对许多实际的数据集,正态分布通常是合理的近似。如果在特征空间中的某一实际的数据集,正态分布通常是合理的近似。如果在特征空间中的某一类样本,较多地分布
2、在这一类均值附近,远离均值点的样本比较少,此类样本,较多地分布在这一类均值附近,远离均值点的样本比较少,此时用正态分布作为这一类的概率模型是合理的。另外,正态分布概率模时用正态分布作为这一类的概率模型是合理的。另外,正态分布概率模型有许多好的性质,有利于作数学分析。概括起来就是:型有许多好的性质,有利于作数学分析。概括起来就是:(1)物理上的合理性;()物理上的合理性;(2)数学上的简单性)数学上的简单性v 下面重点讨论正态分布分布及其性质,以及正态分布下的下面重点讨论正态分布分布及其性质,以及正态分布下的Bayes决策理决策理论。论。)|(iwxP)|(iwxP2.10 正态分布时的统计决策
3、正态分布时的统计决策Made in CV&PRLab of Shandong University1单变量正态分布单变量正态分布v 定义:定义:(2.8.1-1)其中:其中:为随机变量为随机变量x的期望,也就是平均值;的期望,也就是平均值;v 为为x的方差,的方差,为均方差,又称为标准差。为均方差,又称为标准差。(2.8.1-2)(2.8.1-3))(21exp21)(2xx2dxxxxE)()(dxxx)()(222.10.1 正态分布概率密度函数的定义及性质正态分布概率密度函数的定义及性质Made in CV&PRLab of Shandong University概率密度函数的一般图形如
4、下:概率密度函数的一般图形如下:Made in CV&PRLab of Shandong University具有以下性质:具有以下性质:从从 的图形上可以看出,只要有两个参数的图形上可以看出,只要有两个参数 就可以完全确定其就可以完全确定其曲线。为了简单,常记曲线。为了简单,常记 为为 。若从服从正态分布的。若从服从正态分布的总体中随机抽取样本总体中随机抽取样本x,约有,约有95的样本落在的样本落在 中。样中。样本的分散程度可以用本的分散程度可以用 来表示,来表示,越大分散程度越大。越大分散程度越大。)(,0)(xx1)(dxx(2.8.1-4))(x2和)(x),(2N)2,2(Made
5、in CV&PRLab of Shandong University2多元正态分布多元正态分布v 定义:定义:(3.1-5)其中:其中:为为d维随机向量,对于维随机向量,对于d维随机向量维随机向量x,它的均值向量它的均值向量 是是d维的。也就是:维的。也就是:为为d维均值向量。维均值向量。是是 维协方差矩阵,维协方差矩阵,是是 的逆矩阵,的逆矩阵,为为 的行列式。的行列式。协方差矩阵协方差矩阵 是对称的,其中有是对称的,其中有 个独立元素。由于个独立元素。由于 可由可由 和和 完全确定,所以实际上完全确定,所以实际上 可由可由 个独立元素来确定。个独立元素来确定。)()(21exp|)2(1)
6、(1212xxxTdTdxxxx,21Td,21dd 1|2/)1(dd)(x)(x2/)1(dddMade in CV&PRLab of Shandong University 是是 的转置,且:的转置,且:、分别是向量分别是向量x和矩阵和矩阵 的期望。的期望。具体说:若具体说:若 是是 的第的第i个分量,个分量,是是 的第的第i个分量,个分量,是是 的第的第i、j个元素。个元素。(3.1-6);其中为边缘分布);其中为边缘分布Tx)()(xxE)(TxxETxx)(ixxi2ijiiiiiidxxxdxxxxE)()(didxdxdxxx21)()(Made in CV&PRLab of
7、Shandong University对于二维随机变量对于二维随机变量X和和Y作为一个整体,其分布函数作为一个整体,其分布函数F(x,y),而),而X和和Y都是随机变量,各别也有分布函数都是随机变量,各别也有分布函数FX(x)、FY(y),分别称为二维随机变,分别称为二维随机变量(量(X,Y)关于)关于X和和Y的边缘分布函数。有:的边缘分布函数。有:),()(xFxFX和和),()(yFyFY对于离散随机变量有:对于离散随机变量有:xxjijXipxFxF1),()(从中得到从中得到X的分布律为:的分布律为:1jijipxXP同样,同样,Y的分布律为:的分布律为:1iijjpyYPMade i
8、n CV&PRLab of Shandong University对于连续型随机变量(对于连续型随机变量(X,Y),假定它的概率密度为),假定它的概率密度为 ,由:,由:),(yxfdxdyyxfxFxFxX),(),()(知道,知道,X的概率密度为:的概率密度为:dyyxfxfX),()(同样也可以求出同样也可以求出Y的概率密度函数。的概率密度函数。Made in CV&PRLab of Shandong University)(j2jiiijxxE),()(jjijijiidxdxxxxx 222212222221221212211dddddd而:而:(3.1-7)(3.1-8)协方差协方
9、差矩阵矩阵:是一个对称矩阵,只考虑是一个对称矩阵,只考虑 为正定矩阵的情况,也就是为正定矩阵的情况,也就是 所有的所有的子式都大于子式都大于0。即。即 ,同单变量正态分布一样,多元正态分布同单变量正态分布一样,多元正态分布 可以由可以由 和和 完全完全确定,常记为确定,常记为 。|0|2110222212212211)(x),(NMade in CV&PRLab of Shandong University3多元正态分布的性质多元正态分布的性质(1)参数)参数 对分布的决定性对分布的决定性对于对于d维随机向量维随机向量x,它的均值向量,它的均值向量 也是也是d维的,协方差矩阵是维的,协方差矩阵
10、是对称的,其中有对称的,其中有 个独立元素。个独立元素。可由可由 完完全确定,实际上全确定,实际上 可由可由 个独立元素决定。个独立元素决定。常记为:常记为:。(2)等密度点的轨迹为一超椭球面)等密度点的轨迹为一超椭球面由由 的定义公式(的定义公式(3.1-5)可知,当右边指数项为常数时,密)可知,当右边指数项为常数时,密度度 的值不变,所以等密度点满足:的值不变,所以等密度点满足:和2/)1(dd)(x和)(x2/)1(ddd)(x),(N)(x)(xMade in CV&PRLab of Shandong University常数)()(1xxT可以证明,上式的解是一个超椭球面,其主轴方向
11、取决于可以证明,上式的解是一个超椭球面,其主轴方向取决于 的本征向量的本征向量(特征向量),主轴的长度与相应的本征值成正比。如下图所示:(特征向量),主轴的长度与相应的本征值成正比。如下图所示:Made in CV&PRLab of Shandong University从上图可以看出,从正态分布总体中抽取的样本大部分落在由从上图可以看出,从正态分布总体中抽取的样本大部分落在由 和和 所确定的一个区域里,这个区域的中心由均值向量所确定的一个区域里,这个区域的中心由均值向量 决定,区域的大决定,区域的大小由协方差矩阵决定。小由协方差矩阵决定。在数理统计中,令:在数理统计中,令:式中式中 称为称为
12、x到到 的马氏距离(的马氏距离(Mahalanobis)距离。所以,等密)距离。所以,等密度点轨迹是度点轨迹是x到到 的马氏距离的马氏距离 为常数的超椭球面。该超椭球面构为常数的超椭球面。该超椭球面构成的球体的大小是样本对于均值向量的成的球体的大小是样本对于均值向量的“离散度度量离散度度量”。体积:体积:)()(12xxTdd21|Made in CV&PRLab of Shandong University!)!21(2)!2(2)1(2dddddddd为偶数为偶数d为奇数为奇数如果如果d确定了,则确定了,则 不变,不变,v与与 有关。也就是对于给定的有关。也就是对于给定的维数维数d,样本离
13、散度随,样本离散度随 而变。而变。21|21|dMade in CV&PRLab of Shandong University(3)不相关性等价于独立性概率论中,两个随机变量概率论中,两个随机变量 和和 之间不相关,并不意味着它们之间不相关,并不意味着它们一定独立。如果一定独立。如果 和和 之间不相关,则的数学期望有:之间不相关,则的数学期望有:如果如果 和和 相互独立,则有:相互独立,则有:独立性是比不相关更强的条件。不相关反映了独立性是比不相关更强的条件。不相关反映了 和和 的总体性质。的总体性质。如果如果 和和 相互独立,则它们之间一定不相关,反之则不成相互独立,则它们之间一定不相关,反
14、之则不成立。但是对服从正态分布的两个分量立。但是对服从正态分布的两个分量 和和 ,若,若 与与 互互不相关,则它们之间一定独立。不相关,则它们之间一定独立。ixjxixjx)()()(jijixExExxE)()(),(jijixPxPxxPixjxixjxixjxixjxixjxMade in CV&PRLab of Shandong Universityixjx)(2jjiiijxxE)()(),(jijixExExxE)()()(2jjiijjiiijxExExxE)(iixE0)()()()(iiiiiixEExExE02ij证明:根据定义,证明:根据定义,和和的协方差的协方差又根据不
15、相关定义又根据不相关定义有:有:又:又:,所以:有所以:有Made in CV&PRLab of Shandong University2211dd221111001dddiii12|diii121|协方差矩阵协方差矩阵成为对角阵。成为对角阵。,可以计算出:可以计算出:Made in CV&PRLab of Shandong UniversityddddddxxxxxTx1122111111001,)()(21)(diiiiix)()(21exp|)2(1)(1212xxxTddiiiiiidiiixx121)()(21exp21因此,因此,根据独立性的定义:正态分布随机向量的各分量间互不相关
16、性与相互独立等价。根据独立性的定义:正态分布随机向量的各分量间互不相关性与相互独立等价。Made in CV&PRLab of Shandong University(4)边缘分布与条件分布的等价性)边缘分布与条件分布的等价性不难证明正态随机向量的边缘分布与条件分布仍服从正态分布。从不难证明正态随机向量的边缘分布与条件分布仍服从正态分布。从(3)证明得出的结论)证明得出的结论 表达式,如果表达式,如果x用用 表示,有:表示,有:也就是说,边缘分布也就是说,边缘分布 服从均值为服从均值为 ,方差为,方差为 的正态分的正态分布:布:同理,同理,)(x1x)(21exp(21)(211111xxii
17、)(1x1211),()(21111Nx),()(22222NxMade in CV&PRLab of Shandong University另外,条件分布,给定另外,条件分布,给定 的条件下的条件下 的分布:的分布:1x2x)(),()|(12112xxxxx)()()(|21exp|21),(22112122222112112222121xxxxxx代入上式,代入上式,服从正态分布,同理服从正态分布,同理 也服从正也服从正态分布。态分布。)|(12xx)|(21xxMade in CV&PRLab of Shandong University(5)线性变换的正态性)线性变换的正态性对于多元
18、随机向量的线性变换,仍为多元正态分布的随机向量。对于多元随机向量的线性变换,仍为多元正态分布的随机向量。就是:就是:x服从正态分布服从正态分布 ,对,对x作线性变换作线性变换 ,其,其中中A为线性变换矩阵,且为线性变换矩阵,且 ,则,则y服从正态分布:服从正态分布:),()(NxAxy 0|A),()(TAAANyMade in CV&PRLab of Shandong University(6)线性组合的正态性)线性组合的正态性若若x为多元正态随机向量,则线性组合是一维的正态随机变量:为多元正态随机向量,则线性组合是一维的正态随机变量:其中,其中,a与与x同维。同维。),()(aaaNyTT
19、Made in CV&PRLab of Shandong University2.10.2 正态分布中的正态分布中的Bayes分类方法分类方法在上一章,我们已经把基于在上一章,我们已经把基于Bayes公式的几种分类判决规则抽象为相公式的几种分类判决规则抽象为相应的判决函数和决策面方程。这几种方法中应的判决函数和决策面方程。这几种方法中Bayes最小错误率判最小错误率判决规则是一种最基本的方法。如果取决规则是一种最基本的方法。如果取01损失函数,最小风险判损失函数,最小风险判决规则和最大似然比判决规则均与最小错误判决规则等价。为了决规则和最大似然比判决规则均与最小错误判决规则等价。为了方便,我们
展开阅读全文