多元正态分布(新)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元正态分布(新)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 正态分布 课件
- 资源描述:
-
1、网销初级第一章第一章 多元正态分布及其参数估计多元正态分布及其参数估计网销初级多元正态分布的重要性:多元正态分布的重要性:(1)多元统计分析中很多重要的理论和方法都是直接或间接)多元统计分析中很多重要的理论和方法都是直接或间接 地建立在正态分布地建立在正态分布 基础上的,许多统计量的极限分布往往和基础上的,许多统计量的极限分布往往和 正态分布有关。正态分布有关。(2)许多实际问题涉及的随机向量服从多元正态分布或近似)许多实际问题涉及的随机向量服从多元正态分布或近似 服从正态分布。因此多元正态分布是多元统计分析的基础。服从正态分布。因此多元正态分布是多元统计分析的基础。一、多元正态分布的定义一、
2、多元正态分布的定义定义定义1:若若p维随机向量维随机向量 的密度函数为:的密度函数为:其中,其中,是是p维向量维向量 是是p阶正定矩阵,则称阶正定矩阵,则称X服服从从p维正态分布,记为维正态分布,记为 ),(1pXXX)()(21exp)2(1),(12/11xxppxxfx),(1pxx),(XpN1多元正态分布的定义及其性质多元正态分布的定义及其性质网销初级定义定义2:独立标准正态变量独立标准正态变量 的有限线性组合的有限线性组合 mXX,1mmppXXAYYY11称为称为p维正态随机变量,记为维正态随机变量,记为 其中其中但是但是 的分解一般不是唯一的。的分解一般不是唯一的。),(YpN
3、AA AA pmppmmaaaaaaaaaA212222111211网销初级定义定义3:若随机向量:若随机向量X的特征函数为:的特征函数为:其中其中t为实向量,则称为实向量,则称X服从服从p元正态分布。特征函数定义的优点在于可以包含元正态分布。特征函数定义的优点在于可以包含 的情况。的情况。ttt it21exp)(0网销初级特别地,特别地,二元正态分布二元正态分布:),(),(221NXXX2222211221121121),()1,0,0(2122112121222221112211),cov(),(,)()(,XXXXXVarXVarEXEX)(2)()()1(21exp121),(22
4、11111122222211112222221121xxxxxxf网销初级二元正态分布曲面()0,1,112222211网销初级二元正态分布曲面()75.0,4,212222211网销初级即即 ,两个随机变量独立,两个随机变量独立而而 可以求得可以求得 的边缘密度函数为:的边缘密度函数为:21121111112)(exp21)(xxf22222222222)(exp21)(xxf21,XX当当 时时X1与与X2不相关,对于正态分布来说不相关和独立不相关,对于正态分布来说不相关和独立等价。因为此时:等价。因为此时:0为为X1和和X2的相关系数。的相关系数。2)()(exp21),(2222112
5、22211221121xxxxf)()(),(2121xfxfxxf网销初级二、多元正态分布的性质二、多元正态分布的性质 性质性质1:若:若 ,是对角矩阵,则是对角矩阵,则 相互独立。相互独立。性质性质2:若:若 则则 ),(),(1XppNXX pXX,1),(XpN维常数向量为阶常数矩阵,为sdpsA),(AAdANdAXs性质性质3:若:若 ,将,将 作剖分:作剖分:则则),(XpN,XqqpqqpqqpXXX22211211)2()1()2()1(,),(),(22)2()2(11)1()1(qqNXNX网销初级性质4:p 元正态分布的条件分布仍服从正态分布。即在某些变量取固定值时,另
6、外一些变量的分布仍然服从多元正态分布。网销初级三、正态分布数据的变换三、正态分布数据的变换若一批多元数据不满足正态分布时,可以对数据进行正态变换。一般来说常采用幂变换,如果想使值变小可以采用变换:21411,ln,xxxx如果想使值变大,则采用变换:32,xx不管使用哪种幂变换,还应该对变换后的数据的正态性做检验.网销初级2多元正态分布的参数估计多元正态分布的参数估计 一、多元样本及其样本数字特征一、多元样本及其样本数字特征多元样本阵多元样本阵记记npnnppXXXXXXXXX212222111211XniXXXXipiii2,1),(21)(网销初级2、多元样本的数字特征、多元样本的数字特征
7、样本均值:样本均值:pnpnppniiXXXXXXXXXXXXnn2112122221112111)(11样本均值向量可以用样本矩阵表示出来,即)1,1,1(11nn11XnXp网销初级因为:XXXXXXXXXXXXXnXXXXXXXXXnnpnpppnnpnnnpp21212221212111212221212111n111111X网销初级样本离差阵样本离差阵ppijppppppnipippipipippipiiiipipiiiipipiinipipiiiniippssssssssssXXXXXXXXXXXXXXXXXxXXXXXXXXXXXXXXXXXXXXXXXXXXXXS)()()()
8、()()()()()()()()(212222111211122211122222112112211211221112211)(1)(网销初级样本协方差矩阵样本协方差矩阵 或或 SnV1SnV11样本离差阵用样本资料阵表示为:XX)1(nn11 nISn网销初级因为XXXXXXXXXX)1(1)()()()()()()(1)(1)()()()()(1)(1)()(1)(nnnn1111nInXXnXXXXXXXXXXXXXXXXXXXXXXSnniiniiiiiiniiniiinii网销初级二、多元正态总体的最大似然估计及其性质二、多元正态总体的最大似然估计及其性质利用最大似然法求出利用最大似
9、然法求出 和和 的最大似然估计为:的最大似然估计为:SnX1网销初级)()(21exp)()(1)(12iininpxx2)()()(),()()2()1(nxfxfxfL)()(21exp)2()(1)(2121 iipnixx求解过程求解过程似然函数为:似然函数为:)()(21exp)()(1)(12iininpxxtr2)(21exp)()()(112iininpxxtr2)(21(exp)()()(112iininpxxtr2网销初级对数似然函数为:对数似然函数为:)(21|ln22ln2),(ln)()(11iinixxtrnnpL)(21|ln22ln211xxnStrnnp)()
10、(2)(21|ln22ln211xxnStrnnp)(21|ln22ln21Strnnp时等号成立仅当x网销初级)()()()()()()()()(1)(11)()()(1)()(1)()(xxnSxxnxxxxxxxxxxxxxxxxxxniininiiiiniiiniii网销初级)(21|ln22ln2),(ln1StrnnpXL)(|ln22ln21nStrnnp)(|ln|ln22ln211nStrnSnSnnp)(|ln|ln22ln221212121nStrnSnSnnp|ln222ln2nSnnpnpnS时等号成立,即pInSA2/12/1(引理:设A为p阶正定矩阵,则 当A=I
11、等号成立。pAAtrln)(网销初级最大似然估计的性质最大似然估计的性质 1.,即,即 是是 的无偏估计的无偏估计。,即,即 不是不是 的无偏估计。的无偏估计。,即,即 是无偏估计。是无偏估计。2.分别是分别是 的最小方差无偏估量。的最小方差无偏估量。3.分别是分别是 的一致估计。的一致估计。)(XEXnnSnE1)1(Sn1)11(SnESn 11SnX11,)11(1,SnSnX,网销初级三、维斯特三、维斯特(Wishart)分布分布-一元一元 分布的推广分布的推广定义:定义:设设 个随机向量个随机向量 独立同分布于独立同分布于 ,则随机矩阵则随机矩阵 服从自由度服从自由度为为n的非中心维
12、斯特分布,记为的非中心维斯特分布,记为n),3,2,1(),(21)(niXXXipiiiX ),(pNni 1)()(iiW),(nWWp2随机矩阵的分布:随机矩阵的分布:npnnppXXXXXXXXXX212222111211将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则只取其下三角的部分拉直即可。只取其下三角的部分拉直即可。网销初级性质:性质:(1)若)若W1和和W2独立,其分布分别为独立,其分布分别为 和和 ,
13、则,则 分布为分布为 ,即维斯特,即维斯特(Wishart)分布有可加性。分布有可加性。(2),C为为mp阶的矩阵,则阶的矩阵,则 的分布为的分布为 ),(nWWpCCW),(1nWp),(2nWp21WW),(21nnWp),(CC nWm网销初级定理:定理:设设 分别是来自正态总体分别是来自正态总体 的样本均值和离差阵的样本均值和离差阵,则,则(1)(2)(3)相互独立。相互独立。(4)S为正定矩阵的充分必要条件是为正定矩阵的充分必要条件是 np。SX,),(pN)1,(nNXp),1(nWSpSX,11网销初级一元正态总体:nXX,1为来自一元正态总体的一组样本211)(1niiniiX
14、XSXnX定理:是相互独立的。与SX证明:构造正交矩阵)1()1()1(1)1(1)1(1)1(10023223123100012112111111nnnnnnnnnnnnnnnnA网销初级做变换nnXXXAYYY2121XnXnYnii1112121212)(XnXXXXXAXAXYYYniiniiniiniiniiYYYS2221122网销初级第三章多元正态总体参数的假设检验第三章多元正态总体参数的假设检验一、一、Hotelling T2分布分布 一元一元t分布的推广分布的推广定义定义 设设 ,且,且X与与S相互独立,相互独立,则称统计量则称统计量 的分布为非中心的的分布为非中心的Hote
15、lling T分布,记为分布,记为 ,当,当 时称为中心时称为中心的的HotellingT2分布。记为分布。记为),(),(nWSNXpppn XSXnT12),(22npTT0。),(22npTT一元一元t分布分布:设总体设总体 是一组样本是一组样本,则统计量则统计量 ),(2NXnXX,1网销初级)1()(ntXnt其中niiXXn12)(11)()()()(12222XXnXntXSXnT12与 类似并且)1,1()()()()(12222nFXXnXnt网销初级定理:设定理:设 且且X与与S相互独立,相互独立,令令基本性质基本性质:),(),(nWSNXpp0XSXnT12则则)1,(
16、12pnpFTnppn网销初级二、多元正态总体均值向量的假设检验二、多元正态总体均值向量的假设检验1.单个正态总体单个正态总体(1)协方差矩阵协方差矩阵 已知时均值向量的检验已知时均值向量的检验01000:为已知向量)(:HH检验统计量检验统计量)()()()(201020pXXnT设水平为设水平为 ,查表确定,查表确定 ,使得,使得(当(当H0成立时)成立时))(20TP拒绝域为:拒绝域为:20T网销初级当原假设成立时)1,(0nNXppZZZXnZ2102/1)(令pIDZEZ,0),0(ppINZZZT20网销初级(2)协方差矩阵协方差矩阵 未知时均值向量的检验未知时均值向量的检验 01
17、000:为已知向量)(:HH检验统计量检验统计量),()1(2pnpFTpnpn)1,()()(1(20102npTXSXnnT拒绝域为:拒绝域为:),()1()(2pnpFTpnpn网销初级例:人的出汗多少于人体内钾和钠的含量有一定的关系。测得20名健康成年女性的出汗多少(X1)、钠的含量(X2)和钾的含量(X3)的数据,做如下的假设检验:0100:)10,50,4(:HH网销初级例:在企业市场结构研究中,起关键作用的指标有市场份额X1,企业规模(资产净值总额的对数)X2,资本收益率X3,总收益增长率X4.为了研究市场结构的变动Shepherd(1972)抽取了美国231个大型企业,调查了这
18、些企业1960-1969年的资料。假设以前企业市场结构指标的均值向量为:而该次调查得到的企业市场结构指标的均值向量和协方差矩阵为:)2,10,5.7,20(009.178.1106.892.20X346.1233.2019.0156.0233.2626.26222.0639.1019.0222.0513.1080.0156.0639.1080.0260.0网销初级试问市场结构是否发生了变化?0100:)2,10,5.7,20(:HH865.0066.0007.0105.0066.0068.0030.0397.0007.0030.0687.0405.0105.0397.0405.0536.619
19、1.078.156.092.00X网销初级带入到T2统计量中得到78.3074.1247423042314.124740.5*2312FT临界值37.2)227,4(05.0F因此拒绝原假设,认为市场结构已经发生了显著的变化。网销初级2.协方差阵相等时,两个正态总体均值向量的检验设且两组样本相互独立。(1)有共同已知的协方差矩阵 mYYYYnXXXXpp,2,1),(,2,1),(21)(21)(211210:HH网销初级检验统计量为:成立时)02120()()()(HpYXYXmnnmT拒绝域为:20T网销初级(2)有共同的未知协方差矩阵211210:HH检验统计量为:成立时)02()1,(
20、)2(1)2(HpmnpFTpmnpmnF)()()2(12YXmnnmSYXmnnmmnT网销初级 21SSS)()()()()(1)(2)(1)(1YYYYSXXXXSnn用 代替即可得到上述统计量。2)1()1(21mnSmSn网销初级例:为了研究日美企业在华投资企业对中国经营环境的评价是否存在差异,现从两国在华投资企业中各抽出10家,让其对如下 指标进行打分。假设两组来自正态总体,有共同的未知协方差矩阵,且两组样本相互独立。211210:HH网销初级经计算)5.70,40,51,5.50()63,5.30,43,64(YX101)()(1510844228845.33238042235
展开阅读全文