多元统计应用分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元统计应用分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 应用 分析 课件
- 资源描述:
-
1、多元统计分析研究的对象 一元统计分析是研究一个随机变量统计规律性的学科。多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。它的内容既包括一元统计学中某些方法的直接推广,也包括多个随机变量特有的一些问题。多元统计分析是一类范围很广的理论和方法。多元统计分析研究的内容和方法简化数据结构(降维问题)箱式数据箱式数据平面数据平面数据变换主成分分析主成分分析Principle Analysis因子分析因子分析FactorAnalysis按观测点分类或按变量分组 分类比较是一切科学比较的基础和开端 对观测点分类:银行发放贷款 对各企业财务指标、信用状况进行分析 对变量分组:股
2、票市场是宏观经济的晴雨表 经济指标与股票市场各种指标间的群组关系多元统计分析研究的内容和方法聚类分析聚类分析判别分析判别分析Cluster AnalysisDiscriminant Analysis多元统计分析研究的内容和方法变量间的依存关系、相互关系寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制Regression AnalysisCanonical correlatinal analysis多元数据的统计推断关于参数估计和假设检验问题。特别是多元正态分布的均值向量及协方差阵的估计和假设检验等问题。多元统计分析的理论基础 包括多维随机向量及多维正态随机向量,及由此定义
3、的各种多元统计量,推导其分布和性质,研究它们的抽样分布理论。多元统计分析研究的内容和方法多元统计分析的应用 多元统计分析是解决实际问题的有效的数据处理法。它已广泛地应用于自然科学、社会科学的各个方面。如:教育学、医学、气象学、环境科学、地质学、考古学、服装工业服装的定形分类问题、经济学、农业、社会科学、文学、体育科学、军事科学、心理学、生物学、生态学、火警预报、地震预报、保险科学等领域。内容提要多元正态分布与参数估计1多元正态总体参数的检验2 回归分析 3 判别分析45 主成分分析6 因子分析7 聚类分析 典型相关分析8教学内容结构多元正态参数估计、检验OneTwoThree回归分析聚类分析判
4、别分析主成分分析因子分析多元统计分析典型相关分析(高惠旋 编著)北京大学出版社 Prentice Hall.2001,(4th ed).(张尧庭 方开泰 编著)科学出版社第一章多元正态分布与参数估计多元正态分布与参数估计1随机向量及其数字特征2多元正态分布的定义与基本性质3条件分布与独立性5多元正态分布的参数估计1 随机向量及其分布 P维随机向量 联合分布函数 联合密度函数.),(21pXXXX).,(),(221121pppxXxXxXPxxxF 1),()3(0),()2(),(),()1(21212121212112pppx xxpppdxdxdxxxxfxxxfdxdxdxxxxfxx
5、xFp特征函数一元随机变量 的特征函数:二元随机向量 的特征函数:P元随机向量 的特征函数:X).()(itXeEt ),(21XXX).()(),(221121Xt iXitXiteEeEtt),(21pXXXX).()(),(221121Xt iXitXitXitpeEeEtttpp.;0,0,0,),(21)(2121其它xxcexxfxx),(21XXX2X1X求1.边缘密度.2.与 是否相互独立?3.的特征函数例例1条件分布与独立性两随机向量间的条件分布)2()1(XXX),(1)1(qXXX),(1)2(pqXXXX),(1pxxF),(1pxxf).,(1ptt )1(X)2(X
6、),(11qxxF),(12pqxxF),(11qxxf),(12pqxxf).,(11qtt ).,(12pqtt.),(),()(121)2()1(1pqpxxfxxfxxf)2(X)1(X的D.F d.f c.f的D.F d.f c.f的D.F d.f c.f给定 时,的条件密度函数条件分布与独立性 两随机向量独立的充分必要条件t 与 相互独立t 相互独立 不成立)1(X)2(X.21FFF21fff21 ).()()1(1)2()1(1xfxxfnXXX,21.)(,独立jiXXji 随机向量的数字特征随机向量的数学期望随机向量X的方差阵或协方差阵.)(,),(),()(21pXEXE
7、XEEppijppppppXXXXXXXXXXXXXXXXXXEXXEXXEXD)(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()()(212221212111 标准差矩阵:).,(112/1ppdiagV .)()(,12/112/12/12/1VVRRVV qpqpppqqYXYXYXYXYXYXYXYXYXEYYEXXEYXCOV),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()(),(212221212111ppXXXXXXXXXXXXppppR111212121
8、21,.)()(),cov(,jijiXXXDXDXXji 随机向量的数字特征两随机向量间的协方差阵随机向量X的相关系数阵随机向量的数字特征的性质 随机向量X与Y不相关:若X,Y 相互独立,则 ;反之不一定 成立。均值向量和协方差阵的性质:.),(OYXCovOYXCov),(CBXAECAXBE)()()()()(YBEXAEBYAXE)(),(XDXXCovBYXACovBYAXCov),(),(.)()()(AXADAXDbAXD),()()(),(XYCovEYEXYXEYXCov对称、非负定矩阵随机向量的数字特征的性质 其中L 为非负定矩阵.当矩阵 (正定)时,矩阵L称为 的平方根矩
9、阵,记为 协方差阵 还可分解为 (A 为可逆阵),2L02/1LAA 2 多元正态分布的定义与基本性质一元正态分布一元正态分布密度函数形式特征函数形式一般正态与标准正态之间的关系多个独立正态变量的线性组合仍为正态变量多元正态分布的定义与基本性质定义1 p 维标准正态分布 设 独立同分布于 ,则称随机向量 服从p 维正态分布,记pYYY,21)1,0(N),(21pYYYY).,(ppINY).21exp()2(1)(21exp)2(1),(222221221yyyyyyyyfppppY ).21exp()(21exp),(2222121t tttttttppY 特征函数:密度函数:多元正态分布
10、的定义与基本性质定义2 p 维一般正态分布 设 ,A为 实数矩阵,为 p 维实数向量,则 是 p 维正态分布,记为:其中 为非负定阵。),(qqNYqp11pqqpYAX),(ppNXAAp多元正态分布的定义与基本性质t性质1 若 服从 ,则 (1),(2),(pN EX.DX).()21exp()(Ottt itX X定义3 若p 维随机向量X 的特征函数为 则称X 服从p 元正态分布,记为).()21exp()(Ottt itX ).,(pNX多元正态分布的定义与基本性质t 性质2:若 服从 (1)令 ,为 实数矩阵,为 维实数向量,则 服从 (2)服从 ,c 为实数.t 性质3:服从 为
11、一元正态随机变量.定义4:设 为p 维随机向量,若 ,为一元正态随机变量,则称 X 服从p 元正态分布,记为),(pNdBXZZ).,(BBdBNs Bpsd1scX),(2ccNp X用于验证X.),(ppRLN XL),(21pXXXXpRLXL).,(pNX用于验证多元正态分布的定义与基本性质 定义5:若p 维随机向量 的联合密度函数为 其中 ,则称 X 服从p 元正态分布,记为),(21pXXXX)()(21exp)2(1),;(1212xxxfpO),(pNXt 性质4:若 为正定矩阵,则 服从 具有密度函数X),(pNX)()(21exp)2(1),;(1212xxxfp多元正态分
12、布的四个等价定义 其中 为一元正态随机变量 特征函数 密度函数),(ppNX11pqqpYAX),(qqNYpRLXL)21exp()(ttt itX)()(21exp)2(1),;(1212xxxfp0多用于验证多用于证明二元正态分布的密度函数),(221NXXX),(21.)()(2)()1(21exp1)2(1)()(21exp)2(1),(22222221112111222112121 xxxxxxxxf).0()()(2)(),(22222222111211121aaxxxxCxxf 二元正态分布的等高线(面)是一族中心在 的椭圆.,0,222121212221121121p元正态分
13、布密度函数的等高面1)()(1XX),(pNX)()(21exp)2(1),;(1212xxxfp p元正态分布密度函数的等高面为椭球面,即在距离 的平方为常数的表面上多元正态密度是常数,这些密度曲线称为轮廓线。常数概率密度轮廓线=满足 的所有x=中心在 的椭球的表面。常数密度的每个椭球面的中心在u且轴在 的特征向量的方向上,而且其长度是与 的特征值的平方根的倒数成比例的。21)()(cXX 1(11=1,22=1,12=0)二元正态分布曲面二元正态分布曲面(11=1,22=1,12=0)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75
14、)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面剖面(11=1,22=1/2,12=0.75)3 条件分布与独立性t定理1 若 服从 ,(1)服从 ,服从 ;(2)与 相互独立 .(不相关)2()1(XXX),(22211211)2()1(pN)1(X),(11)1(qN)2(X),(22)2(qpN)1(X)2(X1221,XX),(11111 qNX.00,2211212121 qqNXXt定理2 若 相互独立,且 则.),(22222 qNX条件分布与独立性ppkkkkkpkNXXX1111)()1()()1(,)()1(,kXX).(jiOij说明正态总体独立性
15、与不相关性是等价的t推论2 若 ,则 相互独立t推论1 若 对角阵,则 相互独立.),(),(21NXXXXppXXX,21t推论3:若 不服从正态分布,则 不服从正 态分布.)1(X)2()1(XXX条件分布与独立性定理3 设 则 Y与Z相互独立定理4 设 则Y与Z相互独立,),(11mpmnpnppXBZXAYIONX,0,0BBAA.0BA,),(11mpmnpnpeXBZdXAYNX.0BA?),0)(,(22211211)2()1()2()1(pNXXX)2(X)1(X.),(211221211211)2()2(12212)1(21X),()|(21121)2()1(rNXX定理5
16、设 则当 给定时,的条件分布为 其中 p元正态分布的性质o 每一个变量均服从正态分布。o 变量的线性组合服从正态分布。o p 元正态分布中的任意 k(0km)个变量服 从 k 元正态分布。o p元正态分布的条件分布仍服从正态分布。o 协方差为0的变量间相互独立。5 多元正态分布的参数估计多元样本及数字特征多元样本的概念P维随机样本 P维总体 的一个容量为n的样本:npnnnppXXXXXXXXXXXX21)(22221)2(11211)1(,),(21pXXX 的样本1X 的样本pX样本数据阵(样本资料阵),(1)()2()1(212221212111pnnpppnnXXXXXXXXXXXXX
17、样本均值npnnppXXXXXXXXX212222111211,niipniiniipXnXnXnXXXX1121121111nXnX11其中)1,1,1(1nppijnppnppnppnppnnnppnnnnnnaXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXnIXXXnXXXXXXA)()()()()()()()()()()111 ()(121221111221222111221111221112111)()(样本离差阵样本离差阵样本方差阵)(1111)(1)(XXXXnAnSn样本方差阵其中),2,1()(1121)(pixxnsniiii为 的样本方差;称为 的样本标准
18、差.iXiXiis样本相关系数阵1)()()()()()()()()(1)()()()()()()()()(122222221121122222221122211222211112222112211XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXRipipipipipipipippipipipiiiiipipipipiiiiijjiiijjjiiijijppijsssaaarrR ,)(与 的样本相关系数1XpX多元正态均值向量及协方差阵的极大似然估计定理1 设 是 p 元正态总体 的随机样本,则 为 的极大似然估计,即 ),2,1()(niXi
19、pn)1,(AnX),(niiinnpniiipxxxxL1)(1)(2/2/1)(1)(2/12/)()(21exp)2(1 )()(21exp)2(1),(X)(11)(1)(XXXXnAninii),(pN样本 的似然函数),2,1()(niXi2/2/2/2/0,)2n()1,()2nln(ln2)2ln(1(2),(lnmax)1,(lnnnpnnpXAeAnXLAenAnnpXLAnXL多元正态均值向量及协方差阵的极大似然估计定理2 当 时,的极大似然估计是0)(10)(10)(iniiXXn极大似然估计量的性质定理3 若 和 分别是正态总体 的样本均值和样本离差阵,则 (1)(2
20、),其中 独立同分布于 (3)与 相互独立 (4)证明:设 是n阶正交阵,)1,(nNXpXnnrrrrnnnn/1/1)1(1)1(111XA)0(),(pNA11niiiZZA11,nZZ),0(pNpnAP1)0(,)()1(1XXXZZZnn令极大似然估计量的性质 0)()()(),(01,),1(),(1)()(1111)()()1(1)(1)()1(iniiiiiniinitininitiitittntniititntntrrXXErrEZZEZZEZZCovntnntnrnrEXrEZpZXXpZntXrrrXXZ维正态变量,且也是线性组合,维正态变量是即:.,)(,)3()()
21、(),()2()1,(1 ),(1 )1(111111)(1)(1)()(1)()(111)()(1111)(相互独立与相互独立,故与而的函数是的函数,是且AXZZZZXnZXZZZZAAXXXXXXnXXZZXXZZXXXXXXZZZZZZZZnNZnXnNXnXnZnnnnnniiiiniiniiinnniiiniiiniiinnniiipnnipin极大似然估计量的性质.0)0(,|00 ,|,.)1,1(,0)0(),0(),0(),0(),0(0.,.1)(,)(,0 )()(.1)(),()(1)0(,),()4(22122212111111)1(11 EpzZzZZPEpzZzZ
22、zzZPEpZZZPpZZZZZPZZPpBPniZPNZNZpBPpnnnpBrpArABrArpnpBrPBrArpnAPBBAZZBpppppppipiiipiipinpn使的线性组合可表成的线性组合可表成的线性组合可表成线性相关列线性相关的前即,非零常向量列线性相关的前只须证设时当只须证下证则记极大似然估计量的性质极大似然估计量的性质定理4 ,若 为正定矩阵,则 21)()(pXXn可作为检验统计量可作为检验统计量)1,(nNXp极大似然估计量的性质t无偏性 与 分别是 和 的无偏估计,即t有效性 与 分别是 和 的最小方差无偏 估计量.t相合性(一致性)当 时 与 分别是 和 的强相
23、合估计.t充分性 与 分别是 和 的充分统计量.XAnS11)(XE1()1EAn XnAnS11XAn1XAn1第二章多元正态总体参数的假设检验多元正态总体参数的假设检验1几个重要统计量的分布2单总体均值向量的检验3多总体均值向量的检验5独立性检验66 正态性检验及其SAS实现1 几个重要统计量的分布一、正态变量二次型的分布 1.分量独立的n维随机向量X的二次型定义1 中心 分布与矩阵表达 设 独立同分布于 ,则 若记 ,且 则 推广:若 则 2nXXX,21)1,0(N)(212nXnii),(21nXXXX),(nnINX)(2nXX),(),(21nnnINXXX)(122nXX分量独
24、立的 n 维随机向量 X 的二次型2,),(21nXXXX),0)(,(nnINX)(2nXXXXnii12).,(2nXX1,0),(),(221nnnINXXX).,(122nXXYY,),(21nXXXX.1 ),(.,221niNdi iXXXiinniniiXZ122)()(niii12.)(定义2 非中心 分布与矩阵表达设且则随即变量 服从自由度为 n,非中心参数为的卡方分布,并记为 或推广:若 则若则其中分量独立的 n 维随机向量 X 的二次型t性质 (i)设 相互独立,则 (ii)设 则 (iii)(iv)若 则X 特征函数为 ,21pXXX)(2nX),(11221pipii
25、ipnXXX.,),()2()1()2()1(12nnnXXXINX.2,1),()()(2)()(inXXiiiii.42)(,)(22nDnEnn21exp)21()(2ititittn,1),(2kinXiii分量独立的 n 维随机向量 X 的二次型定理1 设 则 (A为对称幂等阵)证明:,)(,),(2rArAAIONXnn.)(/222AArAXX,1,)21()21(.)21(/),(/.)21(/)1()1(/),0(.,/.),().00,(,)(,2112/12/2/222112/122222211222221rriirrririiiiirriiinnrtiititAXXrA
展开阅读全文