《应用多元统计分析》课件yydyfx3B.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《应用多元统计分析》课件yydyfx3B.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用多元统计分析 应用 多元 统计分析 课件 yydyfx3B
- 资源描述:
-
1、1 应用多元统计分析 第三章第三章 多元正态总体多元正态总体 参数的假设检验参数的假设检验(二二)2第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验目目 录录(二二)3.3 多总体均值向量的检验多总体均值向量的检验3.4 协差阵的检验协差阵的检验3.5 独立性检验独立性检验3.6 正态性检验正态性检验 第三章所涉及的最大似然估计量小结第三章所涉及的最大似然估计量小结 3第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 当当p1时,因时,因 且相互独立,故有且相互独立,故有 1.两
2、总体协差阵相等两总体协差阵相等(但未知但未知)时均值向量的检验时均值向量的检验 设设X()(1,n)为来自总体为来自总体XNp(1),)的随机的随机样本;样本;Y()(1,m)为来自总体为来自总体Y Np(2),)的随机样本的随机样本,且相互独立且相互独立,未知未知.检验检验.:,:)2()1(1)2()1(0HH),(),(2)2(12)1(1mNYnNX),)11(,(2)2()1(1mnNYX4第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 取检验统计量为取检验统计量为 t(n+m-2)(
3、在在H0成立时成立时),即即 5第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 推广到推广到p元总体元总体,检验统计量的形式类似检验统计量的形式类似,可考虑以下检可考虑以下检验统计量验统计量T2:其中其中A1和和A2是两总体的样本离差阵是两总体的样本离差阵.它们是一元统计中它们是一元统计中的偏差平方和的偏差平方和(X(i)-X)2在在p元情况下的推广元情况下的推广.以下来证以下来证明统计量明统计量T 2 T 2(p,n+m-2).因因),0()(),)11(,0(00pHpHNYXmnnmmnN
4、YX下下6第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 由由Wishart分布的可加性知分布的可加性知 A1+A2Wp(n+m-2,),由由T2统计量的定义统计量的定义3.1.5可知可知),1()()(1)(1nWXXXXApn),1()()(1)(2mWYYYYApn7第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 利用利用T2与与F的关系,检验统计量取为的关系,检验统计量取为 可以证明可以证
5、明T2(或或F)统计量是检验以上假统计量是检验以上假设设H0的似然比统计量的似然比统计量.(见习题见习题3-10)8第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 例例3.3.1 为了研究日、美两国在华投资企业对中国为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异经营环境的评价是否存在差异,今从两国在华投资企业今从两国在华投资企业中各抽出中各抽出10家家,让其对中国的政治、经济、法律、文化让其对中国的政治、经济、法律、文化环境进行打分环境进行打分,评分结果见表评分结果见表3.
6、2(表中表中1至至10号为美国在号为美国在华投资企业的代号华投资企业的代号,11至至20号为日本在华投资企业的代号为日本在华投资企业的代号号.数据来源于数据来源于:国务院发展研究中心国务院发展研究中心APEC在华投资企在华投资企业情况调查业情况调查).解解 比较日、美两国在华投资企业对中国多方面的比较日、美两国在华投资企业对中国多方面的经营环境的评价是否有差异问题经营环境的评价是否有差异问题,就是两总体均值向量就是两总体均值向量是否相等的检验问题是否相等的检验问题.(见见yydy331a.sas或或yydy331b.sas)9第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3
7、.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 10第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 记美国在华投资企业对中国记美国在华投资企业对中国4个方面的经营环境的个方面的经营环境的评价为评价为4维总体维总体X,并设并设XN4(1),).日本在华投资企日本在华投资企业对中国经营环境的评价为业对中国经营环境的评价为4维总体维总体Y,并设并设YN4(2),).来自两总体的样本容量来自两总体的样本容量n=m=10.检验检验取检验统计量为取检验统计量为 由
8、样本值计算得:由样本值计算得:X(64,43,30.5,63),Y(51.5,51,40,70.5),.:,:)2()1(1)2()1(0HH11第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子进一步计算可得:进一步计算可得:12第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子对给定显著性水平对给定显著性水平=0.01,利用统计软件进行检验时,利用统计软件进行检验时,首先计算首先计算p值值
9、(此时检验统计量此时检验统计量FF(4,15):p=PF6.2214=0.0037.因因p值值=0.00370.01=,故否定故否定H0,即日、美两国在华投即日、美两国在华投资企业对中国经营环境的评价存在显著性差异资企业对中国经营环境的评价存在显著性差异.在这种在这种情况下情况下,可能犯第一类错误可能犯第一类错误,且犯第一类错误的概率为且犯第一类错误的概率为0.01.13第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 2.两总体协差阵不等时均值向量的检验两总体协差阵不等时均值向量的检验 在一元统
10、计中在一元统计中(p=1时时),当,当12 22时时,检验检验H0:(1)(2)也没有很好的方法,以下介绍实用中的几种方法也没有很好的方法,以下介绍实用中的几种方法.当当n=m时时,作为成对数据进行处理作为成对数据进行处理.令令Z(i)=X(i)-Y(i)(i=1,n),化为单个化为单个p元总体元总体Z的均值检的均值检验问题验问题 H0:(1)(2)H0:Z0 利用前面介绍的方法进行检验利用前面介绍的方法进行检验.注意:在这里两组样本相互独立的信息没有利用注意:在这里两组样本相互独立的信息没有利用.14第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检
11、验多总体均值向量的检验-两个两个p元正态总体元正态总体 当当nm时时(不妨设不妨设nm):想法也是化为单个想法也是化为单个p元元新总体的均值检验问题新总体的均值检验问题.若只取若只取n对数据按方法处理对数据按方法处理,又将损失一些信息又将损失一些信息.改进的办法是利用改进的办法是利用X(i)(i=1,n)和和Y(j)(j=1,m),构造新总体构造新总体Z的样本的样本Z(i),令令可以证明:可以证明:)2()1()2()1()2()2()2()1()(1)(mnmnnmnmnZE15第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验
12、-两个两个p元正态总体元正态总体所以所以Z(i)N p(1)-(2),Z)(i1,n),且相互独立且相互独立.利用利用前面介绍的单个正态总体均值向量的检验方法进行检前面介绍的单个正态总体均值向量的检验方法进行检验验.当当1,2相差甚大时相差甚大时,可构造近似检验统计量进可构造近似检验统计量进行检验行检验(见参考文献见参考文献1).21mnZ其中其中16第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 多个正态总体均值向量的检验问题也称为多元方差多个正态总体均值向量的检验问题也称为多元方差分析分析.设有设有
13、k个个p元正态总体元正态总体Np(t),)(t1,k),样品样品 (t1,k,1,nt)是来自是来自Np(t),)的随机样的随机样本,检验本,检验 H0:(1)(k),H1:至少存在至少存在ij使得使得(i)(j)(即即(1),(k)中至少有一对不等中至少有一对不等).当当p=1时时,此检验问题就是一元方差分析问题此检验问题就是一元方差分析问题,比如比比如比较较k个不同品牌的同类产品中一个质量指标个不同品牌的同类产品中一个质量指标X(如耐磨度如耐磨度)有无显著差异的问题有无显著差异的问题,我们把不同品牌对应不同总体我们把不同品牌对应不同总体(假假定为正态总体定为正态总体),这种多组比较问题就是
14、检验问题这种多组比较问题就是检验问题.)()(tX17第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 从第从第i个总体抽取容量为个总体抽取容量为ni的随机样本如下的随机样本如下(i=1,k;记记n=n1+n2+nk):18第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析(p=1)当当p=1时时,利用一元方差分析的思想来构造检验统计量利用一元方差分析的思想来构造检验统计量.记记 则有则有平方和分解公式:平方和分解公式
15、:SSTSSA+SSE 19第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析(p=1)直观考察直观考察,若若H0成立成立(即即k个总体均值个总体均值无显著差异无显著差异),当当总偏差平方和总偏差平方和SST固定不变时固定不变时,应有组间偏差平方和应有组间偏差平方和 SSA小小,而组内偏差平方和而组内偏差平方和 SSE大大,因而比值因而比值SSA/SSE应应很小很小.检验统计量取为检验统计量取为 给定显著性水平给定显著性水平,按传统检验方法按传统检验方法,查查F分布临界值表分布临界值表得得F满足:满足:PF
16、F,否定域否定域WFF.20第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 推广到推广到k个个p元总体元总体Np(t,)(假定假定k个总体的协差阵相个总体的协差阵相等,且记为等,且记为),记第记第i个个p元总体的数据阵为元总体的数据阵为对总离差阵进行分解:对总离差阵进行分解:)()()()(11)()(XXXXTijkinjiji)()()()()()(11)()()()(XXXXXXXXiiijkinjiiiji),1()()()()()()1()()(1)(1)(11)(kiXXxxxxXiniip
17、ninipiipniiii21第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 其中其中 称为组间离差阵称为组间离差阵.0)()(1)()(injijXXi因故交叉项故交叉项=OkinjiikinjiijiijiiXXXXXXXX11)()(11)()()()()()()()(kiiiikiiXXXXnA1)()(1)(kiiiiXXXXnB1)()()(kiiAA1称为组内离差阵称为组内离差阵.22第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向
18、量的检验多元方差分析多元方差分析 根据直观想法及用似然比原理得到检验根据直观想法及用似然比原理得到检验H0的统计量为的统计量为 由由Wishart分布的定义容易得出分布的定义容易得出:因因 Ai Wp(ni-1,)且相互独立且相互独立(i1,k),由可加性由可加性可得可得AA1+AkWp(n-k,)(n=n1+nk).在在H0下,下,TWp(n-1,).还可以证明在还可以证明在H0下下,BWp(k-1,),且且B与与A相互独相互独立立.23第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析根据根据分布的定义
19、,可知分布的定义,可知 给定显著性水平给定显著性水平,查查Wilks分布临界值表分布临界值表,可得可得,使使 P,故否定域故否定域W.当手头没有当手头没有Wilks临界值表时临界值表时,可用可用2分布或分布或F分布来分布来近似近似,即由即由的函数的近似分布进行检验的函数的近似分布进行检验(见参考文献见参考文献1或或2).24第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析的例子多元方差分析的例子 例例3.3.2 为了研究某种疾病为了研究某种疾病,对一批人同时测量了对一批人同时测量了四个指标四个指标:脂蛋白脂蛋白(X1
20、),甘油三酯甘油三酯(X2),脂蛋白脂蛋白(X3),前前脂蛋白脂蛋白(X4).按不同年龄、不同性别分为三组按不同年龄、不同性别分为三组(20至至35岁的女性、岁的女性、20至至25岁的男性和岁的男性和35至至50岁的男性岁的男性),数据数据见书中表见书中表3.3.试问这三组的四项指标间有无显著性差试问这三组的四项指标间有无显著性差异异?解解 比较三个组比较三个组(k=3)的的4项指标项指标(p=4)间是否有差异间是否有差异问题,就是多总体均值向量是否相等的检验问题问题,就是多总体均值向量是否相等的检验问题.设设第第i组为组为4维总体维总体N4(i),)(i=1,2,3).来自来自3个总体的样本
21、个总体的样本容量容量n1=n2=n3=20.检验检验 H0:(1)(2)(3)H1:(1),(2),(3)至少有一对不相等至少有一对不相等.(见见yydy332?.sas)25第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 26第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子 因似然比统计量因似然比统计量(p,n-k,k-1),此例中此例中k-1=2,可以可以利用利用统计量与统计量与F统
22、计量的关系统计量的关系,取检验统计量为取检验统计量为F统计统计量:量:由样本值计算得:由样本值计算得:X=(259.08,84.12,32.37,17.8),27第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子)()()()(11)()(XXXXTtktntt28第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子进一步计算可得进一步计算可得对给定对给定=0.01,利用统计软件利用统计软件(如
23、如SAS系统系统),首先计算首先计算p值值(此时检验统计量此时检验统计量FF(8,108):p=PF3.09007=0.003538.因因p值值=0.0035380.01=,故否定故否定H0,这表明三个组的指这表明三个组的指标之间有显著的差异标之间有显著的差异.在这种情况下在这种情况下,可能犯第一类错误可能犯第一类错误,且第一类错误的概率为且第一类错误的概率为0.01.29第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子 进一步地若还想了解三个组指标间的差异究竟是哪进一步地若还想了解三个组指
24、标间的差异究竟是哪几项指标引起的几项指标引起的,可以对可以对4项指标逐项用一元方差分析项指标逐项用一元方差分析方法进行检验方法进行检验,我们将发现三组指标间只有第一项指标我们将发现三组指标间只有第一项指标X1有显著差异有显著差异.事实上事实上,用一元方差分析检验第一项指标用一元方差分析检验第一项指标X1在三个组在三个组中是否有显著差异时中是否有显著差异时,因因 12111)(111SST)(kiniixXt1211)(1)(111SSE)(kiniiixXa30第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子
25、多元方差分析的例子其中其中t11和和a11分别是分别是T和和A中的第一个对角元素中的第一个对角元素.p1=PF18.8780=0.0004401(检验统计量检验统计量F1F(2,57)p值值=0.0004401显著地小于显著地小于0.01,故第一项指标故第一项指标X1在三个组中有显著差异在三个组中有显著差异.31第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 设设X()(=1,n)为来自为来自p元正态总体元正态总体Np(,)(0未知未知)的随机样本的随机样本,检验检验 H0:0(00为已知阵为已知阵),
展开阅读全文