第六章典型相关分析-65页文档课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第六章典型相关分析-65页文档课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 典型 相关 分析 65 文档 课件
- 资源描述:
-
1、第六章 典型相关分析第六章 典型相关分析n第一节 典型相关分析的基本原理n第二节 典型变量与典型相关系数的求法n第三节 典型相关系数的检验n第四节 典型相关分析的计算步骤n第五节 典型相关分析的SPSS实现第一节 典型相关分析的基本原理n一、什么是典型相关分析n在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。 n 通常情况下,为了研究两组变量n 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐
2、又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。),(21pxxx),(21qyyy二、典型相关分析的基本思想三、典型相关分析的数学描述四、典型相关分析的应用n典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析。n例如,为了研究扩张性财政政策实施以后对宏观经济发展的影响,就需要考察有关财政政策的一系列指标如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税率降低率等与经济发展的一系列指标,如国内生产总值增长率、就业增长率、物价上涨率等
3、两组变量之间的相关程度。n又如,为了研究宏观经济走势与股票市场走势之间的关系,就需要考察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长率等与各种反映股票市场状况的指标如股票价格指数、股票市场融资金额等两组变量之间的相关关系。n再如,工厂要考察所使用的原料的质量对所生产的产品的质量的影响,就需要对所生产产品的各种质量指标与所使用的原料的各种质量指标之间的相关关系进行测度。第二节 典型变量与典型相关系数的求法n一、总体典型变量和典型相关系数二、原始变理与变型变量之间的相关系数三、样本典型相关变量和样本典型相关系数第三节 典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是
4、否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。(一)整体检验)0:; 0:(10 xyxyHH|0yyxxSSS0:10rH不为零中至少11), 2 , 1(:riHi检验的统计量:yyyxxyxxSSSSSI0SSISSSSISS0Ixy1xxyyyxxyxx1xxyxxy1xxyxyyxxSSSS00S所以,两边同时求行列式,有yyyxxyxxxy1xxyyyxxyxx1xxyxSSSSI0SSISSSSISS0I事实上yx1yyxyxxyyyyyxxyxxSSSSSSSSS|S|yx1yyxy1xxxxyySSSSI
5、SSMISSSSI|S|S|S|yx1yyxy1xxyyxx0 由于 所以若M的特征根为 ,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:)()1 (MIIMIIIMI111|xxxyyyyxxxyySIS S S SIMSS 222121(1)(1)(1)(1)ppii11H 小,支持。在原假设为真的情况下,检验的统计量 近似服从自由度为pq的2分布。在给定的显著性水平下,如果22 (pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。111(3) ln2Qnpq 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分
6、析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。 若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。 (二)部分总体典型相关系数为零的检验023rH:=123:,rH至少有一非零034rH:=134:,rH 至少有一非零如此进行下去.直至对某个k014krH:=114:,krH至少有一非零检验的统计量211(1)rkii k 2111(3)ln2kiki kQnkpq 近似服从自由度为(p-k)(q-k)的2分布。
7、在给定的显著性水平下,如果22 (p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。第四节 典型相关分析的计算步骤 在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。 1、假设有X组和Y组变量,样本容量为n。假设( X1, Y1), ( X2, Y2), ( Xn, Yn),观测值矩阵为:nqnnpnqpqpqpqpyyxxyyxxyyxxyyxxyyxxZ1144
8、1441331231221221111111yyyxxyxxSSSSnn1111ZZ样本的协方差:qnqnpnpnqqppqqppqqppqqppyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxx111141414141313121312121212111111111Z 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。)(111yxyyxyxxSSSSM令:)(112xyxxyxyySSSSM令:22221r), 2 , 1(riii和第五节 邮电业与国民经济的典型相关分析 n二、
9、数据分析n 我们将基于2019年到2019年我国国民经济数据(数据来自于中国统计年鉴),利用Stata软件来做邮电业和国民经济之间的典型相关分析。数据具体见表1. n我们将采用如下指标来衡量我国各年份的邮电业:采用下面的指标来衡量我国各年份的经济(单位都是万亿)n. canon (x1-x4) (y1-y4) e = exact, a = approximate, u = upper bound on F Roys largest root 3 30 08 8. .1 19 9 4 4 8 8 6 61 16 6. .3 38 80 03 3 0 0. .0 00 00 00 0 u uLaw
10、ley-Hotelling trace 3 31 18 8. .0 08 81 1 1 16 6 1 14 4 6 69 9. .5 58 80 02 2 0 0. .0 00 00 00 0 a a Pillais trace 2 2. .2 22 24 47 78 8 1 16 6 3 32 2 2 2. .5 50 06 65 5 0 0. .0 01 13 31 1 a a Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0. .0 00 0
11、0 00 0 a a Statistic df1 df2 F ProbFTests of significance of all canonical correlations 0 0. .9 99 98 84 4 0 0. .9 95 51 12 2 0 0. .4 44 43 36 6 0 0. .3 35 55 57 7Canonical correlations: y4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 03 3 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 00 0 y3 0 0. .0 00 00 01 1 0 0
12、. .0 00 01 13 3 - -0 0. .0 01 10 03 3 - -0 0. .0 00 07 75 5 y2 - -0 0. .0 00 00 00 0 0 0. .0 00 00 02 2 0 0. .0 00 01 15 5 0 0. .0 00 00 06 6 y1 0 0. .0 00 00 01 1 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 05 5 0 0. .0 00 01 16 6 1 2 3 4 Raw coefficients for the second variable set x4 0 0. .0 00 00 00
13、0 - -0 0. .0 00 00 04 4 - -0 0. .0 00 00 04 4 0 0. .0 00 00 04 4 x3 0 0. .0 00 00 00 0 0 0. .0 00 00 03 3 0 0. .0 00 00 03 3 - -0 0. .0 00 00 03 3 x2 0 0. .0 00 00 00 0 - -0 0. .0 00 00 00 0 - -0 0. .0 00 00 01 1 0 0. .0 00 00 00 0 x1 - -0 0. .0 00 06 69 9 - -0 0. .0 04 45 57 7 - -0 0. .0 00 03 38 8
14、 - -0 0. .0 06 62 29 9 1 2 3 4 Raw coefficients for the first variable setCanonical correlation analysis Number of obs = 1 13 3n. canon (x1-x4) (y1-y4), test(1 2 3 4) Roys largest root 3 30 08 8. .1 19 9 4 4 8 8 6 61 16 6. .3 38 80 03 3 0 0. .0 00 00 00 0 u uLawley-Hotelling trace 3 31 18 8. .0 08 8
15、1 1 1 16 6 1 14 4 6 69 9. .5 58 80 02 2 0 0. .0 00 00 00 0 a a Pillais trace 2 2. .2 22 24 47 78 8 1 16 6 3 32 2 2 2. .5 50 06 65 5 0 0. .0 01 13 31 1 a a Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0. .0 00 00 00 0 a a Statistic df1 df2 F ProbFTe
16、sts of significance of all canonical correlations 0 0. .9 99 98 84 4 0 0. .9 95 51 12 2 0 0. .4 44 43 36 6 0 0. .3 35 55 57 7Canonical correlations: y4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 03 3 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 00 0 y3 0 0. .0 00 00 01 1 0 0. .0 00 01 13 3 - -0 0. .0 01 10 03 3
17、- -0 0. .0 00 07 75 5 y2 - -0 0. .0 00 00 00 0 0 0. .0 00 00 02 2 0 0. .0 00 01 15 5 0 0. .0 00 00 06 6 y1 0 0. .0 00 00 01 1 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 05 5 0 0. .0 00 01 16 6 1 2 3 4 Raw coefficients for the second variable set x4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 04 4 - -0 0. .0 00
18、00 04 4 0 0. .0 00 00 04 4 x3 0 0. .0 00 00 00 0 0 0. .0 00 00 03 3 0 0. .0 00 00 03 3 - -0 0. .0 00 00 03 3 x2 0 0. .0 00 00 00 0 - -0 0. .0 00 00 00 0 - -0 0. .0 00 00 01 1 0 0. .0 00 00 00 0 x1 - -0 0. .0 00 06 69 9 - -0 0. .0 04 45 57 7 - -0 0. .0 00 03 38 8 - -0 0. .0 06 62 29 9 1 2 3 4 Raw coe
展开阅读全文