《应用多元统计分析》课件yydyfx9-11.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《应用多元统计分析》课件yydyfx9-11.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用多元统计分析 应用 多元 统计分析 课件 yydyfx9_11
- 资源描述:
-
1、1应用多元统计分析应用多元统计分析第九章第九章 对应分析对应分析第十章第十章 典型相关分析典型相关分析第十一章第十一章 偏最小二乘回归分析偏最小二乘回归分析2第九章第九章 对应分析对应分析 对应分析又称相应分析对应分析又称相应分析,于于19701970年由法年由法国统计学家国统计学家J.P.BeozecriJ.P.Beozecri提出的提出的.它是在它是在R R型和型和Q Q型因子分析基础上发展起来的多元型因子分析基础上发展起来的多元统计分析方法统计分析方法,故也称为故也称为R-QR-Q型因子分析型因子分析.因子分析方法是用少数几个公共因子去提取因子分析方法是用少数几个公共因子去提取研究对象的
2、绝大部分信息研究对象的绝大部分信息,既减少了因子的数目既减少了因子的数目,又把握住了研究对象的相互关系又把握住了研究对象的相互关系.在因子分析在因子分析中根据研究对象的不同中根据研究对象的不同,分为分为R R型和型和Q Q型型,如果研如果研究变量间的相互关系时采用究变量间的相互关系时采用R R型因子分析型因子分析;如果如果研究样品间相互关系时采用研究样品间相互关系时采用Q Q型因子分析型因子分析.3第九章第九章 对应分析对应分析 无论是无论是R R型或型或Q Q型都未能很好地揭示变量和样品型都未能很好地揭示变量和样品间的双重关系间的双重关系.另方面在处理实际问题中另方面在处理实际问题中,样本的
3、大小经常是样本的大小经常是比变量个数多得多比变量个数多得多.当样品个数当样品个数n很大很大(如如n100),100),进行进行Q Q型因子分析时型因子分析时,计算计算n阶方阵的特征值和特阶方阵的特征值和特征向量对于微型计算机的容量和速度都是难以胜征向量对于微型计算机的容量和速度都是难以胜任的任的.还有进行数据处理时还有进行数据处理时,为了将数量级相差很大为了将数量级相差很大的变量进行比较的变量进行比较,常常先对变量作标准化处理常常先对变量作标准化处理,然然而这种标准化处理对于变量和样品是非对等的而这种标准化处理对于变量和样品是非对等的,这这给寻找给寻找R R型和型和Q Q型之间的联系带来一定的
4、困难型之间的联系带来一定的困难.4第九章第九章 什么是对应分析什么是对应分析 对应分析方法是在因子分析的基础上发展起对应分析方法是在因子分析的基础上发展起来的来的,它对原始数据采用适当的标度方法它对原始数据采用适当的标度方法.把把R R型型和和Q Q型分析结合起来型分析结合起来,同时得到两方面的结果同时得到两方面的结果-在同一因子平面上对变量和样品一块进行分类在同一因子平面上对变量和样品一块进行分类,从而揭示所研究的样品和变量间的内在联系从而揭示所研究的样品和变量间的内在联系.对应分析由对应分析由R R型因子分析的结果型因子分析的结果,可以很容易可以很容易地得到地得到Q Q型因子分析的结果型因
5、子分析的结果,这不仅克服样品量这不仅克服样品量大时作大时作Q Q型因子分析所带来计算上的困难型因子分析所带来计算上的困难,且把且把R R型和型和Q Q型因子分析统一起来型因子分析统一起来,把样品点和变量把样品点和变量点同时反映到相同的因子轴上点同时反映到相同的因子轴上,这就便于我们对这就便于我们对研究的对象进行解释和推断研究的对象进行解释和推断.5第九章第九章 对应分析对应分析的基本思想的基本思想 由于由于R R型因子分析和型因子分析和Q Q型分析都是反映一个整型分析都是反映一个整体的不同侧面体的不同侧面,因而它们之间一定存在内在的联因而它们之间一定存在内在的联系系.对应分析就是通过一个变换后
6、的过渡矩阵对应分析就是通过一个变换后的过渡矩阵Z Z将二者有机地结合起来将二者有机地结合起来.具体地说具体地说,首先给出变量间的协差阵首先给出变量间的协差阵SR=ZZ和和样品间的协差阵样品间的协差阵SQ=ZZ,由于由于ZZ和和ZZ有相同有相同的非零特征根的非零特征根,记为记为1 12 2m,如如果果SR的特征根的特征根i i对应的特征向量为对应的特征向量为vi,则则SQ的特的特征根征根i i对应的特征向量对应的特征向量ui=Z=Zvi/./.由此可由此可以很方便地由以很方便地由R R型因子分析而得到型因子分析而得到Q Q型因子分析型因子分析的结果的结果.i6第九章第九章 对应分析的基本思想对应
7、分析的基本思想 由由A的特征根和特征向量即可写出的特征根和特征向量即可写出R R型因型因子分析的因子载荷阵子分析的因子载荷阵(记为记为AR)和和Q Q型因子型因子分析的因子载荷阵分析的因子载荷阵(记为记为AQ).).vp1ARvp2vpm7第九章第九章 9.1 什么是对应什么是对应分析分析 基本思想基本思想 由于由于A A和和B B具有相同的非零特征根具有相同的非零特征根,而这些特征根又而这些特征根又正是各个公共因子的方差正是各个公共因子的方差,因此可以用相同的因子轴同因此可以用相同的因子轴同时表示变量点和样品点时表示变量点和样品点,即把变量点和样品点同时反映即把变量点和样品点同时反映在具有相
8、同坐标轴的因子平面上在具有相同坐标轴的因子平面上,以便对变量点和样品以便对变量点和样品点一起考虑进行分类点一起考虑进行分类.AQun1un2unm8第十章第十章 典型相关分析典型相关分析 相关分析是研究多个变量与多个变量之间的相关分析是研究多个变量与多个变量之间的相关关系相关关系.如研究两个随机变量之间的相关关系如研究两个随机变量之间的相关关系可用简单相关系数表示可用简单相关系数表示;研究一个随机变量与多研究一个随机变量与多个随机变量之间的相关关系可用全相关系数表个随机变量之间的相关关系可用全相关系数表示示.1936年年Hotelling首先将相关分析推广到研究首先将相关分析推广到研究多个随机
9、变量与多个随机变量之间的相关关系多个随机变量与多个随机变量之间的相关关系,故而产生了典型相关分析故而产生了典型相关分析,广义相关系数等一些广义相关系数等一些有用的方法有用的方法.9第十章第十章 什么是什么是典型相关分析典型相关分析 在实际问题中在实际问题中,经常遇到要研究一部分变量和经常遇到要研究一部分变量和另一部分变量之间的相关关系另一部分变量之间的相关关系,例如例如:在工业在工业中中,考察原料的主要质量指标考察原料的主要质量指标(X1,.,Xp)与产品的主要质量指标与产品的主要质量指标(Y1,.,Yq)间的相关性间的相关性;在经济学在经济学中中,研究主要肉类的价格与销售量之间研究主要肉类的
10、价格与销售量之间的相关性的相关性;在地质学在地质学中中,为研究岩石形成的成因关系为研究岩石形成的成因关系,考察考察岩石的化学成份与其周围围岩化学成份的相关性岩石的化学成份与其周围围岩化学成份的相关性;在气象学在气象学中为分析预报中为分析预报24小时后天气的可靠程小时后天气的可靠程度度,研究当天和前一天气象因子间的相关关系研究当天和前一天气象因子间的相关关系;10第十章第十章 什么是什么是典型相关分析典型相关分析 在教育学在教育学中中,研究学生在高考的各科成绩与高研究学生在高考的各科成绩与高二年级各主科成绩间的相关关系二年级各主科成绩间的相关关系;在婚姻的研究在婚姻的研究中中,考察小伙子对追求姑
11、娘的主考察小伙子对追求姑娘的主要指标与姑娘想往的小伙子的主要尺度之间的要指标与姑娘想往的小伙子的主要尺度之间的相关关系相关关系;在医学在医学中中,研究患某种疾病病人的各种症状程研究患某种疾病病人的各种症状程度与用科学方法检查的一些结果之间的相关关度与用科学方法检查的一些结果之间的相关关系系;在体育学在体育学中中,研究运动员的体力测试指标与运研究运动员的体力测试指标与运动能力指标之间的相关关系等动能力指标之间的相关关系等.11第十章第十章 什么是什么是典型相关分析典型相关分析 一般地一般地,假设有一组变量假设有一组变量X1,.,Xp 与另一组变与另一组变量量Y1,.,Yq(也可以记为也可以记为X
12、p+1,.,Xp+q),我们要研究我们要研究这两组变量的相关关系这两组变量的相关关系,如何给两组变量之间的如何给两组变量之间的相关性以数量的描述相关性以数量的描述,这就是本章研究的典型相这就是本章研究的典型相关分析关分析.当当p=q=1时时,就是研究两个变量就是研究两个变量X与与Y之间的相之间的相关关系关关系.简单相关系数是最常见的度量简单相关系数是最常见的度量.其定义为其定义为12第十章第十章 什么是什么是典型相关分析典型相关分析 当当p 1,q=1时时(或或 q 1,p=1)设设则称则称为为Y与与(X1,Xp)的的 全相关系数全相关系数.其实其实Y对对X的回归为的回归为1(|)()()YY
13、XXXXE Y Xxx且且(,()YxR,并称并称R为全相关系数为全相关系数.1/21YXXXXYYYR1(,),0XXXYpYXYYXNY def=13第十章第十章 什么是什么是典型相关分析典型相关分析 当当p,q1时时,利用主成分分析的思想利用主成分分析的思想,可以把多可以把多个变量与多个变量之间的相关化为两个新变量个变量与多个变量之间的相关化为两个新变量之间的相关之间的相关.也就是求也就是求=(1,p)和和 =(1,q),使使得新变量得新变量:V=1X1+pXp=X W=1Y1+qYq=Y之间有最大可能的相关之间有最大可能的相关,基于这个思想就产生基于这个思想就产生了典型相关分析了典型相
14、关分析(Canonical correlatinal analysis).14第十章第十章 总体总体典型相关典型相关 设设X=(X1,.,Xp)及及Y=(Y1,.,Yq)为随机向量为随机向量(不妨设不妨设pq),记随机向量记随机向量Z=XYZ的协差阵为的协差阵为其中其中 11是是X的协差阵的协差阵,22是是Y的协差阵的协差阵,12=21是是X,Y的协差阵的协差阵.2221121115第十章第十章 总体总体典型相关典型相关 我们用我们用X和和Y的线性组合的线性组合V=a X和和W=b Y之间之间的相关来研究的相关来研究X和和Y之间的相关之间的相关.我们希望找到我们希望找到a和和b,使使(V,W)
15、最大最大.由相关系数的定义由相关系数的定义:又已知又已知16第十章第十章 总体总体典型相关典型相关故有故有对任给常数对任给常数c1,c2,d1,d2,显然有显然有 (c1V+d1,c2W+d2)=(V,W)即使得相关系数最大的即使得相关系数最大的V=a X和和W=b X并不唯并不唯 一一.故加附加约束条件故加附加约束条件 Var(V)=a 11 a=1,Var(W)=b 22 b=1.问题化为在约束条件问题化为在约束条件Var(V)=1,Var(W)=1下下,求求a和和b,使得使得(V,W)=a 12 b达最大达最大.17第十章第十章 样本样本典型相关典型相关 设总体设总体Z=(=(X1 1,
展开阅读全文