现代统计分析方法与应用(人大何晓群)第12章主成课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《现代统计分析方法与应用(人大何晓群)第12章主成课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 统计分析 方法 应用 人大 12 章主成 课件
- 资源描述:
-
1、2022-6-2中国人民大学六西格玛质量管理研究中心1第十二章第十二章 主成分分析主成分分析 目录 上页 下页 返回 结束 12.1 12.1 主成分分析的基本思想主成分分析的基本思想 12.2 12.2 主成分分析的几何意义主成分分析的几何意义 12.3 12.3 总体主成分及其性质总体主成分及其性质 12.4 12.4 样本主成分的导出样本主成分的导出 12.5 12.5 主成分分析步骤及框图主成分分析步骤及框图 12.6 12.6 主成分分析的应用主成分分析的应用 2022-6-2中国人民大学六西格玛质量管理研究中心2第第十二十二章章 主成分分析主成分分析 目录 上页 下页 返回 结束
2、主成分分析(主成分分析(principal components analysis)也)也称主分量分析,是由称主分量分析,是由Hotelling于于1933年首先提出的。主年首先提出的。主成分分析是利用降维的思想,在损失很少信息的前提下成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量
3、具有某些更优越的性能。这这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高物内部变量之间的规律性,同时使问题得到简化,提高分析效率。本章主要介绍主成分分析的基本理论和方法、分析效率。本章主要介绍主成分分析的基本理论和方法、主成分分析的计算步骤及主成分分析的上机实现。主成分分析的计算步骤及主成分分析的上机实现。 2022-6-2中国人民大学六西格玛质量管理研究中
4、心312.1 12.1 主成分分析的基本思想主成分分析的基本思想 目录 上页 下页 返回 结束 一、主成分分析的基本思想一、主成分分析的基本思想 在对某一事物进行实证研究中,为了更全面、准确地反在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律,人们往往要考虑与其有关系映出事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量。这样就产的多个指标,这些指标在多元统计中也称为变量。这样就产生了如下问题:一方面人们为了避免遗漏重要的信息而考虑生了如下问题:一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增
5、加了问尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性,同时由于各指标均是对同一事物的反映,不可题的复杂性,同时由于各指标均是对同一事物的反映,不可避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。基于上述问题,人们就希望杀事物的真正特征与内在规律。基于上述问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多。主在定量研究中涉及的变量较少,而得到的信息量又较多。主成分分析正是研究如何通过原来变量的少数几个线性组合来成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信
6、息的一种多元统计方法。解释原来变量绝大多数信息的一种多元统计方法。2022-6-2中国人民大学六西格玛质量管理研究中心412.1 12.1 主成分分析的基本思想主成分分析的基本思想 目录 上页 下页 返回 结束 既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在
7、保留原始变量主要信息的前提下起到降维与简化问题的标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系:分分析得到的主成分与原始变量之间有如下基本关系: 1.每一个主成分都是各原始变量的线性组合;每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目主成分的数目大大少于原始变量的数目 3.主成分保留了原始变量绝大多数信息主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关各主成分之间
8、互不相关 通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。深入。2022-6-2中国人民大学六西格玛质量管理研究中心512.1 12.1 主成分分析的基本思想主成分分析的基本思想 目录 上页 下页 返回 结束 二、主成分分析的基本理论二、主成分分析的基本理论PXXX
9、,21PXXX,212022-6-2中国人民大学六西格玛质量管理研究中心612.1 12.1 主成分分析的基本思想主成分分析的基本思想 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心712.1 12.1 主成分分析的基本思想主成分分析的基本思想 目录 上页 下页 返回 结束 PXXX,21PXXX,21PXXX,212022-6-2中国人民大学六西格玛质量管理研究中心812.2 12.2 主成分分析的几何意义主成分分析的几何意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心912.2 12.2 主成分分析的意义主成分分析
10、的意义 目录 上页 下页 返回 结束 图12-1 2022-6-2中国人民大学六西格玛质量管理研究中心1012.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1112.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1212.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1312.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返
11、回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1412.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1512.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1612.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1712.2 12.2 主成分分析的意义主成分分析的意义 目录 上页 下页 返回 结束 2022-6-2中国人民大学六
12、西格玛质量管理研究中心1812.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心1912.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2012.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2112.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2212.
13、312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2312.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2412.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2512.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 %8511piimii2022-6-2中国人民大学六西格玛质量管理研究中心2612.312.3
14、 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2712.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 由上图可知,第二个及第三个特征值变化的趋势由上图可知,第二个及第三个特征值变化的趋势已经开始趋于平稳,所以,取前两个或是前三个主成已经开始趋于平稳,所以,取前两个或是前三个主成分是比较合适的。这种方法确定的主成分个数与按累分是比较合适的。这种方法确定的主成分个数与按累积贡献率确定的主成分个数往往是一致的。在实际应积贡献率确定的主成分个数往往是一致的。在实际应用中有些研究工作者习惯于保留
15、特征值大于用中有些研究工作者习惯于保留特征值大于1的那些的那些主成分,但这种方法缺乏完善的理论支持。在大多数主成分,但这种方法缺乏完善的理论支持。在大多数情况下,当情况下,当m=3时即可使所选主成分保持信息总量的时即可使所选主成分保持信息总量的比重达到比重达到85以上。以上。2022-6-2中国人民大学六西格玛质量管理研究中心2812.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心2912.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量
16、管理研究中心3012.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3112.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3212.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3312.312.3 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3412.312.3
17、 总体主成分及其性质总体主成分及其性质 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3512.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3612.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3712.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3812.4 12.4 样本主成分的导出样本主成分的导出
18、目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心3912.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 为了得到上面齐次方程的非零解, 2022-6-2中国人民大学六西格玛质量管理研究中心4012.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心4112.4 12.4 样本主成分的导出样本主成分的导出 目录 上页 下页 返回 结束 2022-6-2中国人民大学六西格玛质量管理研究中心4212.5 12.5 主成分分析步骤及框图主成分分析步骤及框图
19、目录 上页 下页 返回 结束 一、主成分分析步骤一、主成分分析步骤 由上面讨论大体上已经可以明了进行主成分分析的步骤,由上面讨论大体上已经可以明了进行主成分分析的步骤,我们对此进行归纳如下:我们对此进行归纳如下: 1.根据研究问题选取初始分析变量;根据研究问题选取初始分析变量; 2.根据初始变量特性判断由协方差阵求主成分还是由相根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;关阵求主成分; 3.求协差阵或相关阵的特征根与相应标准特征向量;求协差阵或相关阵的特征根与相应标准特征向量; 4.判断是否存在明显的多重共线性,若存在,则回到第判断是否存在明显的多重共线性,若存在,则回到第一步
20、;一步; 5.得到主成分的表达式并确定主成分个数,选取主成分;得到主成分的表达式并确定主成分个数,选取主成分; 6.结合主成分对研究问题进行分析并深入研究。结合主成分对研究问题进行分析并深入研究。2022-6-2中国人民大学六西格玛质量管理研究中心4312.5 12.5 主成分分析步骤及框图主成分分析步骤及框图 目录 上页 下页 返回 结束 二、主成分二、主成分分析的逻辑分析的逻辑框图框图图图12-4主成分分析逻辑框图主成分分析逻辑框图2022-6-2中国人民大学六西格玛质量管理研究中心4412.6 12.6 主成分分析的应用主成分分析的应用 目录 上页 下页 返回 结束 SPSS软件软件FA
21、CTOR模块提供了主成分分析的功能。模块提供了主成分分析的功能。例例12.1 在企业经济效益的评价中,设计的指标往在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发价中的主要问题,我们可由原始数据矩阵出发求主成分。在对我国部分省、市、自治区独立求主成分。在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,涉及到核算的工业企业的经济效益评价中,涉及到9项项指标,原始数据见表指标,原始数据见表12-1,即样品数,即样品数n=28,变,变量数量数p=9。2022-6-2中国人民大学六西
展开阅读全文