主成分分析讲解课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《主成分分析讲解课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 讲解 课件
- 资源描述:
-
1、11/25/2022Dept.of Epidemio&Biostat,SPH1主成分分析主成分分析Principal Component Analysis11/25/2022Dept.of Epidemio&Biostat,SPH2统计学研究的核心问题统计学研究的核心问题?没有变异就没有统计学没有变异就没有统计学变变 异异VARIATION变异性的度量?变异性的度量?方差方差 Variance11/25/2022Dept.of Epidemio&Biostat,SPH3方差是什么?方差是信息多元世界的信息度量多元世界的每个变量的包含信息不同在单个变量方差不变的情况下,各变量相关性越高,则总信息
2、量越小11/25/2022Dept.of Epidemio&Biostat,SPH4谁更重要?492.008.667477.50337.667历史成绩数学成绩NMeanVariance11/25/2022Dept.of Epidemio&Biostat,SPH5两组变量:A BDescriptive Statistics3080.9561.2773079.4361.7913060.8374.3923080.3782.7723080.8268.3913060.8243.628A1A2A3B1B2B3NMeanVariance11/25/2022Dept.of Epidemio&Biostat,S
3、PH611/25/2022Dept.of Epidemio&Biostat,SPH711/25/2022Dept.of Epidemio&Biostat,SPH8Correlations1.335.046.3351.056.046.0561A1A2A3A1A2A3Correlations1.996.249.9961.258.249.2581B1B2B3B1B2B311/25/2022Dept.of Epidemio&Biostat,SPH9协方差矩阵协方差矩阵样本的方差样本的方差-协方差矩阵(协方差矩阵(variance-covariance matrix)如果有如果有p个观测变量个观测变量
4、,则样本则样本的协方差矩阵记为的协方差矩阵记为pxxx,21ppppppsssssssssS212222111211pixxnssjiijiii,2,1,)(1122pkpikixxxxnssjkkjiijkiik,2,1;,2,1;)(1111/25/2022Dept.of Epidemio&Biostat,SPH10相关矩阵相关矩阵 如果有如果有p个观测变量个观测变量 ,其相,其相关阵(关阵(correlation matrix)记为)记为pxxx,2111121221112pppprrrrrrRkipkpisssrkkiiikik;,2,1;,2,1;/11/25/2022Dept.of
5、 Epidemio&Biostat,SPH11矩阵的特征值和特征向量矩阵的特征值和特征向量 对于方阵对于方阵A,如存在常数,如存在常数及非零向量及非零向量x,使使 Ax=x 则则为为A的一个特征值,的一个特征值,x为与为与对应的矩对应的矩阵阵A的特征向量。的特征向量。n介方阵有介方阵有n对特征值和特征向量对特征值和特征向量11/25/2022Dept.of Epidemio&Biostat,SPH12正交向量(阵)、单位向量正交向量(阵)、单位向量 正交向量:正交向量:a=(a1,ap),b=(b1,bp)如果如果ab=a1b1+apbp=0,则称则称a、b正交正交 单位向量:向量单位向量:向
6、量a=(a1,ap),如果如果 则称则称a为单位向量为单位向量 正交阵:正交阵:n阶方阵阶方阵A,如果,如果 AA=AA=I,则称,则称A为为n阶正交阵,其中阶正交阵,其中A的列向量(或行向量)为正交向量,的列向量(或行向量)为正交向量,A=A-11.22221paaa11/25/2022Dept.of Epidemio&Biostat,SPH13WEIGHT7472706866646260HEIGHT19018017016015011/25/2022Dept.of Epidemio&Biostat,SPH1411/25/2022Dept.of Epidemio&Biostat,SPH1511
7、/25/2022Dept.of Epidemio&Biostat,SPH1611/25/2022Dept.of Epidemio&Biostat,SPH17Total Variance ExplainedTotal Variance Explained1.91395.66495.6648.672E-024.336100.000Component12Total%of Variance Cumulative%Initial EigenvaluesExtraction Method:Principal Component Analysis.11/25/2022Dept.of Epidemio&Bio
8、stat,SPH18 主成分的概念主成分的概念 1 设设x1,x2,xp为为 p 维随机变量维随机变量 X1,X2,Xp的标准化变换的标准化变换 如果其线性组合如果其线性组合 满足满足则称则称C1为第一主成分。为第一主成分。iiiiSXXx/)(ppxaxaxaC12121111.最大,且使)(,1.121212211CVaraaap11/25/2022Dept.of Epidemio&Biostat,SPH19主成分的概念主成分的概念 2 若若满足满足则称则称C2为第二主成分。为第二主成分。类似地,共可得到至多类似地,共可得到至多 p 个主成分。个主成分。ppxaxaxaC22221212.
9、最大,且使)(,0.,1.2112112222122222221CVaraaaaaaaaappp11/25/2022Dept.of Epidemio&Biostat,SPH20主成分的性质主成分的性质 主成分主成分 C1,C2,Cp 具有以下性质:具有以下性质:(1)主成分间互不相关主成分间互不相关Corr(Ci,Cj)=0 i j(2)组合系数组合系数(ai1,ai2,aip)构成的向量为单位构成的向量为单位向量向量(3)各主成分的方差是依次递减的,各主成分的方差是依次递减的,即即Var(C1)Var(C2)Var(Cp)(4)总方差不增不减,总方差不增不减,即即 Var(C1)+Var(C
10、2)+Var(Cp)=Var(x1)+Var(x2)+Var(xp)=p 11/25/2022Dept.of Epidemio&Biostat,SPH21主成分的计算主成分的计算 1设设 R 为为 X1,X2,Xp 的相关矩阵,则存在的相关矩阵,则存在 1 2 p0,和正交矩阵,和正交矩阵A,使,使其中其中 i为相关矩阵为相关矩阵R的第的第i个特征值个特征值(eigenvalue)(ai1 ai2 aip)则是相关矩阵则是相关矩阵R的第的第i个特征值对应的特征向量。个特征值对应的特征向量。i是第是第i个主成分的方差个主成分的方差即RAA1.1.1.212211121212221212111pp
11、ppppppppprrrrrraaaaaaaaaA0011/25/2022Dept.of Epidemio&Biostat,SPH22主成分的计算主成分的计算 2 记主成分记主成分C=(C1 C2 Cp),则,则 C=Ax 即即ppppppppxxxaaaaaaaaaCCC.212122221112112111/25/2022Dept.of Epidemio&Biostat,SPH23主成分的计算主成分的计算 3 因子模型(全分量模型)表达形式因子模型(全分量模型)表达形式 x=AC 即即矩阵矩阵A称载荷矩阵,反映各主成分对原始称载荷矩阵,反映各主成分对原始变量变量x各分量的贡献大小。各分量的
12、贡献大小。ppppppppCCCaaaaaaaaaxxx.212122212121112111/25/2022Dept.of Epidemio&Biostat,SPH24主成分的计算主成分的计算 4 因子模型(全分量模型)表达因子模型(全分量模型)表达-主成分标准化变换主成分标准化变换ppppppppppppCCCaaaaaaaaaxxx/./.22112211222211212211112111/25/2022Dept.of Epidemio&Biostat,SPH25x=Lcppppppppccclllllllllxxx.2121222121211121lij是是xj和和ci的相关系数的相
13、关系数SPSS输出的系数矩阵是输出的系数矩阵是L矩阵矩阵iijijla/11/25/2022Dept.of Epidemio&Biostat,SPH26实例实例 城市男生形态资料城市男生形态资料数据来自方积乾数据来自方积乾医学统计学与电脑试验医学统计学与电脑试验第第2 2版版 28城市男生形态指标平均数28城市男生形态指标平均数a a173.28173.2893.6293.6286.7286.7238.9738.9727.5127.5160.1060.10172.09172.0992.8392.8387.3987.3938.6238.6227.8227.8260.3860.38171.4617
展开阅读全文