主成分分析与因子分析(第20章)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《主成分分析与因子分析(第20章)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 因子分析 20 课件
- 资源描述:
-
1、 Principal Components Analysis&Factor Analysis第二军医大学卫生统计学教研室第二军医大学卫生统计学教研室 xx第第20章章1感谢你的观看2019年8月72感谢你的观看2019年8月7Principal Components Analysis3感谢你的观看2019年8月7数据的降维、数据的解释数据的降维、数据的解释 将原来众多具有一定相关性的指标,组将原来众多具有一定相关性的指标,组 合成一组新的合成一组新的相互无关的综合指标。相互无关的综合指标。从中选取几个较少的综合指标尽可能多从中选取几个较少的综合指标尽可能多 的反映原来众多指标的信息。的反映原来
2、众多指标的信息。这种既减少了指标的数目又抓住了主要矛这种既减少了指标的数目又抓住了主要矛 盾的做法有利于问题的分析和处理。盾的做法有利于问题的分析和处理。4感谢你的观看2019年8月75感谢你的观看2019年8月7 如何利用这些指标对每一儿童的生长发育如何利用这些指标对每一儿童的生长发育 作出正确评价?作出正确评价?仅用单一指标:仅用单一指标:结论片面;结论片面;没有充分利用原有数据信息。没有充分利用原有数据信息。利用所有指标:利用所有指标:各指标评价的结论可能不一致,使综合各指标评价的结论可能不一致,使综合 评价困难;评价困难;工作量大。工作量大。6感谢你的观看2019年8月7 找出几个综合
3、指标找出几个综合指标(长度、围度、特体长度、围度、特体),这,这些综合指标是原始指标的线性组合,既保留些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关。了原始指标的信息,且互不相关。各综合指标提供的各综合指标提供的“信息信息”量大小用其方差量大小用其方差来衡量。来衡量。衡量一个指标的好坏衡量一个指标的好坏除了正确性与精确性外,除了正确性与精确性外,还必须能充分反映个体间的变异,一还必须能充分反映个体间的变异,一 项指标在个体间的变异越大,提供的信息项指标在个体间的变异越大,提供的信息 量越多。量越多。7感谢你的观看2019年8月7mmm22m11mmmm22221212mm1
4、2121111XaXaXaZ XaXaXaZXaXaXaZ 8感谢你的观看2019年8月7Z=A XZ=A X9感谢你的观看2019年8月7第一主成分第一主成分mm12121111XaXaXaZ 1aaa2m1212211 在所有在所有Zi中最大中最大)Z(Var110感谢你的观看2019年8月7第二主成分第二主成分理论上主成分个数最多为理论上主成分个数最多为m个个(指标个数指标个数)实际工作中确定的主成分个数总是小于实际工作中确定的主成分个数总是小于m个个)Z(Var0aaaaaaZZ1aaaXaXaXaZ2m1m212221121212m2222221mm22221212 与与在所有在所有
5、Zi中为第中为第2大。大。无关,互相垂直:无关,互相垂直:11感谢你的观看2019年8月7X1X2112-2-2-1-120相关相关变异变异12感谢你的观看2019年8月7X1X2Z1Z2112-2-2-2-211-1-1-1-1222013感谢你的观看2019年8月7Z1Z2-2-211-1-1220相关相关变异变异14感谢你的观看2019年8月715感谢你的观看2019年8月7(一)主成分的求法(一)主成分的求法 1.1.对各原始指标值进行标准化对各原始指标值进行标准化m,2 1,j SXXXjjijij 为了方便,仍用为了方便,仍用Xij表示表示Xij。16感谢你的观看2019年8月7标
6、准化后的数据矩阵标准化后的数据矩阵 nm n21n2m 22211m 1211 X XX X XX X XXX X=17感谢你的观看2019年8月72.求出求出X1,X2,Xm 的相关矩阵的相关矩阵R R mm m21m2m 22211m 1211r r r r r rr r rR R=Cov(X X)=18感谢你的观看2019年8月722)YY()YY()XX()XX(r YYXXXY22lll)YY()XX()YY)(XX(r Pearson 相关系数相关系数 YXSYYSXX1n1r标准化后的协方差标准化后的协方差1n)YY)(XX(1n)XX)(XX(协方差协方差19感谢你的观看201
7、9年8月73.求出矩阵求出矩阵R R的全部特征值的全部特征值(eigenvalue)i,第第i个主成分的组合系数个主成分的组合系数ai1,ai2,aim满满 足方程组足方程组:(r11 i)ai1+r12 ai2+r1m aim=0 r21 ai1+(r22 i)ai2+r2m aim=0 rm1 ai1+rm2 ai2+(rmm i)aim=0 20感谢你的观看2019年8月7 (r11 i)ai1+r12 ai2+r1m aim=0 r21 ai1+(r22 i)ai2+r2m aim=0 rm1 ai1+rm2 ai2+(rmm i)aim=0 i为为矩阵矩阵R R的第的第i个特征值,个
8、特征值,共有共有m个非个非负特征值,由大到小的顺序排列为:负特征值,由大到小的顺序排列为:1 2 m0 i=Var(Zi)21感谢你的观看2019年8月74.由以上方程组,求出相应于特征值由以上方程组,求出相应于特征值 i 的的 特征向量特征向量(eigenvector)(ai1,ai2,aim)mim22i11iiXaXaXaZ 22感谢你的观看2019年8月7(二)主成分的性质(二)主成分的性质 1.各主成分互不相关各主成分互不相关 j)(i 0)Z,Z(Cov)Z,Z(Cov)Z,Z(CovrjjiijiZ,Zji 23感谢你的观看2019年8月72.主成分的贡献率与累积贡献率主成分的贡
9、献率与累积贡献率 (原始指标值标准化原始指标值标准化)m)Z(Var)X(Varm1im1iiim1ii (指标个数指标个数)m)(k m m),2 1,(i mk1iiim1iii 贡献率贡献率累积贡献率累积贡献率24感谢你的观看2019年8月73.主主成分个数的选取成分个数的选取(1)前前k个主成分的累积贡献率个主成分的累积贡献率70%。(2)主成分主成分Zi的的特征值特征值 i 1。ijiijaq 4.因子载荷因子载荷(第(第i主成分主成分Zi与第与第j原始指标原始指标Xi间相关系数间相关系数)25感谢你的观看2019年8月75.样品的主成分得分样品的主成分得分m,2 1,i XaXaX
10、aZmim22i11ii m,2 1,j SXXXjjijij 26感谢你的观看2019年8月727感谢你的观看2019年8月728感谢你的观看2019年8月729感谢你的观看2019年8月730感谢你的观看2019年8月7 1.主成分个数的选取主成分个数的选取 3很接近于很接近于1 1;3 与与 2的贡献率相差不大,为的贡献率相差不大,为25%左右,左右,若舍去若舍去 3不合理。不合理。取前三个主成分。取前三个主成分。31感谢你的观看2019年8月7432134321243211X930532.0X270314.0X058463.0X240049.0ZX304983.0X904159.0X2
11、83647.0X095010.0ZX162777.0X087939.0X689798.0X699964.0Z 2.列出主成分表达式列出主成分表达式Z1为急性炎症成分为急性炎症成分(X1转氨酶、转氨酶、X2肝大指数)肝大指数)Z2为慢性炎症成分为慢性炎症成分(X3硫酸锌浊度硫酸锌浊度 )Z3为癌变成分为癌变成分(X4甲胎球蛋白甲胎球蛋白 )32感谢你的观看2019年8月73.求出因子载荷阵求出因子载荷阵ijiijaq 33感谢你的观看2019年8月74.主成分得分主成分得分34感谢你的观看2019年8月7p标准化指标主成分还原为标准化指标主成分还原为原始指标主成分原始指标主成分719569.0
展开阅读全文