因子分析因素分析详解课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《因子分析因素分析详解课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 因素 分析 详解 课件
- 资源描述:
-
1、Factor Analysis一、案例引读二、基本原理三、历史渊源四、分析步骤目录五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解我要定制定制衣服身高袖长胸围腰围肩宽肩厚颜色我们厂要批量批量制作衣服SML长度长度胖瘦胖瘦指标一指标一指标三指标三指标二指标二一、案例引读一、案例引读身高袖长胸围腰围肩宽肩厚颜色降维第一主成分第一主成分第二主成分第二主成分第三主成分第三主成分主成分分析主成分分析二、基本原理三、历史渊源 四、分析步骤五、案例详解主成分分析特点主成分分析特点原始变量间相关性较大几个主成分之间相互独立主成分信息由大到小身高身高肩宽肩宽袖长袖长132原
2、始变量数与主成分数相等5色5变量5色5主成分一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读Charles Spearman1904年对智力测验得分进行统计分析古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)4个假设:已知个假
3、设:已知xi=aiF+ei四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读x1= a11F1 + a12F2 + + a1mFm + a11x2= a21F1 + a22F2 + + a2mFm + a22xp= ap1F1+ ap2F2 + + apmFm + app 因素分析把每个原始变量分解成两部分:一部分由所有变量共同具有的少数几个因子构成,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因子部分。其中,F1,F2,Fm叫做公共因子,它们是在各个变量中共同出现的因子。i(i=1,2,p)表示影响xi的独特因子,指原有变量不能被因子变量所解释的部分
4、,相当于回归分析中的残差部分。aij叫做因子负荷(载荷),它是第i个变量在第j个主因子上的负荷,它反映了第i个变量在第j个主因素的相对重要性。xp 为第p个变量的标准化分数;m为所有变量共同因素的数目;F1,F2,Fm彼此独立(转轴方法问题)数学模型数学模型四、分析步骤五、案例详解四、分析步骤样本的优劣样本的优劣因子得分因子得分xi=aiF+ei因子负荷因子负荷主成分法主成分法因子旋转因子旋转FF便于解释便于解释二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源四、分析步骤二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源因子负荷因子负荷主成分法主成分法因子旋转因子旋转FF
5、四、分析步骤二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源因子旋转因子旋转F=DF保持F间相互独立斜交旋转斜交旋转正交旋转正交旋转不是很容易解释因子放弃F间相互独立容易解释因子五、案例详解二、基本原理一、案例引读一、案例引读五、分析步骤三、历史渊源案例一案例一案例二案例二 对北京对北京18个区县中等职业教育发展水平的个区县中等职业教育发展水平的9个指标进个指标进行因子分析,然后进行综合评价。行因子分析,然后进行综合评价。 x1:每万人中等职业教育在校生数 x2:每万人中等职业教育招生数 x3:每万人中等职业教育毕业生数 x4:每万人中等职业教育专任教师数 x5:本科以上学校教师占
6、专任教师的比例 x6:高级教师占专任教师的比例 x7:学校平均在校生人数 x8:国家财政预算中等职业教育经费占国内生产总值的比例 x9:生均教育经费案例 1(1)选择“Analyze(分析分析)Data Reduction(数据缩减数据缩减)Factor(因因子子)”命令,弹出“Factor Analyze(因子分析)”对话框,将变量“x1”到“x9”选入“Variables(变量)”框中。图1-1 Factor Analyze对话框案例 1描述性统计量描述性统计量 分数分数 转轴法转轴法 萃取萃取 选项选项操作过程操作过程案例 1(2)设置描述性统计量:单击图1-1对话框中的“Descrip
7、tives”按钮,弹出“Factor Analyze:Descriptives”(因素分析:描述性统计量)(因素分析:描述性统计量)对话框。单变量描述性统计量单变量描述性统计量 未转轴之统计量未转轴之统计量 系数系数 倒数模式倒数模式显著水平显著水平重制的重制的行列式行列式反映像反映像KMO与与Bartlett球形检验球形检验 “Statistics”(统计量)对话框(统计量)对话框 A “Univariate descriptives”(单变量描述性单变量描述性统计量统计量):显示每一题项的平均数、标准差。B “Initial solution”(未转轴之统计量未转轴之统计量):显示因素分析
8、未转轴前之共同性、特征值、变异数百分比及累积百分比。 “Correlation Matric”(相关矩阵)选项框(相关矩阵)选项框A “Coefficients”(系数系数):显示题项的相关矩阵 B “Significance levels”(显著水准显著水准):求出前述相关矩阵地显著水准。 C “Determinant”(行列式行列式):求出前述相关矩阵地行列式值。 D “KMO and Bartletts test of sphericity”(KMO与与Bartlett的球形检定的球形检定):显示KMO抽样适当性参数与Bartletts的球形检定。E “Inverse”(倒数模式倒数模式
9、):求相关矩阵的反矩阵。F “Reproduced”(重制的重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线及下三角形代表相关系数。G “Anti-image”(反映像反映像):求出反映像的共变量及相关矩阵。图1-2 Factor Analyze:Descriptives对话框操作过程操作过程案例 1(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction”按钮,弹出“Factor Analyze:Extraction”(因素分析:萃取)(因素分析:萃取)对话框。 “Method”(方法)选项框:(方法)选项框:下拉式选项内有其中抽取因素的方法:A “Princi
10、pal components”法:法:主成份分析主成份分析法法抽取因素,此为SPSS默认方法。B “Unweighted least squares”法:法:未加权未加权最小平方法。最小平方法。C “Generalized least square”法:法:一般化最一般化最小平方法。小平方法。D “Maximum likelihood”法:法:最大概似法。最大概似法。E “Principal-axis factoring”法:法:主轴法。主轴法。F “Alpha factoring”法:法:因素抽取法。因素抽取法。G “Image factoring”法:法:映像因素抽取法。映像因素抽取法。
11、“Analyze”(分析)选项框(分析)选项框A “Correlation matrix”(相关矩阵相关矩阵):以相关矩阵来抽取因素。B “Covariance matrix”(共变异数矩共变异数矩阵阵):以共变量矩阵来抽取因素。 “Display”(显示)选项框(显示)选项框A “Unrotated factor solution”(未未旋转因子解旋转因子解):显示未转轴时因素负荷量、特征值及共同性。B “Scree plot”(陡坡图陡坡图):陡坡图。 “Extract”(抽取)选项框(抽取)选项框A “Eigenvalues over”(特征值特征值):后面的空格默认为1,表示因素抽取时
12、,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。B “Number of factors”(因子个数因子个数):选取此项时,后面的空格内输入限定的因素个数。 相关矩阵相关矩阵共变异数矩阵共变异数矩阵未旋转因子解未旋转因子解陡坡图陡坡图特征值特征值因子个数因子个数图1-3 Factor Analyze:Extraction对话框操作过程操作过程案例 1(4)设置因素转轴:单击图1-1对话框中的“Rotation”按钮,弹出“Factor Analyze:Rotation”(因素分析:旋转)(因素分析:旋转)对话框。 “Display”(显示)选项框:(显示)选项框:A “Rotat
13、ed solution”(转轴后的解转轴后的解):显示转轴后的相关信息,正交转轴显示因素组型矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素相关矩阵。B “Loading plots”(因子负荷量因子负荷量):绘出因素的散步图。 “Maximum Iterations for Convergence”:(收敛最大:(收敛最大迭代):迭代): 转轴时执行的迭代最多次数,后面默认数字为25,表示算法执行转轴时,执行步骤的次数上限。 “Method”(方法)选项方框内六种因素转轴方(方法)选项方框内六种因素转轴方法:法:A “None”:不需要转轴。不需要转轴。B “Varimax”:
14、最大变异法。最大变异法。C “Quartimax”:四次方最大值法。四次方最大值法。D “Equamax”:相等最大值法。相等最大值法。E “Direct Oblimin”:直接斜交转轴法。直接斜交转轴法。F “Promax”:Promax转轴法。转轴法。正交旋转正交旋转斜交旋转斜交旋转不转轴不转轴最大变异法最大变异法四次方最大值法四次方最大值法相等最大值法相等最大值法直接斜交转轴法直接斜交转轴法Promax转轴法转轴法转轴后的解转轴后的解因子负荷量因子负荷量收敛最大迭代收敛最大迭代图1-4 Factor Analyze:Rotation对话框操作过程操作过程案例 1(5)设置因素分数:单击图
15、1-1对话框中的“Scores”按钮,弹出“Factor Analyze:Scores”(因素分析:因素分数)(因素分析:因素分数)对话框。 “Save as variable”(因素存储变量)选项框:(因素存储变量)选项框:勾选时可将新建立的因素分数存储至数据文件中,并产生新的变量名称(默认为fact_1、fact_2、fact_3、fact_4等)。 在“Method”(方法方法)框中表示计算因素分数的方法有三种:A “Regression”:使用回归法。B “Bartlett”:使用Bartlette法。C “Anderson-Robin”:使用Anderson-Robin法。 “Dis
16、play factor coefficient matrix”(显示因素(显示因素分数系数矩阵)选项:分数系数矩阵)选项: 勾选时可显示因素分数系数矩阵。因素存储变量因素存储变量方法方法使用回归法使用回归法使用使用Bartlette法法使用使用Anderson-Robin法法显示因素分数系数矩阵显示因素分数系数矩阵图1-5 Factor Analyze:Scores对话框操作过程操作过程案例 1(6)设置因素分析的选项:单击图1-1对话框中的“Options”按钮,弹出“Factor Analyze:Options”(因素分析:选项)(因素分析:选项)对话框。“Missing Values”(
17、缺失值)选项框:(缺失值)选项框:缺失值的处理方式。 A “Exclude cases listwise”(完全排除缺失完全排除缺失值值):观察值在所有变量中没有缺失值后才加以分析。B “Exclude cases pairwise”(成对排除成对排除观察观察值值):在成对相关分析中出现缺失值的观察值舍弃。C “Replace with mean”(用平均数置换用平均数置换):以变量平均值取代缺失值。“Coefficient Display Format”(系数显示格式)选项框:(系数显示格式)选项框:因素负荷量出现的格式。 A “Sorted by size”(依据因素负荷量排序依据因素负荷
18、量排序):根据每一因素层面的因素负荷量的大小排序。B “Suppress absolute values less than”(绝对值舍弃的下限绝对值舍弃的下限):因素负荷量小于后面数字者不被显示,默认的值为0.1。图1-6 Factor Analyze:Options对话框操作过程操作过程完全排除缺失值完全排除缺失值用平均数置换用平均数置换依据因素负荷量排序依据因素负荷量排序绝对值舍弃的下限绝对值舍弃的下限成对排除成对排除观察值观察值SPSS正在吭哧吭哧地为我们计算结果,请大家耐心等待哦!正在吭哧吭哧地为我们计算结果,请大家耐心等待哦! 案例 1(7)设置完所有的选项后,单击“OK”按钮,输
19、出结果。 经过千辛万苦的努力,我们终于可以看到结果数据了,大家有没有很兴奋呢?经过千辛万苦的努力,我们终于可以看到结果数据了,大家有没有很兴奋呢? 案例 1结果分析结果分析(1)相关系数矩阵及其检验结果Correlation MatrixCorrelation Matrix1.000.959.911.655.492.406.380.787.505.9591.000.908.639.362.284.294.688.320.911.9081.000.582.434.248.316.603.313.655.639.5821.000-.055.118.010.510.221.492.362.434-.
20、0551.000.585.444.492.741.406.284.248.118.5851.000.511.543.713.380.294.316.010.444.5111.000.353.405.787.688.603.510.492.543.3531.000.603.505.320.313.221.741.713.405.6031.000.000.000.002.019.047.060.000.016.000.000.002.070.126.118.001.097.000.000.006.036.161.101.004.103.002.002.006.414.321.484.015.189
21、.019.070.036.414.005.032.019.000.047.126.161.321.005.015.010.000.060.118.101.484.032.015.075.048.000.001.004.015.019.010.075.004.016.097.103.189.000.000.048.004在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费CorrelationSig. (1-tailed)在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均
22、人数经费比例生均教育经费相关矩阵相关矩阵表1-7 相关系数矩阵及其检验结果 表1-7是原有变量的相关系数矩阵及其检验。可以看到,大部分的相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,初步判定适合进行因素分析。结果分析结果分析案例 1 KMO是Kaiser-Meyer-Olkin的取样适当性量数,用于比较变量间简单相关和偏相关系数。 KMO的取值范围在0-1之间。当KMO值越大时,表示变量间的共同因素越多,越适合进行因素分析。 Kaiser(1974)给出一个KMO的选取适合做因子分析的标准:KMO0.9 非常适合非常适合0.8KMO0.9 适合适合0.7KMO0.8 一般一般0
23、.6KMO0.7 不太适合不太适合0.5KMO0.6不适合不适合KMO0.5 非常不适合非常不适合 进行因素分析的普通准则至少要在至少要在0.6以上以上 此处的KMO值为0.762,表示适合因素分析。K KM MO O a an nd d B Ba ar rt tl le et tt t s s T Te es st t.762131.28136.000Kaiser-Meyer-Olkin Measure of SamplingAdequacy.Approx. Chi-SquaredfSig.Bartletts Test ofSphericityKMO取样适切性量数取样适切性量数Bartlet
24、t球形检验球形检验近似卡方分布近似卡方分布自由度自由度显著性显著性 Bartletts球形检验是以变量的相关系数矩阵为出发点,零假设相关矩阵是一个单位阵。(即即sig.值小于值小于0.05时,适合做因子分析。)时,适合做因子分析。) 此题中,Bartletts球形检验的2值为131.281,自由度为36,sig.值为0.000,达到显著,适合进行因素分析。表1-8 KMO及Bartlett检验结果(2) KMO及Bartlett检验结果具体标准具体标准结果分析结果分析案例 1(3) 共同性表1-9 因素间共同性结果CommunalitiesCommunalities1.000.9761.000
展开阅读全文