1、Factor Analysis一、案例引读二、基本原理三、历史渊源四、分析步骤目录五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解我要定制定制衣服身高袖长胸围腰围肩宽肩厚颜色我们厂要批量批量制作衣服SML长度长度胖瘦胖瘦指标一指标一指标三指标三指标二指标二一、案例引读一、案例引读身高袖长胸围腰围肩宽肩厚颜色降维第一主成分第一主成分第二主成分第二主成分第三主成分第三主成分主成分分析主成分分析二、基本原理三、历史渊源 四、分析步骤五、案例详解主成分分析特点主成分分析特点原始变量间相关性较大几个主成分之间相互独立主成分信息由大到小身高身高肩宽肩宽袖长袖长132原
2、始变量数与主成分数相等5色5变量5色5主成分一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解一、案例引读一、案例引读二、基本原理三、历史渊源 四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读Charles Spearman1904年对智力测验得分进行统计分析古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)4个假设:已知个假
3、设:已知xi=aiF+ei四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读一、案例引读x1= a11F1 + a12F2 + + a1mFm + a11x2= a21F1 + a22F2 + + a2mFm + a22xp= ap1F1+ ap2F2 + + apmFm + app 因素分析把每个原始变量分解成两部分:一部分由所有变量共同具有的少数几个因子构成,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因子部分。其中,F1,F2,Fm叫做公共因子,它们是在各个变量中共同出现的因子。i(i=1,2,p)表示影响xi的独特因子,指原有变量不能被因子变量所解释的部分
4、,相当于回归分析中的残差部分。aij叫做因子负荷(载荷),它是第i个变量在第j个主因子上的负荷,它反映了第i个变量在第j个主因素的相对重要性。xp 为第p个变量的标准化分数;m为所有变量共同因素的数目;F1,F2,Fm彼此独立(转轴方法问题)数学模型数学模型四、分析步骤五、案例详解四、分析步骤样本的优劣样本的优劣因子得分因子得分xi=aiF+ei因子负荷因子负荷主成分法主成分法因子旋转因子旋转FF便于解释便于解释二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源四、分析步骤二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源因子负荷因子负荷主成分法主成分法因子旋转因子旋转FF
5、四、分析步骤二、基本原理一、案例引读一、案例引读五、案例详解三、历史渊源因子旋转因子旋转F=DF保持F间相互独立斜交旋转斜交旋转正交旋转正交旋转不是很容易解释因子放弃F间相互独立容易解释因子五、案例详解二、基本原理一、案例引读一、案例引读五、分析步骤三、历史渊源案例一案例一案例二案例二 对北京对北京18个区县中等职业教育发展水平的个区县中等职业教育发展水平的9个指标进个指标进行因子分析,然后进行综合评价。行因子分析,然后进行综合评价。 x1:每万人中等职业教育在校生数 x2:每万人中等职业教育招生数 x3:每万人中等职业教育毕业生数 x4:每万人中等职业教育专任教师数 x5:本科以上学校教师占
6、专任教师的比例 x6:高级教师占专任教师的比例 x7:学校平均在校生人数 x8:国家财政预算中等职业教育经费占国内生产总值的比例 x9:生均教育经费案例 1(1)选择“Analyze(分析分析)Data Reduction(数据缩减数据缩减)Factor(因因子子)”命令,弹出“Factor Analyze(因子分析)”对话框,将变量“x1”到“x9”选入“Variables(变量)”框中。图1-1 Factor Analyze对话框案例 1描述性统计量描述性统计量 分数分数 转轴法转轴法 萃取萃取 选项选项操作过程操作过程案例 1(2)设置描述性统计量:单击图1-1对话框中的“Descrip
7、tives”按钮,弹出“Factor Analyze:Descriptives”(因素分析:描述性统计量)(因素分析:描述性统计量)对话框。单变量描述性统计量单变量描述性统计量 未转轴之统计量未转轴之统计量 系数系数 倒数模式倒数模式显著水平显著水平重制的重制的行列式行列式反映像反映像KMO与与Bartlett球形检验球形检验 “Statistics”(统计量)对话框(统计量)对话框 A “Univariate descriptives”(单变量描述性单变量描述性统计量统计量):显示每一题项的平均数、标准差。B “Initial solution”(未转轴之统计量未转轴之统计量):显示因素分析
8、未转轴前之共同性、特征值、变异数百分比及累积百分比。 “Correlation Matric”(相关矩阵)选项框(相关矩阵)选项框A “Coefficients”(系数系数):显示题项的相关矩阵 B “Significance levels”(显著水准显著水准):求出前述相关矩阵地显著水准。 C “Determinant”(行列式行列式):求出前述相关矩阵地行列式值。 D “KMO and Bartletts test of sphericity”(KMO与与Bartlett的球形检定的球形检定):显示KMO抽样适当性参数与Bartletts的球形检定。E “Inverse”(倒数模式倒数模式
9、):求相关矩阵的反矩阵。F “Reproduced”(重制的重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线及下三角形代表相关系数。G “Anti-image”(反映像反映像):求出反映像的共变量及相关矩阵。图1-2 Factor Analyze:Descriptives对话框操作过程操作过程案例 1(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction”按钮,弹出“Factor Analyze:Extraction”(因素分析:萃取)(因素分析:萃取)对话框。 “Method”(方法)选项框:(方法)选项框:下拉式选项内有其中抽取因素的方法:A “Princi
10、pal components”法:法:主成份分析主成份分析法法抽取因素,此为SPSS默认方法。B “Unweighted least squares”法:法:未加权未加权最小平方法。最小平方法。C “Generalized least square”法:法:一般化最一般化最小平方法。小平方法。D “Maximum likelihood”法:法:最大概似法。最大概似法。E “Principal-axis factoring”法:法:主轴法。主轴法。F “Alpha factoring”法:法:因素抽取法。因素抽取法。G “Image factoring”法:法:映像因素抽取法。映像因素抽取法。
11、“Analyze”(分析)选项框(分析)选项框A “Correlation matrix”(相关矩阵相关矩阵):以相关矩阵来抽取因素。B “Covariance matrix”(共变异数矩共变异数矩阵阵):以共变量矩阵来抽取因素。 “Display”(显示)选项框(显示)选项框A “Unrotated factor solution”(未未旋转因子解旋转因子解):显示未转轴时因素负荷量、特征值及共同性。B “Scree plot”(陡坡图陡坡图):陡坡图。 “Extract”(抽取)选项框(抽取)选项框A “Eigenvalues over”(特征值特征值):后面的空格默认为1,表示因素抽取时
12、,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。B “Number of factors”(因子个数因子个数):选取此项时,后面的空格内输入限定的因素个数。 相关矩阵相关矩阵共变异数矩阵共变异数矩阵未旋转因子解未旋转因子解陡坡图陡坡图特征值特征值因子个数因子个数图1-3 Factor Analyze:Extraction对话框操作过程操作过程案例 1(4)设置因素转轴:单击图1-1对话框中的“Rotation”按钮,弹出“Factor Analyze:Rotation”(因素分析:旋转)(因素分析:旋转)对话框。 “Display”(显示)选项框:(显示)选项框:A “Rotat
13、ed solution”(转轴后的解转轴后的解):显示转轴后的相关信息,正交转轴显示因素组型矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素相关矩阵。B “Loading plots”(因子负荷量因子负荷量):绘出因素的散步图。 “Maximum Iterations for Convergence”:(收敛最大:(收敛最大迭代):迭代): 转轴时执行的迭代最多次数,后面默认数字为25,表示算法执行转轴时,执行步骤的次数上限。 “Method”(方法)选项方框内六种因素转轴方(方法)选项方框内六种因素转轴方法:法:A “None”:不需要转轴。不需要转轴。B “Varimax”:
14、最大变异法。最大变异法。C “Quartimax”:四次方最大值法。四次方最大值法。D “Equamax”:相等最大值法。相等最大值法。E “Direct Oblimin”:直接斜交转轴法。直接斜交转轴法。F “Promax”:Promax转轴法。转轴法。正交旋转正交旋转斜交旋转斜交旋转不转轴不转轴最大变异法最大变异法四次方最大值法四次方最大值法相等最大值法相等最大值法直接斜交转轴法直接斜交转轴法Promax转轴法转轴法转轴后的解转轴后的解因子负荷量因子负荷量收敛最大迭代收敛最大迭代图1-4 Factor Analyze:Rotation对话框操作过程操作过程案例 1(5)设置因素分数:单击图
15、1-1对话框中的“Scores”按钮,弹出“Factor Analyze:Scores”(因素分析:因素分数)(因素分析:因素分数)对话框。 “Save as variable”(因素存储变量)选项框:(因素存储变量)选项框:勾选时可将新建立的因素分数存储至数据文件中,并产生新的变量名称(默认为fact_1、fact_2、fact_3、fact_4等)。 在“Method”(方法方法)框中表示计算因素分数的方法有三种:A “Regression”:使用回归法。B “Bartlett”:使用Bartlette法。C “Anderson-Robin”:使用Anderson-Robin法。 “Dis
16、play factor coefficient matrix”(显示因素(显示因素分数系数矩阵)选项:分数系数矩阵)选项: 勾选时可显示因素分数系数矩阵。因素存储变量因素存储变量方法方法使用回归法使用回归法使用使用Bartlette法法使用使用Anderson-Robin法法显示因素分数系数矩阵显示因素分数系数矩阵图1-5 Factor Analyze:Scores对话框操作过程操作过程案例 1(6)设置因素分析的选项:单击图1-1对话框中的“Options”按钮,弹出“Factor Analyze:Options”(因素分析:选项)(因素分析:选项)对话框。“Missing Values”(
17、缺失值)选项框:(缺失值)选项框:缺失值的处理方式。 A “Exclude cases listwise”(完全排除缺失完全排除缺失值值):观察值在所有变量中没有缺失值后才加以分析。B “Exclude cases pairwise”(成对排除成对排除观察观察值值):在成对相关分析中出现缺失值的观察值舍弃。C “Replace with mean”(用平均数置换用平均数置换):以变量平均值取代缺失值。“Coefficient Display Format”(系数显示格式)选项框:(系数显示格式)选项框:因素负荷量出现的格式。 A “Sorted by size”(依据因素负荷量排序依据因素负荷
18、量排序):根据每一因素层面的因素负荷量的大小排序。B “Suppress absolute values less than”(绝对值舍弃的下限绝对值舍弃的下限):因素负荷量小于后面数字者不被显示,默认的值为0.1。图1-6 Factor Analyze:Options对话框操作过程操作过程完全排除缺失值完全排除缺失值用平均数置换用平均数置换依据因素负荷量排序依据因素负荷量排序绝对值舍弃的下限绝对值舍弃的下限成对排除成对排除观察值观察值SPSS正在吭哧吭哧地为我们计算结果,请大家耐心等待哦!正在吭哧吭哧地为我们计算结果,请大家耐心等待哦! 案例 1(7)设置完所有的选项后,单击“OK”按钮,输
19、出结果。 经过千辛万苦的努力,我们终于可以看到结果数据了,大家有没有很兴奋呢?经过千辛万苦的努力,我们终于可以看到结果数据了,大家有没有很兴奋呢? 案例 1结果分析结果分析(1)相关系数矩阵及其检验结果Correlation MatrixCorrelation Matrix1.000.959.911.655.492.406.380.787.505.9591.000.908.639.362.284.294.688.320.911.9081.000.582.434.248.316.603.313.655.639.5821.000-.055.118.010.510.221.492.362.434-.
20、0551.000.585.444.492.741.406.284.248.118.5851.000.511.543.713.380.294.316.010.444.5111.000.353.405.787.688.603.510.492.543.3531.000.603.505.320.313.221.741.713.405.6031.000.000.000.002.019.047.060.000.016.000.000.002.070.126.118.001.097.000.000.006.036.161.101.004.103.002.002.006.414.321.484.015.189
21、.019.070.036.414.005.032.019.000.047.126.161.321.005.015.010.000.060.118.101.484.032.015.075.048.000.001.004.015.019.010.075.004.016.097.103.189.000.000.048.004在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费CorrelationSig. (1-tailed)在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均
22、人数经费比例生均教育经费相关矩阵相关矩阵表1-7 相关系数矩阵及其检验结果 表1-7是原有变量的相关系数矩阵及其检验。可以看到,大部分的相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,初步判定适合进行因素分析。结果分析结果分析案例 1 KMO是Kaiser-Meyer-Olkin的取样适当性量数,用于比较变量间简单相关和偏相关系数。 KMO的取值范围在0-1之间。当KMO值越大时,表示变量间的共同因素越多,越适合进行因素分析。 Kaiser(1974)给出一个KMO的选取适合做因子分析的标准:KMO0.9 非常适合非常适合0.8KMO0.9 适合适合0.7KMO0.8 一般一般0
23、.6KMO0.7 不太适合不太适合0.5KMO0.6不适合不适合KMO0.5 非常不适合非常不适合 进行因素分析的普通准则至少要在至少要在0.6以上以上 此处的KMO值为0.762,表示适合因素分析。K KM MO O a an nd d B Ba ar rt tl le et tt t s s T Te es st t.762131.28136.000Kaiser-Meyer-Olkin Measure of SamplingAdequacy.Approx. Chi-SquaredfSig.Bartletts Test ofSphericityKMO取样适切性量数取样适切性量数Bartlet
24、t球形检验球形检验近似卡方分布近似卡方分布自由度自由度显著性显著性 Bartletts球形检验是以变量的相关系数矩阵为出发点,零假设相关矩阵是一个单位阵。(即即sig.值小于值小于0.05时,适合做因子分析。)时,适合做因子分析。) 此题中,Bartletts球形检验的2值为131.281,自由度为36,sig.值为0.000,达到显著,适合进行因素分析。表1-8 KMO及Bartlett检验结果(2) KMO及Bartlett检验结果具体标准具体标准结果分析结果分析案例 1(3) 共同性表1-9 因素间共同性结果CommunalitiesCommunalities1.000.9761.000
25、.9391.000.9021.000.8101.000.7451.000.7701.000.7901.000.7761.000.887在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费InitialExtractionExtraction Method: Principal Component Analysis.共同性共同性初始初始萃取萃取萃取法:主成分分析法萃取法:主成分分析法 表1-3为每个变量的初始共同性以及主成分分析法抽取主成分后的共同性。 共同性越低,表示该变量不适合投入主成分分析中;共同性越高,表示该变量与其他变量可测量的共同特质越多,即该变量越有
26、影响力。 采用主成分分析法抽取共同因素时,初步的共同性估计值均为1。 此题中,所有变量的共同性均较高,各个变量信息丢失较少。因此本次因子提取的总体效果较理想。X1X1的共同度的共同度 结果分析结果分析案例 1(4)解释总变异量表1-10 解释总变异量 表1-10分三大部分, 初始特征值初始特征值(初步抽取共同因素的结果初步抽取共同因素的结果)。Total(总和)直列的数字为每一因子的特征值,特征值越大表示因子在解释9个变量的变异量时越重要;第二直列“% of Variance”(方差的%)为每一个抽取因素可解释变量的百分比;第三直列“Cumulative%”(累计%)为解释变量的变异量的累计百
27、分比。 平方和负荷量萃取平方和负荷量萃取(转轴前的特征值、解释变异量和累计解释变异量转轴前的特征值、解释变异量和累计解释变异量)将左边9个成份中抽取3个特征值最大的列于右边。 转轴平方和负荷量转轴平方和负荷量(转轴后的特征值、解释变异量及累计解释变异量转轴后的特征值、解释变异量及累计解释变异量)。Total Variance ExplainedTotal Variance Explained4.98755.41555.4154.98755.41555.4153.70941.20741.2071.86820.75776.1721.86820.75776.1722.68529.82871.035.
28、7408.21884.390.7408.21884.3901.20213.35584.390.6066.72991.119.3093.43294.551.2803.10697.657.1221.35599.012.075.83099.842.014.158100.000Component123456789Total% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %Initial EigenvaluesExtraction Sums of Squared LoadingsRot
29、ation Sums of Squared LoadingsExtraction Method: Principal Component Analysis.解释总变异量解释总变异量初始特征值初始特征值平方和负荷量萃取平方和负荷量萃取转轴平方和负荷量转轴平方和负荷量累计累计%方差的方差的%总和总和成分成分萃取法:主成分分析法萃取法:主成分分析法 第一个因子的特征值为第一个因子的特征值为4.987,解释原有,解释原有9个变量总方差的个变量总方差的55.415%(4.987 9 100%),累计方差贡献率),累计方差贡献率55.275%;其余数据含义类似。;其余数据含义类似。 由于特征值是由大到小排
30、列,所以第一由于特征值是由大到小排列,所以第一个因子的解释变异量通常是最大者,它解释个因子的解释变异量通常是最大者,它解释了总变异量的了总变异量的55.415%,其次是第二个,其次是第二个1.868,再是第三个再是第三个0.740。 指定提取三个因子后,三个因子共解释指定提取三个因子后,三个因子共解释了原有变量总方差的了原有变量总方差的84.390%。总体上,三。总体上,三个因子反映了原有变量的大部分信息,因子个因子反映了原有变量的大部分信息,因子分析效果理想。分析效果理想。 转轴前三个因子的特征值分别为转轴前三个因子的特征值分别为4.987,1.868,0.740,特征值总和为特征值总和为7
31、.595 ;转轴;转轴后为后为3.709,2.085,1.202,特征值总和为,特征值总和为6.996。? 转轴后,个别因子的特征值会改变,但转轴后,个别因子的特征值会改变,但所有因子的总特征值不变,转轴后三个因子所有因子的总特征值不变,转轴后三个因子的特征值间差异较小。的特征值间差异较小。 转轴后四个因子可以解释的总变异量不转轴后四个因子可以解释的总变异量不变,仍然是变,仍然是84.390。特特征征值值碎石图碎石图因子数目因子数目结果分析结果分析案例 1(5) 碎石图图1-11 因素间共同性结果 碎石图(陡坡图)检验的判断准则是取坡线突然剧升的因素,删除坡线平坦的因素。 图1-11中我们可以
32、看出,第三个因素以后,坡线甚为平坦,因而保留2个因素较为适宜。此题中我们保留了3个因子,其实第3个因子似乎可以删除。 C Co om mp po on ne en nt t M Ma at tr ri ix xa a.944-.282.072.857-.425.157.854-.017-.214.832-.383.249.704.514-.356.664.548.055.633.573-.202.573-.614-.323.523.436.572在校生数招生数经费比例毕业生数生均教育经费本科教师比例高级教师比例专任教师数平均人数123Component成分矩阵(成分矩阵(a)成分成分R Ro
33、ot ta at te ed d C Co om mp po on ne en nt t M Ma at tr ri ix xa a.937.142.202.909.328.205.896.113.293.817.073-.370.657.586.030.197.918.068.111.845.208.164.727.435.151.331.811招生数在校生数毕业生数专任教师数经费比例生均教育经费高级教师比例本科教师比例平均人数123Component转轴后的成分矩阵(转轴后的成分矩阵(a)成分成分结果分析结果分析案例 1(5) 成分矩阵表1-12 成分矩阵表1-13 转轴后的成分矩阵 表1
34、-12显示了因子负荷矩阵,是因子分析的核心内容。可以看出,9个变量在第1个因子上的负荷都很高,意味着它们与第1个因子的相关程度高,其余2个因子与9个变量的相关性较小。 另外还可以看到,这三个因子的实际含义比较模糊。 表1-12显示了旋转后的成分矩阵。招生数、在校生数、毕业生数、专任教师数和经费比例4个变量在第1个因子上有较高的负荷,第1个因子主要解释这4个变量,其意义代表中等职业教育的相对规模大小,可解释为发展规模; 生均教育经费、高级教师比例、本科教师比例3个变量在第2个因子上有较高的负荷,第2个因子主要解释这3个变量,其意义代表中等职业教育的办学条件(师资、经费),可解释为办学条件; 第3
35、个因子主要解释学校平均在校生人数这个原有变量,其意义可表示中等职业教育的学校规模,可解释为学校规模效益。 与转轴前相比,因子含义较为清晰。每变量在三个因子上的相关系数。C Co om mp po on ne en nt t M Ma at tr ri ix xa a.944-.282.072.857-.425.157.854-.017-.214.832-.383.249.704.514-.356.664.548.055.633.573-.202.573-.614-.323.523.436.572在校生数招生数经费比例毕业生数生均教育经费本科教师比例高级教师比例专任教师数平均人数123Compo
36、nent成分矩阵(成分矩阵(a)成分成分R Ro ot ta at te ed d C Co om mp po on ne en nt t M Ma at tr ri ix xa a.937.142.202.909.328.205.896.113.293.817.073-.370.657.586.030.197.918.068.111.845.208.164.727.435.151.331.811招生数在校生数毕业生数专任教师数经费比例生均教育经费高级教师比例本科教师比例平均人数123Component转轴后的成分矩阵(转轴后的成分矩阵(a)成分成分结果分析结果分析案例 1(5) 成分矩阵表1
37、-12 成分矩阵表1-13 转轴后的成分矩阵 转轴的目的在于获得简单结构(simple structure),使一个共同因素很清楚的被一组变量数所界定,使每一个变量能归属于一个明确的主因素使每一个变量能归属于一个明确的主因素(home factor)(Spicer,2005)。 因素负荷量的选取标准一般以因素负荷量的选取标准一般以0.4来检验。来检验。(即3个因素负荷量中只能有一个的绝对值大于0.4。) “经费比例”这一变量与共同因素二的因素负荷量为0.586,表示该变量虽然归属于共同因素一,但其与共同因素二仍有很密切的关联。“本科教师比例”这一变量也类似。这种结果显示,以直交转轴的最大变异法
38、来进行因素转轴,并未完全符合简单结构的要求。 R Ro ot ta at te ed d C Co om mp po on ne en nt t M Ma at tr ri ix xa a.937.142.202.909.328.205.896.113.293.817.073-.370.657.586.030.197.918.068.111.845.208.164.727.435.151.331.811招生数在校生数毕业生数专任教师数经费比例生均教育经费高级教师比例本科教师比例平均人数123Component转轴后的成分矩阵(转轴后的成分矩阵(a)成分成分结果分析结果分析案例 1(5) 成分矩
39、阵表1-13 转轴后的成分矩阵 根据该表可以写出本例的因子分析模型:招生数=0.937F1+0.142F2+0.202F3在校生数=0.909F1+0.328F2+0.205F3平均人数=0.151F1+0.331F2+0.811F30.9372+0.1422+0.2022=0.976共同性为每个变量在各主成分上的负荷量的平方和。C Co om mp po on ne en nt t T Tr ra an ns sf fo or rm ma at ti io on n M Ma at tr ri ix x.769.583.264-.638.668.384.048-.464.885Compone
40、nt123123结果分析结果分析案例 1(6) 因素转换矩阵表1-14 成分转换矩阵 表1-14为因素转换矩阵,利用转轴前的因素矩阵乘以此处的因素转换矩阵可得转轴后的因素矩阵。结果分析结果分析案例 1成成分分2转轴后空间中的成分图转轴后空间中的成分图成分成分1成分成分3图1-15 负荷散点图 图1-15为根据表1-13“转轴后的成分矩阵”所绘出的负荷散点图,这里为3个因子的三维因子负荷散点图,以3个因子为坐标,给出各原始变量在该坐标中的负荷散点图。(7) 负荷散点图Component Score Coefficient MatrixComponent Score Coefficient Mat
41、rix.247-.036.078.287-.151.146.275-.196.264.277.050-.482-.081.239.214-.111.405-.090-.031-.141.801.124.228-.214-.090.489-.283在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费123Component结果分析结果分析案例 1(8) 因子得分矩阵表1-16 因子得分矩阵 表1-16为因子得分矩阵,这是根据回归算法计算出来的因子得分函数的系数,根据该表可以得到下面的因子得分函数。 F1=0.247在校生数+0.287招生数+0.275毕业生数+0
42、.277专任教师数-0.081本科教师比例-0.111高级教师比例-0.031平均人数+0.124经费比例-0.090生均教育经费; F2=-0.036在校生数-0.151招生数-0.196毕业生数+0.050专任教师数-0.239本科教师比例+0.405高级教师比例-0.141平均人数+0.228经费比例-0.489生均教育经费; F3=在校生数+0.287招生数+0.275毕业生数+0.277专任教师数-0.081本科教师比例-0.111高级教师比例-0.031平均人数+0.124经费比例-0.090生均教育经费; 据这3个因子得分函数自动计算18个样本的3个因子得分,并且将3个因子得分作
43、为新变量,保存在数据编辑窗口中(分别为fac_1、fac_2、fac_3,如图1-17所示)。图1-17 因子得分结果分析结果分析案例 1(9) 因子得分C Co om mp po on ne en nt t S Sc co or re e C Co ov va ar ri ia an nc ce e M Ma at tr ri ix x1.000.000.000.0001.000.000.000.0001.000Component123123表1-18 因子的协方差矩阵结果分析结果分析案例 1(9) 因子的协方差矩阵 表1-18显示了3个因子的协方差矩阵。可知,3个因子没有线性相关性,实现了
44、因子分析的设计目标。图1-19 综合评价结果分析结果分析案例 1(9) 综合评价 我们可根据上述分析结果对18个区县的中等职业教育发展水平进行综合评价。首先,根据3个因子的方差贡献率确定权重。由于3个因子在较大程度上反映了原变量的大部分信息,其累计贡献率达84.390%,因子可用因子的方差贡献率作为综合评价的权重,于是3个因子按各自的方差贡献率加权相加为综合评价得分,其计算公式为F=0.41F1+0.3F2+0.13F3, 由综合评价得分值的大小确定某一区县中等职业教育发展的综合水平。 其次,根据F值的大小分类。计算结果如图1-19中的“综合”列。根据F值的大小可分为如下几类: 第一类,综合发
45、展水平好(综合第一类,综合发展水平好(综合0.5):朝阳、崇文、大兴;):朝阳、崇文、大兴; 第二类,综合发展水平一般(第二类,综合发展水平一般(0综合综合0.5):昌平、宣武、石景山、东城、海淀、丰台、西城;):昌平、宣武、石景山、东城、海淀、丰台、西城; 第三类,综合发展水平较差:房山、门头沟、怀柔、通县、密云、延庆、平谷、顺义。第三类,综合发展水平较差:房山、门头沟、怀柔、通县、密云、延庆、平谷、顺义。表1-20 北京18个区县中等职业教育发展水平状况的因素分析摘要表结果分析结果分析案例 1(10) 综合评价分析变量变量解释变异量解释变异量累计解释变异量累计解释变异量最大变异法直交转轴后
46、的因素负荷量最大变异法直交转轴后的因素负荷量共同性共同性发展规模发展规模办学条件办学条件学校规模效益学校规模效益x2招生数41.21%41.21%0.9370.939X1在校生数0.9090.976X3毕业生数0.8960.902X4专任教师数0.8170.810X8经费比例0.6570.776X9生均教育经费29.83%71.04%0.9180.887X6高级教师比例0.8450.770X5本科教师比例0.7270.745X7平均人数13.36%84.39%0.8110.790特征值特征值3.7092.6851.202THANK YOUKMO统计量值统计量值判别说明判别说明因素分析适切性因素
47、分析适切性0.90以上极适合极适合进行因素分析极佳的(Perfect)0.80以上适合适合进行因素分析良好的(Meritorious)0.70以上尚可尚可进行因素分析适中的(Middling)0.60以上勉强可勉强可进行因素分析普通的(Mediocre)0.50以上不适合不适合进行因素分析欠佳的(Miserable)0.50以下非常不适合非常不适合进行因素分析无法接受(Unacceptable)表表1-8-1 KMO指标值的判断准则表指标值的判断准则表案例 1(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction”按钮,弹出“Factor Analyze:Extraction
48、”(因素分析:萃取)(因素分析:萃取)对话框。 “Extract”(抽取)选项框(抽取)选项框A “Eigenvalues over”(特征值特征值):后面的空格默认为1,表示因素抽取时,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。B “Number of factors”(因子个数因子个数):选取此项时,后面的空格内输入限定的因素个数。 相关矩阵相关矩阵共变异数矩阵共变异数矩阵未旋转因子解未旋转因子解陡坡图陡坡图特征值特征值因子个数因子个数图1-3 Factor Analyze:Extraction对话框操作过程操作过程图1-3-1 Factor Analyze:Extrac
49、tion对话框 如果我们选择特征值大于1,则输出的结果如表1-4-1。Total Variance ExplainedTotal Variance Explained4.98755.41555.4154.98755.41555.4153.70641.17441.1741.86820.75776.1721.86820.75776.1723.15034.99876.172.7408.21884.390.6066.72991.119.3093.43294.551.2803.10697.657.1221.35599.012.075.83099.842.014.158100.000Component123456789Total% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %Initial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsExtraction Method: Principal Component Analysis.表1-4-1 解释总变异量