SPSS的多元统计分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SPSS的多元统计分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 多元 统计分析 课件
- 资源描述:
-
1、 第第9章章 SPSS的多元统计统计分析9.1 SPSS在因子分析中的应应用9.1.1 因子分析的基本原理1、方法概概述 人们在研究实际问题时,往往希望尽可能多的收集相关变量,以期望对问题有比较全面、完整的把握和认识 。 为解决这些问题,最简单和最直接的解决方案是减少变量数目,但这必然又会导致信息丢失或不完整等问题。为此,人们希望探索一种有效的解决方法,它既能减少参与数据分析的变量个数,同时也不会造成统计信息的大量浪费和丢失。 因子分析就是在尽可能不损失信息或者少损失信息的情况下,将多个 变量减少为少数几个因子的方法。这几个因子可以高度概括大量数据中的信息,这样,既减少了变量个数,又同样能再现
2、变量之间的内在联系。9.1 SPSS在因子分析中的应应用2、基本原理通常针对变量作因子分析,称为R型因子分析;另一种对样品作因子分析,称为Q型因子分析,这两种分析方法有许多相似之处。R型因子分析数学模型是:设原有p个变量 且每个变量(或经标准化处理后)的均值为0,标准差为1。现将每个原有变量用k( )个因子 的线性组合来表示,即有:上式就是因子分析的的数学模型,也可以用矩阵的形式表示为 1,.,pxx kp111 112 211221 122 2221 12 2kkkkppppkkpxa fa fa fxa fa fa fxa fa fa fXAF12,kf ff9.1 SPSS在因子分析中的
3、应应用其中,X是可实测的随机向量。F称为因子,由于它们出现在每个原有变量的线性表达式中,因此又称为公共因子。A称为因子载荷矩阵, 称为因子载荷。 称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0 因子分析的基本思想是通过对变量的相关系数矩阵内部结构的分析,从中找出少数几个能控制原始变量的随机变量 选取公共因子的原则是使其尽可能多的包含原始变量中的信息,建立模型 ,忽略 , 以F代替X,用它再现原始变量X的信息,达到简化变量降低维数的目的。(1,2, ;1,2, )ija ip jk(1,2, )if ikXA F9.1 SPSS在因子分析中的应应用3、基本步骤骤 由于实际中数据背景
4、、特点均不相同,故采用因子分析步骤上可能略有差异,但是一个较完整的因子分析主要包括如下几个过程:(1) 确认待分析的原变量是否适合作因子分析 因子分析的主要任务是将原有变量的信息重叠部分提取和综合成因子,进而最终实现减少变量个数的目的。故它要求原始变量之间应存在较强的相关关系。进行因子分析前,通常可以采取计算相关系数矩阵、巴特利特球度检验和KMO检验等方法来检验候选数据是否适合采用因子分析。(2)构造因子变量 将原有变量综合成少数几个因子是因子分析的核心内容。它的关键是根据样本数据求解因子载荷阵。因子载荷阵的求解方法有基于主成分模型的主成分分析法、基于因子分析模型的主轴因子法、极大似然法等。9
5、.1 SPSS在因子分析中的应应用(3)利用旋转方法使因子变量更具有可解释性 将原有变量综合为少数几个因子后,如果因子的实际含义不清,则不利于后续分析。为解决这个问题,可通过因子旋转的方式使一个变量只在尽可能少的因子上有比较高的载荷,这样使提取出的因子具有更好的解释性。(4)计算因子变量得分 实际中,当因子确定以后,便可计算各因子在每个样本上的具体数值,这些数值称为因子得分。于是,在以后的分析中就可以利用因子得分对样本进行分类或评价等研究,进而实现了降维和简化问题的目标。9.1 SPSS在因子分析中的应应用 根据上述步骤,可以得到进行因子分析的详细计算过程如下。将原始数据标准化,以消除变量间在
6、数量级和量纲上的不同。求标准化数据的相关矩阵。求相关矩阵的特征值和特征向量。计算方差贡献率与累积方差贡献率。确定因子:设F1,F2, Fp为p个因子,其中前m个因子包含的 数据信息总量(即其累积贡献率)不低于85%时,可取前m个因子来反映原评价指标。因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。用原指标的线性组合来求各因子得分。综合得分:通常以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。9.1 SPSS在因子分析中的应应用9.1.2 因子分析的SPSS操作详详解Step01:打开对话框选择菜单栏中的【Analyze(
7、分析)】【Data Reduction(降维)】【Factor(因子)】命令,弹出【Factor Analysis(因子分析)】对话框,这是因子分析的主操作窗口。9.1 SPSS在因子分析中的应应用 Step02:选择因子分析变量 在【Factor Analysis(因子分析)】对话框左侧的候选变量列表框中选择进行因子分析的变量,将其添加至【Variables(变量)】列表框中。如果要选择参与因子分析的样本,则需要将条件变量添加至【Selection Variable(选择变量)】列表框中,并单击【Value】按钮输入变量值,只有满足条件的样本数据才能进行后续的因子分析。Step03:选择描述
8、性统计量 单击【Descriptives】按钮,在弹出的对话框中可以选择输出描述性统计量及相关矩阵等内容 。9.1 SPSS在因子分析中的应应用具体选项含义如下: 【Statistics(统计量)】选项组 Univariate descriptives:单变量描述统计量,即输出参与分析的各原始变量的均值、标推差等。 Initial solution:初始分析结果,系统默认项。输出各个分析变量的初始共同度、特征值以及解释方差的百分比等。 【Correlation Matrix(相关矩阵)】选项组 Coefficients:原始分析变量间的相关系数矩阵。 Significance levels:显
9、著性水平。输出每个相关系数相对于相关系数为0 的单尾假设检验的概率水平。 Determinant:相关系数矩阵的行列式。 Inverse:相关系数矩阵的逆矩阵。 Reproduced:再生相关矩阵。输出因子分析后的相关矩阵以及残差阵。 Anti-image:象相关阵。包括偏相关系数的负数以及偏协方差的负数。在一个好的因子模型中,除对角线上的系数较大外,远离对角线的元素应该比较小。9.1 SPSS在因子分析中的应应用 KMO and Bartletts test of sphericity:KMO 和Bartlett 检验。前者输出抽样充足度的Kaisex-Meyer-Olkin 测度,用于检验
10、变量间的偏相关是否很小。后者Bartlett 球度方法检验相关系数阵是否是单位阵。如果是单位阵,则表明因子模型不合适采用因子模型。9.1 SPSS在因子分析中的应应用Step04:选择因子提取方法 单击【 Extract(抽取)】按钮,在弹出的对话框中可以选择提取因子的方法及相关选项。 在【Method(方法)】框下拉列表框中可以选择因子提取方法。 Principal components:主成份分析法。该方法假设变量是因子的纯线性组合。第一成分有最大的方差,后续的成分其可解释的方差逐个递减。 Unweighted least square :不加权最小二乘法。 Generalized lea
11、st squares :加权最小二乘法。 Maximum likelihood :极大似然法。 Principal axis factoring :主轴因子提取法。 Alphafa ctoring:因子提取法。 Image factoring:映象因子提取法。9.1 SPSS在因子分析中的应应用 【Analyze(分析)】选项组 Correlation matrix:相关系数矩阵,系统默认项。 Covariance matrix:协方差矩阵。 【Display(输出)】选项组:输出与因子提取有关的选项。 Unrotated factor solution:输出未经旋转的因子提取结果。此项为系统
12、默认的输出方式。 Scree plot:输出因子的碎石图。它显示了按特征值大小排列的因子序号。它有助于确定保留多少个因子。典型的碎石图会有一个明显的拐点,在该点之前是与大因子连接的陡峭的折线,之后是与小因子相连的缓坡折线。9.1 SPSS在因子分析中的应应用 【Extract(抽取)】 选项组:输出与提取结果有关的选择项。由于理论上因子数目与原始变量数目相等,但因子分析的目的是用少量因子代替多个原始变量,选择提取多少个因子是由本栏来决定。 Eigenvalues over:指定提取的因子的特征值数目。在此项后面的矩形框中给出输入数值(系统默认值为1),即要求提取那些特征值大于1 的因子。 Nu
13、mber of f actors:指定提取公因子的数目。用鼠标单击选择此项后,将指定其数目。 Maximum iterations for Convergence:在对应的文本框中指定因子分析收敛的最大迭代次数。系统默认的最大迭代次数为25。9.1 SPSS在因子分析中的应应用Step05:选择因子旋转方法 单击【Rotation】按钮,在弹出的对话框可以选择因子旋转方法及相关选项。9.1 SPSS在因子分析中的应应用【Method(方法)】选项组选择旋转方法。None:不进行旋转,此为系统默认的选择项。Varimax:方差最大旋转法。这是一种正交旋转方法。它使每个因子具有最高载荷的变量数最小
14、,因此可以简化对因子的解释。 Direct Oblimin:直接斜交旋转法。指定此项可以在下面的“Delta”矩形框中键入值,该值应该在01 之间。系统默认的值为0。Quartma:四次方最大正变旋转法。该旋转方法使每个变量中需要解释的因子数最少。Equamax:平均正交旋转法。Promax:斜交旋转方法。允许因子彼此相关。它比直接斜交旋转更快,因此适用于大数据集的因子分析。指定此项可以在下面的“Kappa”矩形框中键入“”值,默认为4(此值最适合于分析)。【Display(输出)】选项组:选择有关输出显示。 Rotated solution:旋转解。在Method栏中指定旋转方法才能选择此项
15、。 Lodingp lot(s):因子载荷散点图。指定此项将给出以前两因子为坐标轴的各变量的载荷散点图。 Maximum iterations for Convergence:可以指定旋转收敛的最大迭代次数。系统默认值为25。可以在此项后面的文本框中输入指定值。9.1 SPSS在因子分析中的应应用Step06:选择因子得分单击【Scores】按钮,在弹出的对话框中可以选择因子得分方法及相关选项。具体选项含义如下。9.1 SPSS在因子分析中的应应用【Save as variables(保存为变量)】选项组:将因子得分作为新变量保存在数据文件中。 Save as variables:将因子得分作
16、为新变量保存在工作数据文件。中。程序运行结束后,在数据窗中显示出新变量。【Method(方法)】选项组:指定计算因子得分的方法。Regression:回归法。选择此项,其因子得分的均值为0。方差等于估计的因子得分与实际因子得分值之间的复相关系数的平方。 Bartlett:巴特利特法。选择此项,因子得分均值为0。超出变量范围的各因子平方和被最小化。Anderson-Rubin:安德森一鲁宾法。选择此项,是为了保证因子的正交性。本例选中“Regression”项。 在输出窗中显示因子得分。 Display factor score coefficient matrix:输出因子得分系数矩阵。9.1
17、 SPSS在因子分析中的应应用Step07:其他选项输出单击【Options】按钮,在弹出的对话框中可以选择一些附加输出项。具体选项含义如下。9.1 SPSS在因子分析中的应应用【MissingValues(缺失值)】选项组:选择处理缺失值方法。 Exclude cases listwise:分析变量中带有缺失值的观测量都不参与后续分析。 Exclude cases pairwise:成对剔除带有缺失值的观测量。 Replace with mean:用该变量的均值代替工作变量的所有缺失值。【Coefficient Display Format(系数显示格式)】选项组:选择载荷系数的显示格式。
18、Sorted by size:将载荷系数按其大小排列构成矩阵,使在同一因子上具有较高载荷的变量排在一起。便于得出结论。 Suppress absolute values less than:不显示那些绝对值小于指定值的载荷系数。选择此项后还需要在该项的参数框中键入01之间的数作为临界值。系统默认的临界值为0.10。Step08:单击【OK】按钮,结束操作,SPSS软件自动输出结果。9.1 SPSS在因子分析中的应应用9.1.3 9.1.3 实例分析:居民消费结构的变动实例分析:居民消费结构的变动1. 1. 实例内容实例内容 消费结构是指在消费过程中各项消费支出占居民总支出的比重。它是反映居民生
19、活消费水平、生活质量变化状况以及内在过程合理化程度的重要标志。而消费结构的变动不仅是消费领域的重要问题, 而且也关系到整个国民经济的发展。因为合理的消费结构及消费结构的升级和优化不仅反映了消费的层次和质量的提高, 而且也为建立合理的产业结构和产品结构提供了重要的依据。 表9-1是某市居民生活费支出费用,具体分为食品、衣着、家庭设备用品及服务、医疗保健、交通通讯、文教娱乐及服务、居住和杂项商品与服务等8个部分。请利用因子分析探讨该市居民消费结构,为产业政策的制定和宏观经济的调控提供参考。9.1 SPSS在因子分析中的应应用2. 实实例操作 数据文件9-1.sav是某市居民在食品、衣着、医疗保健等
20、八个方面的消费数据,这些指标之间存在着不同强弱的相关性。如果单独分析这些指标,无法能够分析居民消费结构的特点。因此,可以考虑采用因子分析,将这八个指标综合为少数几个因子,通过这些公共因子来反映居民消费结构的变动情况。9.1 SPSS在因子分析中的应应用3. 实实例结结果及分析(1)描述性统计表 下表显示了食品、衣着等这八个消费支出指标的描述统计量,例如均值、标准差等。这为后续的因子分析提供了一个直观的分析结果。可以看到,食品支出消费所占的比重最大,其均值等于39.4750%,其次是文化娱乐服务支出消费和交通通信支出消费。所有的消费支出中,医疗保健消费支出占的比重最低。9.1 SPSS在因子分析
21、中的应应用Mean Std. Deviation Analysis N 食品 39.4750 2.29705 8衣着 6.4875 .86592 8家庭设备用品及服务 7.9125 2.87772 8医疗保健 6.3625 1.54729 8交通和通信 8.1750 2.61302 8文化娱乐服务 14.4750 2.30016 8居住 12.1625 2.91545 8杂项商品与服务 2.9125 .52491 89.1 SPSS在因子分析中的应应用(2)因子分析共同度 下表是因子分析的共同度,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度。它表明,对原有八个变量如果采用主
22、成分分析法提取所有八个特征根,那么原有变量的所有方差都可被解释,变量的共同度均为1(原有变量标准化后的方差为1)。 事实上,因子个数小于原有变量的个数才是因子分析的目的,所以不可能提取全部特征根。于是,第二列列出了按指定提取条件(这里为特征根大于1)提取特征根时的共同度。可以看到,所有变量的绝大部分信息(全部都大于83)可被因子解释,这些变量信息丢失较少。因此本次因子提取的总体效果理想。9.1 SPSS在因子分析中的应应用Initial Extraction食品 1.000 .842 衣着 1.000 .842家庭设备用品及服务 1.000 .976医疗保健 1.000 .954交通和通信 1
23、.000 .925文化娱乐服务 1.000 .953居住 1.000.978杂项商品与服务 1.000.9479.1 SPSS在因子分析中的应应用 (3)因子分析的总方差解释 接着Spss软件计算得到相关系数矩阵的特征值、方差贡献率及累计方差贡献率结果如表9-4所示。在下页表中,第一列是因子编号,以后三列组成一组,组中数据项的含义依次是特征根、方差贡献率和累计贡献率。 第一组数据项(第二至第四列)描述了初始因子解的情况。可以看到,第一个因子的特征根值为4.316,解释了原有8个变量总方差的53.947。前三个因子的累计方差贡献率为94.196,并且只有它们的取值大于1。说明前3个公因子基本包含
24、了全部变量的主要信息,因此选前3个因子为主因子即可。 同时,Extraction Sums of Squared Loadings和Rotation Sums of Squared Loadings部分列出了因子提取后和旋转后的因子方差解释情况。从表中看到,它们都支持选择3个公共因子。9.1 SPSS在因子分析中的应应用因子分析的总方差解释 9.1 SPSS在因子分析中的应应用(4)因子碎石图 下图为因子分析的碎石图。横坐标为因子数目,纵坐标为特征根。可以看到,第一个因子的特征值很高,对解释原有变量的贡献最大;第三个以后的因子特征根都较小,取值都小于1,说明它们对解释原有变量的贡献很小,称为可
25、被忽略的“高山脚下的碎石”,因此提取前三个因子是合适的。9.1 SPSS在因子分析中的应应用9.1 SPSS在因子分析中的应应用 (5)旋转前的因子载荷矩阵 下表中显示了因子载荷矩阵,它是因子分析的核心内容。通过载荷系数大小可以分析不同公共因子所反映的主要指标的区别。从结果看,大部分因子解释性较好,但是仍有少部分指标解释能力较差,例如“食品”指标在三个因子的载荷系数区别不大。因此接着采用因子旋转方法使得因子载荷系数向0或1两极分化,使大的载荷更大,小的载荷更小。这样结果更具可解释性。9.1 SPSS在因子分析中的应应用旋转前的因子载荷矩阵 9.1 SPSS在因子分析中的应应用(6)旋转后的因子
展开阅读全文