因子分析--课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《因子分析--课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 课件
- 资源描述:
-
1、第一节第一节 因子分析简介因子分析简介第二节第二节 基本原理基本原理第三节第三节 求解初始因子求解初始因子第四节第四节 解释因子解释因子参见郭志刚主编,参见郭志刚主编,社会统计分析方法社会统计分析方法SPSS软件应用软件应用第三章,第三章,中国人民大学出版社中国人民大学出版社1999第一节 因子分析简介 因子分析(Factor Analysis,也称因素分析)是一种数据化简数据化简技术 1、考察一组变量之间的协方差或相关系数结构 2、解释这些变量与为数较少的因子(即不可观测的潜变量)之间的关联分类 探索性因子分析(Exploratory Factor Analysis,EFA)验证性因子分析(
2、Confirmatory Factory Analysis,CFA)也称为实证性因子分析、证实性因子分析、确定性因子分析)。共同点 1、理论基础:普通因子分析模型 2、主要目的:浓缩数据 通过对诸多变量的相关性研究,用假想的用假想的少数几个变量少数几个变量(因子、潜变量因子、潜变量)来表示原来变来表示原来变量量(观测变量观测变量)的主要信息。的主要信息。不同不同 1、基本思想不同、基本思想不同 因子分析的基本思想是要寻找公共因子寻找公共因子,以达到数据化简数据化简的目的。探索性因子分析探索性因子分析:找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相对比较大
3、的揭示一套相对比较大的变量的内在结构变量的内在结构。研究者的假定是每个指标变量都与某个因子匹配,而且只能通过因子载荷凭知觉推断通过因子载荷凭知觉推断数据的因子结构数据的因子结构。验证性因子:决定事前定义因子的模型拟合实际数据的能力,以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。指标变量是基于先验理论选出的,而因子分析是用来看它们是否如预期的一样。先验假设:每个因子都与一个具体的指示变量子集对应,并且至少要求预先假设模型中因子的数目,但有时也预期哪些变量依赖哪个因子。2、应用前提不同、应用前提不同 探索性因子分析没有先验信息,而验证性因子分析有先验信息。探索性因子分析
4、是在事先不知道影响因子的基础上,完全依据样本数据,利用统计软件以一定的原则进行因子分析,通过因子载荷凭知觉推断数据的因子结构,最后得出因子的过程。适合于在没有理论支持的情况下对数据的试探性分析。这就需要用验证性因子分析来做进一步检验 验证性因子分析基于预先建立的理论,要求事先假设因子结构,其先验假设是每个因子都与一个具体的指示变量子集对应,以检验这种结构是否与观测数据一致。也就是在上述数学模型中,首先要根据先验信息判定公共因子数m,同时还要根据实际情况将模型中某些参数设定为某一定值。这样,验证性因子分析也就充分利用了先验信息,在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作
5、用。3、理论假设不同、理论假设不同 探索性因子分析的假设主要包括:所有的公共因子都相关(或都不相关);所有的公共因子都直接影响所有的观测变量;特殊(唯一性)因子之间相互独立;所有观测变量只受一个特殊(唯一性)因子的影响;公共因子与特殊因子(唯一性)相互独立。验证性因子分析验证性因子分析克服了探索性因子分析假设条件约束太强的缺陷,其假设主要包括:公共因子之间可以相关,也可以无关;观测变量可以只受一个或几个公共因子的影响,而不必受所有公共因子的影响;特殊因子之间可以相关,还可以出现不存在误差因素的观测变量;公共因子与特殊因子之间相互独立 4、分析步骤不同、分析步骤不同 探索性因子分析主要有以下七个
6、步骤:收集观测变量:通常采用抽样的方法,按照实际情况收集观测变量数据。构造相关矩阵:根据相关矩阵可以确定是否适合进行因子分析。确定因子个数:可根据实际情况事先假定因子个数,也可以按照特征根大于1 的准则或碎石准则来确定因子个数。提取因子:可以根据需要选择合适的因子提取方法,如主成分方法、加权最小平方法、极大似然法等。因子旋转:由于初始因子综合性太强,难以找出实际意义,因此一般都需要对因子进行旋转(常用的旋转方法有正交旋转、斜交旋转等),以便于对因子结构进行合理解释。解释因子结构:可以根据实际情况及负载大小对因子进行具体解释。计算因子得分:可以利用公共因子来做进一步的研究,如聚类分析、评价等。验
7、证性因子分析主要有以下六个步骤:定义因子模型:包括选择因子个数和定义因子载荷。因子载荷可以事先定为0、或者其它自由变化的常数,或者在一定的约束条件下变化的数(比如与另一载荷相等)。收集观测值:根据研究目的收集观测值。获得相关系数矩阵:根据原始资料数据获得变量协方差阵。拟合模型:这里需要选择一种方法(如极大似然估计、渐进分布自由估计等)来估计自由变化的因子载荷。评价模型:当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的相关矩阵与实际观测矩阵之间的差异最小。常用的统计参数有:卡方拟合指数(2)、比较拟合指数(CFI)、拟合优度指数(GFI)和估计误差均方根(RMSEA)。根据Bentler(
8、1990)的建议标准,2 3.0、CFI 0.90、GFI 0.85、RMSE 0.05,则表明该模型的拟合程度是可接受的。修正模型:如果模型拟合效果不佳,应根据理论分析修正或重新限定约束关系,对模型进行修正,以得到最优模型。5、主要应用范围不同、主要应用范围不同 探索性因子分析:寻求基本结构,解决多元统计分析中的变量间强相关问题;数据化简。验证性因子分析允许研究者将观察变量依据理论或先前假设构成测量模式,然后评价此因子结构和该理论界定的样本资料间符合的程度。因此,主要应用于以下三个方面:验证量表的维度或面向性(dimensionality),或者称因子结构,决定最有效因子结构;验证因子的阶层
9、关系;评估量表的信度和效度。假设观测变量之间相关是因为他们共享公因子。很多观测变量少数因子代替浓缩探索性因子分析思路探索性因子分析思路 目的:化简数据 方式:研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(因子)表示基础数据结构 实质:研究如何以最少的信息丢失把众多观测变量浓缩为少数几个因子将每个观测变量用一组因子的线性组合表示:xi =ai1 f1+ai2 f2+aim fm+ui (i=1,2,k)(1)f1,f2,fm 叫做公因子公因子(Common factors),它们是各个观测变量所共有的因子,解释了变量之间的相关。(2)ui称为特殊因子特殊因子(U
10、nique factor),它是每个观测变量所特有的因子,相当于多元回归中的残差项,表示该变量不能被公因子所解释的部分。(3)aij 称为因子负载因子负载(Factor loadings),它是第i个变量在第j个公因子上的负载,相当于多元回归分析中的标准回归系数(i=1,k;j=1,m)。第二节第二节 (探索性)因子分析原理(探索性)因子分析原理一、模型一、模型 因子分析模型f1fmf2x1x2xkxku1u2 uka11a12a1ma21ak1ak2a22a2makm公因子个数小于等于观测变量数1、因子负载 (factor loading)反映了因子和变量之间的相关程度,当公因子之间完全不相
11、关时,等于变量和因子之间的相关系数。f1f2x10.95620.2012x20.87350.2896x30.17440.8972x40.56750.7586x50.85620.3315二、概念二、概念大多数情况下,人们往往假设公因子之间的关系是彼此正交的(orthogonal),即不相关因子负载不仅表示了观测变量如何由因子线性表示,而且反映了因子和变量间的相关程度Component Matrixa.620.522.661.529.702.369.663-4.05E-02.698-.177.679-.330.688-.399.700-.405f7_a 最近一个月是否有睡不着觉的情况f7_b 觉得
12、身心疲惫f7_c 觉得烦躁易怒f7_d 容易哭泣或想哭f7_e 对什么都不感兴趣f7_f 感到很孤独f7_g 觉得自己没有用f7_h 觉得活着没有意思12ComponentExtraction Method:Principal Component Analysis.2 components extracted.a.2、公因子方差(Communality)又称共同度、公共方差,指观测变量方差中由公因子决定的比例。当公因子之间彼此正交时,公因子方差等于和该变量有关的因子负载的平方和,用公式表示为:hi2 =ai12+ai22+aim2 (行平均和)f1f2hi2x10.95620.20120.95
13、48x20.87350.28960.8469x30.17440.89720.8354x40.56750.75860.8975x50.85620.33150.8430变量方差公因子方差特殊因子方差变量方差公因子方差特殊因子方差值越大,变量能被因子说明的值越大,变量能被因子说明的程度越高程度越高意义意义:说明如果用公因子替代:说明如果用公因子替代观测变量后,原来每个变量的观测变量后,原来每个变量的信息被保留的程度信息被保留的程度Communalities1.000.6571.000.7171.000.6281.000.4411.000.5181.000.5701.000.6321.000.654f
14、7_a 最近一个月是否有睡不着觉的情况f7_b 觉得身心疲惫f7_c 觉得烦躁易怒f7_d 容易哭泣或想哭f7_e 对什么都不感兴趣f7_f 感到很孤独f7_g 觉得自己没有用f7_h 觉得活着没有意思InitialExtractionExtraction Method:Principal Component Analysis.3、因子贡献(Contributions)反映每个公因子对数据的解释能力,用该因子所解释的总方差来衡量。f1f2hi2x10.95620.20120.9548x20.87350.28960.8469x30.17440.89720.8354x40.56750.75860.
15、8975x50.85620.33150.8430Vp2.751.64.35Vp%55%32%87%因子贡献:因因子贡献:因子负载列平方子负载列平方和和即:数据输出即:数据输出中的特征值中的特征值更常用指标:每个因子所解释的方差(因子贡献)占所有变量总更常用指标:每个因子所解释的方差(因子贡献)占所有变量总方差的比例方差的比例(即:因子贡献或特征值除以(即:因子贡献或特征值除以变量个数变量个数即总方即总方差,因为标准化变量的标准差和方差均为差,因为标准化变量的标准差和方差均为1)衡量公因子的相对重要性衡量公因子的相对重要性公因子公因子累积解累积解释方差释方差比例,比例,判断因判断因子分析子分析效
16、果效果Total Variance Explained3.66445.79845.7983.66445.79845.7981.15414.42960.2271.15414.42960.227.6958.69368.919.5917.38176.301.5566.95583.256.5026.26989.525.4275.33294.856.4115.144100.000Component12345678Total%of VarianceCumulative%Total%of VarianceCumulative%Initial EigenvaluesExtraction Sums of Squ
17、ared LoadingsExtraction Method:Principal Component Analysis.1、检查相关矩阵是否适合做因子分析(变量间应高度相关 0.3)2、提取因子3、因子旋转4、计算因子值三、因子分析的步骤三、因子分析的步骤变量:间距测度及以上。变量:间距测度及以上。样本规模:至少是变量数的样本规模:至少是变量数的5倍倍判断数据是否适合做 因子分析1、反映象相关矩阵 (Anti-image correlation matrix)。其元素等于负的偏相关系数。2、巴特利特球体检验(Bartlett test of sphericity)零假设为相关矩阵是单位阵单位阵
18、(说明变量间不相关)3、KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度。该测度从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,【0,1】。当所有变量之间的偏相关系数的平方和,远远小于简单相关系数的平方和时,KMO值接近1.0.9以上,非常好;0.6,差;0.8以上,好;0.5,很差;0.7,一般;0.5 以下,不能接受该矩阵中各项值应该比较小。该矩阵中各项值应该比较小。因为这说明变量间存在大量的因为这说明变量间存在大量的重叠影响(公因子)重叠影响(公因子)应该通过检验应该通过检验数数(纯纯)量矩阵(标量矩阵)量矩阵(标量
19、矩阵)100010001nII称为称为单位矩阵单位矩阵(或(或单位阵单位阵).有时也记作有时也记作E E.全为全为1矩阵矩阵称对角线元相等的对角称对角线元相等的对角为为数量矩阵数量矩阵或或标量阵标量阵。aaa000000000当当 时,记作时,记作1 aKMO and Bartletts Test.86046356.8028.000Kaiser-Meyer-Olkin Measure of SamplingAdequacy.Approx.Chi-SquaredfSig.Bartletts Test ofSphericityAnti-image Matrices.653-.233-.102-3.
20、530E-02-2.290E-02-2.51E-02-1.502E-02-2.165E-02-.233.588-.184-3.181E-02-3.275E-02-1.50E-02-2.699E-02-4.511E-03-.102-.184.600-.121-9.000E-02-2.05E-02-2.078E-02-2.049E-02-3.530E-02-3.181E-02-.121.695-8.984E-02-.103-2.090E-02-8.106E-02-2.290E-02-3.275E-02-9.000E-02-8.984E-02.652-.131-8.364E-02-7.416E-02
展开阅读全文