第8章-因子分析与聚类分析(含SPSS)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第8章-因子分析与聚类分析(含SPSS)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 聚类分析 SPSS 课件
- 资源描述:
-
1、第八章第八章 因子分析与聚类分析因子分析与聚类分析本章内容本章内容v第一节第一节 因子分析因子分析v第二节第二节 聚类分析聚类分析第一节第一节 因子分析因子分析v一、因子分析的概念和特点一、因子分析的概念和特点v(一)因子分析的概念(一)因子分析的概念v 因子分析(因子分析(factor analysis)是利用降维的思)是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。几个综合因子的一种多变量统计分析方法。v 在会计实证研究
2、中,因子分析发挥着重要的在会计实证研究中,因子分析发挥着重要的作用,如变量构造、变量筛选和综合评价等。作用,如变量构造、变量筛选和综合评价等。v(二)因子分析的特点(二)因子分析的特点v 1、因子变量的数量远少于原有指标变量的、因子变量的数量远少于原有指标变量的数量。数量。v 2、因子变量并不是原有变量的简单取舍,、因子变量并不是原有变量的简单取舍,而是对原有变量的重新组构。而是对原有变量的重新组构。v 3、因子之间线性关系不显著。、因子之间线性关系不显著。v 4、因子变量具有命名解释性。、因子变量具有命名解释性。v二、因子分析的数学模型和相关概念二、因子分析的数学模型和相关概念v(一)因子分
3、析的数学模型(一)因子分析的数学模型v 因子分析的数学模型为:因子分析的数学模型为:v (8.1)v 写成矩阵形式为写成矩阵形式为 ,其中,其中 为原始变量向量,为原始变量向量,为公因子载荷矩阵,为公因子载荷矩阵,为公共因子,为公共因子,为特殊因子。为特殊因子。pkpkppppkkkkkkfafafafaxfafafafaxfafafafaxfafafafax332211333332321313223232221212113132121111 AFXXFAv(二)因子分析中的基本概念(二)因子分析中的基本概念v1、因子的含义、因子的含义v 因子分析法中提到两种因子:公共因子和特殊因子。因子分析
4、法中提到两种因子:公共因子和特殊因子。v 公共因子是每个原有变量的线性表达式中都共同出现的因公共因子是每个原有变量的线性表达式中都共同出现的因子,各公因子都是均值为子,各公因子都是均值为0,方差为,方差为1的独立正态随机变量。的独立正态随机变量。其协方差矩阵为单位矩阵。其协方差矩阵为单位矩阵。v 特殊因子表示原有变量不能被公共因子解释的部分,其均特殊因子表示原有变量不能被公共因子解释的部分,其均值为值为0。v 各特殊因子之间以及特殊因子与所有公共因子之间都是互各特殊因子之间以及特殊因子与所有公共因子之间都是互相独立的。相独立的。v2、因子载荷、因子载荷 v 模型中各公共因子的系数模型中各公共因
5、子的系数 称为因子载荷,反映了第称为因子载荷,反映了第 个变量在第个变量在第 个公共因子上的相对重要性,个公共因子上的相对重要性,的绝的绝对值越大,表明对值越大,表明 与与 的相依程度越大。的相依程度越大。ijaij1ijaijaixjFv3、变量共同度、变量共同度 v 因子载荷矩阵中第因子载荷矩阵中第 行元素的平方和,称为变量行元素的平方和,称为变量 的共的共同度,即变量方差。此值越接近同度,即变量方差。此值越接近1,表明该变量的几乎全部,表明该变量的几乎全部原始信息都被所选择的公共因子说明了。此值接近于原始信息都被所选择的公共因子说明了。此值接近于0,说,说明公共因子对明公共因子对 的影响
6、很小,主要由特殊因子来描述。的影响很小,主要由特殊因子来描述。v4、因子的方差贡献、因子的方差贡献 v 因子因子 的方差贡献是因子载荷矩阵的方差贡献是因子载荷矩阵 中第中第 列元素的平列元素的平方和,反映了因子方和,反映了因子 对原有变量总方差的解释能力,是衡量对原有变量总方差的解释能力,是衡量公共因子相对重要性的指标。此值越大,表明相应因子的重公共因子相对重要性的指标。此值越大,表明相应因子的重要性越高。计算出所有的指标,按其大小排序,就可以提炼要性越高。计算出所有的指标,按其大小排序,就可以提炼出最有影响的公共因子。出最有影响的公共因子。iixixjfAjjfv三、因子分析的步骤三、因子分
7、析的步骤v(一)因子分析的适合性检验(一)因子分析的适合性检验v 1、相关矩阵和反映像相关矩阵、相关矩阵和反映像相关矩阵v 相关矩阵中大部分相关系数都小于相关矩阵中大部分相关系数都小于0.3,那么原则上这些,那么原则上这些数据不适合做因子分析。另外,如果反映像相关矩阵中除数据不适合做因子分析。另外,如果反映像相关矩阵中除对角元素外,其他大多数元素的绝对值均较小,对角线上对角元素外,其他大多数元素的绝对值均较小,对角线上元素的值较接近元素的值较接近1,则适合进行因子分析。,则适合进行因子分析。v2、检验检验v 检验统计量是用于比较变量间简单相关系数和偏检验统计量是用于比较变量间简单相关系数和偏相
8、关系数的指标,取值在相关系数的指标,取值在0和和1之间。值越接近于之间。值越接近于1,意味,意味着变量间的相关性越强,原有变量越适合做因子分析。着变量间的相关性越强,原有变量越适合做因子分析。KMOKMOv 3、巴特利特球度检验(巴特利特球度检验(Bartlett test of sphericity)v 巴特利特球度检验以原有变量的相关系数矩阵为巴特利特球度检验以原有变量的相关系数矩阵为出发点,其出发点,其零假设是:相关矩阵为单位阵,即相关零假设是:相关矩阵为单位阵,即相关系数矩阵为对角矩阵系数矩阵为对角矩阵。巴特利特球度检验的检验统。巴特利特球度检验的检验统计量是根据相关系数矩阵的行列式计
9、算得到,且近计量是根据相关系数矩阵的行列式计算得到,且近似服从卡方分布。如果该统计量的观察值比较大且似服从卡方分布。如果该统计量的观察值比较大且相伴概率相伴概率 值小于或等于给定的显著性水平,则应值小于或等于给定的显著性水平,则应拒绝原假设;反之,如果该统计量的观察值比较小拒绝原假设;反之,如果该统计量的观察值比较小且相伴概率值大于给定的显著性水平,则不应拒绝且相伴概率值大于给定的显著性水平,则不应拒绝原假设。原假设。v(二)因子提取和因子载荷矩阵的求解(二)因子提取和因子载荷矩阵的求解v 因子分析的关键是根据样本数据求解因子载荷矩阵,因子分析的关键是根据样本数据求解因子载荷矩阵,SPSS提供
10、了提供了7种提取因子的方法,其中占主要地位且使用种提取因子的方法,其中占主要地位且使用最为广泛的是主成分分析法。最为广泛的是主成分分析法。v 因子提取通常有以下三种方法:(因子提取通常有以下三种方法:(1)特征值准则,即取)特征值准则,即取特征值大于等于特征值大于等于1的主成分作为初始因子,放弃特征值小于的主成分作为初始因子,放弃特征值小于1的主成分。(的主成分。(2)累积方差贡献率,因子累积解释的方差)累积方差贡献率,因子累积解释的方差比例也是确定因子个数时可以参考的指标,一般应达到比例也是确定因子个数时可以参考的指标,一般应达到70%-85%或以上。(或以上。(3)碎石检验准则,按照因子被
11、提取)碎石检验准则,按照因子被提取的顺序,画出因子的特征值随因子个数变化的散点图,图的顺序,画出因子的特征值随因子个数变化的散点图,图形由陡变平,曲线开始变平的前一个点被认为是提取的最形由陡变平,曲线开始变平的前一个点被认为是提取的最大因子数。大因子数。v(三)因子命名(三)因子命名v 在因子分析模型中,公共因子与因子载荷阵的解不是唯在因子分析模型中,公共因子与因子载荷阵的解不是唯一的。因子分析的目的不仅是找出主因子,更重要的是知道一的。因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以利于对公共因子命名和解释结果,便每个主因子的意义,以利于对公共因子命名和解释结果,便于进一步
12、的分析。若每个公共因子的涵义不清,难以找到合于进一步的分析。若每个公共因子的涵义不清,难以找到合理的解释,可对因子载荷矩阵实行旋转,使每个变量仅在一理的解释,可对因子载荷矩阵实行旋转,使每个变量仅在一个公共因子上有较大的载荷,而在其他公共因子上的载荷较个公共因子上有较大的载荷,而在其他公共因子上的载荷较小。小。v SPSS中有中有5种因子旋转的方式可供选择:种因子旋转的方式可供选择:Varimax选项,选项,方差最大旋转;方差最大旋转;Direct Oblimin 选项,直接斜交旋转;选项,直接斜交旋转;Quartimax 选项,四次最大正交旋转;选项,四次最大正交旋转;Equamax 选项,
13、平选项,平均正交旋转;均正交旋转;Promax 选项,斜交旋转方法。选项,斜交旋转方法。v(四)计算因子得分,然后将它们用于各种进一步的分析中(四)计算因子得分,然后将它们用于各种进一步的分析中v 当因子确定以后,便可以计算各因子在每个样本上的具当因子确定以后,便可以计算各因子在每个样本上的具体数值,这些数值称为因子得分,形成的变量称为因子变量。体数值,这些数值称为因子得分,形成的变量称为因子变量。于是在以后的分析中就可以因子变量代替原有变量进行数据于是在以后的分析中就可以因子变量代替原有变量进行数据建模,或者利用因子变量对样本进行分类或评价等研究,进建模,或者利用因子变量对样本进行分类或评价
14、等研究,进而实现降维和简化问题的目标。而实现降维和简化问题的目标。v 由于因子得分函数中方程的个数小于变量的个数,因此由于因子得分函数中方程的个数小于变量的个数,因此不能精确的计算出因子得分,只能对因子得分进行估计。估不能精确的计算出因子得分,只能对因子得分进行估计。估计的方法很多,计的方法很多,SPSS中列示了三种方法,常用的是中列示了三种方法,常用的是Regression回归法。回归法。v 用因子得分还可以计算因子总分,根据因子总分可对样用因子得分还可以计算因子总分,根据因子总分可对样本(变量)进行排序或归类,作为评价的依据。本(变量)进行排序或归类,作为评价的依据。v四、因子分析在四、因
15、子分析在SPSS中的实现中的实现 v1、建立或打开数据文件后,进入AnalyzeData ReductionFactor Analysis主对话框,如图8-1所示。v图图8-1 因子分析主对话框因子分析主对话框v 2、把参与分析的变量选到、把参与分析的变量选到Variables框中。框中。v 3、Selection Variable选择变量栏,用于限制有特殊值选择变量栏,用于限制有特殊值的样本子集的分析,当一个变量进入该栏时,激活右侧的的样本子集的分析,当一个变量进入该栏时,激活右侧的“Value”按钮。待按钮。待“Value”按钮激活后,单击该键,打开按钮激活后,单击该键,打开Set Val
16、ue对话框,如图对话框,如图8-2 所示,可在该对话框键入标识所示,可在该对话框键入标识参与分析的观测量所具有的该变量值。参与分析的观测量所具有的该变量值。v图图8-2 Set Value 对话框对话框v 4、单击、单击“Descriptivs”按钮,展开按钮,展开Descriptives对话框,对话框,如图如图8-3所示,可以选择单变量的描述统计量和初始分析结所示,可以选择单变量的描述统计量和初始分析结果。果。v图图8-3 Descriptives 对话框对话框v(1)Statistics 统计量框统计量框v Univariate descriptive复选项,单变量描述统计量。复选项,单变
17、量描述统计量。v Initial solution复选项,初始分析结果。复选项,初始分析结果。v(2)Correlation Matrix相关矩阵框相关矩阵框v Coefficients 复选项,显示相关系数。复选项,显示相关系数。v Significance levels 复选项,显示相关系数的显著性复选项,显示相关系数的显著性水平。水平。v Determinant 复选项,显示相关系数矩阵的行列式。复选项,显示相关系数矩阵的行列式。v Inverse 复选项,显示相关系数矩阵的逆矩阵。复选项,显示相关系数矩阵的逆矩阵。v Reproduced 选项,显示再生相关阵。选项,显示再生相关阵。v
18、 Anti-image 复选项,选择此项给出反映象相关矩阵。复选项,选择此项给出反映象相关矩阵。v and Bartletts test of Sphericity 复选项,要求复选项,要求进行进行 检验和球形检验和球形Bartlett 检验。检验。KMOKMOv 5、单击、单击“Extraction”按钮,进入按钮,进入Extraction对话框,对话框,如图如图8-4 所示,可以选择不同的提取公因子的方法和控制所示,可以选择不同的提取公因子的方法和控制提取结果的判据。提取结果的判据。v图图8-4 Extraction 对话框对话框v(1)Method框,因子提取方法选择项框,因子提取方法选
19、择项v Principal components 选项,主成份法。选项,主成份法。v Unweighted least Square 选项,不加权最选项,不加权最小平方法。小平方法。v Generalized least squares 选项,用变量选项,用变量值的倒数加权。值的倒数加权。v Maximum Likelihoud 选项,最大似然法。选项,最大似然法。v Principal Axis factoring 选项,使用多元选项,使用多元相关的平方作为对公因子方差的初始估计。相关的平方作为对公因子方差的初始估计。v Alpha factoring 选项,因子提取法。选项,因子提取法。v
20、 Image factoring 选项,映象因子提取法。选项,映象因子提取法。v(2)Analyze 框,指定分析矩阵的选择项。框,指定分析矩阵的选择项。v Correlation Matrix 选项,指定以分析变量的选项,指定以分析变量的相关矩阵为提取因子的依据。相关矩阵为提取因子的依据。v Covariance matrix 选项,指定以分析变量的选项,指定以分析变量的协方差矩阵为提取因子的依据。协方差矩阵为提取因子的依据。v(3)Display 框,指定与因子提取有关的输出项。框,指定与因子提取有关的输出项。v Unrotated factor solution 复选项,要求显复选项,要
21、求显示未经旋转的因子提取结果。示未经旋转的因子提取结果。v Scree plot 复选项,要求显示按特征值大小复选项,要求显示按特征值大小排列的因子序号,以特征值为两个坐标轴的碎石图。排列的因子序号,以特征值为两个坐标轴的碎石图。v(4)Extract 框,控制提取进程和提取结果的选择框,控制提取进程和提取结果的选择项。项。v Eigenvalues over 选项,指定提取的因子应选项,指定提取的因子应该具有的特征值范围,在此项后面的矩形框中给出。该具有的特征值范围,在此项后面的矩形框中给出。v Number of factors 选项,指定提取公因子选项,指定提取公因子的数目。的数目。v(
22、5)Maximum iterations for Convergence 参数参数框,指定因子分析收敛的最大迭代次数。框,指定因子分析收敛的最大迭代次数。v 6、单击、单击“Rotation”按钮,展开按钮,展开Rotation对话框,如图对话框,如图8-5所示,可以选择因子旋转方法。所示,可以选择因子旋转方法。v图图8-5 Rotation 对话框对话框v (1)Method 框,选择旋转方法。其中,框,选择旋转方法。其中,None 表表示不进行旋转,示不进行旋转,Varimax为方差最大旋转法,为方差最大旋转法,Direct Oblilmin为直接斜交旋转法,为直接斜交旋转法,Quartm
23、ax为四次最大为四次最大正交旋转法,正交旋转法,Equamax为平均正交旋转法,为平均正交旋转法,Promax为斜交旋转法。为斜交旋转法。v (2)Display 框,选择有关输出的选项。其中:框,选择有关输出的选项。其中:Rotated solution 选项,显示旋转结果;选项,显示旋转结果;Loading plot(s)选项,显示因子载荷散点图。选项,显示因子载荷散点图。v (3)Maximum iterations for Convergence 参参数框,指定旋转收敛的最大迭代次数。数框,指定旋转收敛的最大迭代次数。v 7、单击、单击“Scores”按钮,进入按钮,进入Factor
24、Scores对话框,对话框,如图如图8-6所示,可以要求计算因子得分,选择显示或作为新所示,可以要求计算因子得分,选择显示或作为新变量保存。变量保存。v图图8-6 Factor Scores 对话框对话框v (1)Save as variables 复选项,将因子得分作复选项,将因子得分作为新变量保存在数据文件中。为新变量保存在数据文件中。v (2)Method 栏,指定计算因子得分的方法。栏,指定计算因子得分的方法。其中,其中,Regression 选项为回归法,选项为回归法,Bartlett 选项为选项为巴特利特法,巴特利特法,Anderson-Rubin 选项是为了保证因选项是为了保证因
25、子的正交性而对子的正交性而对Bartlett 因子得分的调整。因子得分的调整。v (3)Display factor score coefficient matrix 复选项,选择此项将在输出窗中显示因子得分系数复选项,选择此项将在输出窗中显示因子得分系数矩阵,是标准化的得分系数。原始变量值进行标准矩阵,是标准化的得分系数。原始变量值进行标准化后,可以根据该矩阵给出的系数计算各观测量的化后,可以根据该矩阵给出的系数计算各观测量的因子得分,还显示协方差矩阵。因子得分,还显示协方差矩阵。v 8、单击、单击“Options”按钮,进入按钮,进入Options对话框,可以进对话框,可以进一步选择各种输
展开阅读全文