多元统计分析因子分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元统计分析因子分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 因子分析 课件
- 资源描述:
-
1、1第四章 因子分析2第一节 因子分析的根本思想3因子分析的根本思想因子分析的根本思想n因子分析是根据相关矩阵内部的依赖关系,把一些具有错综复杂关系的变量综合为数量较少的几个因子。通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。n简单地说,就是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个根本构造,这个根本构造称为因子。4例如n某机关对其职员就以下6个方面进展考核,这6个方面是职员的词汇、阅读、写作能力,以及数字、代数、微积分的运算能力。而这6个方面可归结为职员的语文能力和数学能力两个方面。5例如n某公司与48名申请工作的人进展面谈
2、,然后就申请人十五个方面进展打分,这十五个方面分别是:申请书的形式、外貌、学术能力、讨人喜欢的能力、自信心、洞察力、老实、推销能力、经历、工作积极性、抱负、理解能力、潜力、入围公司的强烈程度、适应性。这15个方面可归结为应聘者的外露能力、讨人喜欢的能力、经历、专业能力这4个方面。6因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的根本构造,并用少数几个假想变量来表示其根本的数据构造。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。例如,在企业形象或品牌形象的
3、研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。7但消费者主要关心的是三个方面,即商店的环境、商店的效劳和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店效劳水平和商品价格的三个潜在的因子,对商店进展综合评价。而这三个公共因子可以表示为:iiiiiFFFX33221124,1i 称 是不可观测的潜在因子潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子特殊因子。321FFF、i8注意:注意:n因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义。n主成分分
4、析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。n主成分分析:原始变量的线性组合表示新的综合变量,即主成分。n因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。9第二节第二节 因子分析模型因子分析模型 一、数学模型一、数学模型)(2211pmFaFaFaXimimiii 设 个变量,如果表示为iX),2,1(pippmpmppmmpFFFaaaaaaaaaXXX212121222211121121 AFX10 称为 公共因子,是不可观测的变量,他们的系数称为因子载荷。是特殊因子,是不能被前m个公共因子包含的部分。并且满足:mFFF,21icov(,)
5、0,F,F即不相关;1 11212 122212()()()()()()cov()()()()()ppppppE FE FE FE FE FE FEE FE FE FF,F011IFD111)(mFFF,21即 互不相关,方差为1。1222221)(pD即互不相关,方差不一定相等,。),0(2iiN13用矩阵的表达方式 AFXIFDFE)(,0)(1)(),()(,0)()2(22221pdiagDE0),cov()3(F14 1 1、因子载荷、因子载荷 aij 的统计意义的统计意义 因子载荷因子载荷 是第是第i i个变量与第个变量与第j j个公共因子的相关系数个公共因子的相关系数 ija模型
6、为模型为 imimiiFaFaX11),cov(),cov(1jikmkikjiFFaFXijFxaji 载荷矩阵中第i行,第j列的元素反映了第i个变量与第j个公共因子的相关性。绝对值越大,相关的密切程度越高。),cov(),cov(1jijkmkikFFFaija 根据公共因子的模型性质,有根据公共因子的模型性质,有 三、三、因子载荷矩阵中的几个统计特征因子载荷矩阵中的几个统计特征15n 因子载荷不是惟一的 AFX*cov()()EF,F 0且满足因子模型的条件*FA)(FTATFTF*设T为一个pp 的正交矩阵,令A*=AT,则模型可以表示为0)()()(*FETFTEFEITFDTFTD
7、FD)()()(*),()(,0)(22221pdiagDE162 2、变量共同度的统计意义、变量共同度的统计意义统计意义统计意义:imimiiFaFaX11两边求方差两边求方差)()()()(2121imimiiVarFVaraFVaraXVarmjiija1221 所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量 的贡献为的贡献为1 1。如果。如果 非常非常靠近靠近1 1,非常小,则因子分析的效果好,从原变量空间到公共因非常小,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好。子空间的转化性质好。iXmjija122imjija12定义:变量定义:变量 的共同度是因子
8、载荷矩阵的第的共同度是因子载荷矩阵的第i i行的元行的元素的平方和。记为素的平方和。记为iX。mjijiah12217 3 3、公共因子、公共因子 方差贡献的统计意义方差贡献的统计意义jF因子载荷矩阵中各列元素的平方和 称为所有的 对 的方差贡献和。衡量的相对重要性。piijjag122),1(mjjFiXjF18第三节第三节 因子载荷矩阵的估计方法因子载荷矩阵的估计方法 设随机向量 的均值为,协方差为,为的特征根,为对应的标准化特征向量,那么pxxx,21x021pp21u,u,ul 主成分分析法主成分分析法UUp2119 上式给出的表达式是准确的,然而,它实际上是毫无价值的,因为我们的目的
9、是寻求用少数几个公共因子解释,故略去后面的p-m项的奉献,有21111mmmmmmp1122ppu uu uu uuuu up2uuuuuuppp21122111100p212ppuuuuuu20 12 mmm1122AA+Du uu uu uD1121122 mmp mpmm p2uuuuuDAADu 上式有一个假定,模型中的特殊因子是不重要的,因而从 的分解中忽略了特殊因子的方差。22212(,)pdiagD其中221miiiijjsa21 AFX)()()(DAFADXD),(22221pdiagAA22 例例 假定某地固定资产投资率假定某地固定资产投资率 ,通货膨胀率,通货膨胀率 ,失
10、业,失业率率 ,相关系数矩阵为,相关系数矩阵为试用主成分分析法求因子分析模型。试用主成分分析法求因子分析模型。1x2x3x15/25/15/215/15/15/1123 特征根为:55.11 85.02 6.03 6.0707.085.0331.055.1629.06.0707.085.0331.055.1629.0085.0883.055.1475.0A707.0331.0629.0707.0331.0629.00883.0475.0U548.0305.0783.0548.0305.0783.00814.0569.024 可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,对X的
11、奉献率为51.67%。第二公因子F2为投资因子,对X的奉献为28.33%。共同度分别为1,0.706,0.706。211814.0569.0FFx3212548.0305.0783.0FFFx3213548.0305.0783.0FFFx25第四节第四节 因子旋转正交变换因子旋转正交变换 因子分析的数学目的不仅仅要找出公共因子以及对变量进展分组,更重要的要知道每个公共因子的含义,以便进展进一步的分析。如果每个公共因子的含义不清,那么不便于进展实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进展旋转。目的是使因子载荷阵的构造简化,使载荷矩阵每列或行的元素平方值向0和1两极分化。主要
12、的正交旋转法有方差最大法和四次方最大法。一为什么要旋转因子一为什么要旋转因子26 百米跑成绩 跳远成绩 铅球成绩 跳高成绩 400米跑成绩 百米跨栏 铁饼成绩 撑杆跳远成绩 标枪成绩 1500米跑成绩 1X2X3X4X5X6X7X8X9X10X奥运会十项全能运开工程奥运会十项全能运开工程得分数据的因子分析得分数据的因子分析 27 因子载荷矩阵可以看出,除第一因子中所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。似乎是跑和投掷的能力比照,似乎是长跑耐力和短跑速度的比照。于是考虑旋转因子,得下表 28变量F1F2F3F4共同度X1X2X3X4X5X6X7X8
13、X9X100.8840.6310.2450.2390.7970.4040.186-0.036-0.0480.0450.1360.1940.8250.1500.0750.1530.8140.1760.735-0.0410.1560.5150.2230.7500.1020.6350.1470.7620.1100.112-0.113-0.006-0.1480.0760.468-0.17-0.0790.2170.1410.9340.840.700.810.650.870.620.720.660.570.8929 通过旋转,因子有了较为明确的含义。通过旋转,因子有了较为明确的含义。百米跑,百米跑,跳远和
14、跳远和 400米跑,需要爆发力的项目在米跑,需要爆发力的项目在 有较大的有较大的载荷,载荷,可以称为短跑速度因子;可以称为短跑速度因子;铅球,铅球,铁饼和铁饼和 标枪在标枪在 上有较大的载荷,可以上有较大的载荷,可以称为爆发性臂力因子;称为爆发性臂力因子;百米跨栏,百米跨栏,撑杆跳远,撑杆跳远,跳远和为跳远和为 跳高在跳高在 上上有较大的载荷,有较大的载荷,爆发腿力因子;爆发腿力因子;为长跑耐力因子。为长跑耐力因子。2X5X1F1F3X7X9X2F6X8X2X4X3F3F4F1X30二旋转方法二旋转方法 1、方差最大法方差最大法2、四次方最大旋转四次方最大旋转31 1、方差最大法 方差最大法从
15、简化因子载荷矩阵的每一列出发,使和每个因子有关的载荷值平方的方差最大。当只有少数几个变量在某个因子上有较高的载荷值时,对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后,使每个因子上的载荷值尽量拉开距离,一局部的载荷趋于1,另一局部趋于0。2122211211ppaaaaaaAppppFaFaXFaFaXFaFaX2211222212121212111132cossinsincosT设旋转矩阵为:cossinsincosAATB则cossinsincoscossinsincos112112111211ppppaaaaaaaa211211ppbbbb332221212211ppbbbb
16、21221222212112211111piipiipiipiibpbpbpbpVmax根据求极值的原理,使根据求极值的原理,使 0V,由此可求出因子轴旋转角度,由此可求出因子轴旋转角度34当公共因子个数m2时,可以将上述m=2的方法用于21mm逐次对每两个公共因子进展旋转。每旋转一次,V值就会增大,即V是单调不减的,并且V是有界的,因为因子载荷的绝对值不大于1。因此,经过假设干次旋转后,V变化相对就不大了,即可停顿旋转。对两因子的旋转,35 2 2、四次方最大旋转、四次方最大旋转 四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初
17、始因子,使每个变量只在一个因子上有较高的载荷,而在其它的因子上尽可能低的载个变量只在一个因子上有较高的载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差到达四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差到达最大。最大。36max)(21122pimjiijmhbQ简化准则为:pimjiijiijpimjiijmhbmhbmhbQ112422421122)2()(pimjpimjiijpimjiijmhb
展开阅读全文