信息分析方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《信息分析方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 分析 方法 课件
- 资源描述:
-
1、好裁缝做上衣,要测量上体长、手臂长、胸围等14个指标。这14个指标是相关的,可以找出几个反映上衣特征的综合指标,加工出的上衣大多数人都能穿,当然特体除外。这两个不相关的指标就是上衣的型和号。而他们所采用的方法就是因子分析方法。2022-8-1014.3 因子分析将相关性较强的几个变量归在同一个类中,每一类赋予新的名称,成为一个因子,反映事物的一个方面,或者说一个维度。更可进一步推出因子的值,然后用这些因子代替原来变量进行其他统计分析。设有n个样本,每个样本观测p个变量。为了对变量进行比较,并消除由于观测量纲的差异及数量级所造成的影响,将样本观测数据进行标准化处理。使标准化后的变量的均值为0,方
2、差为1。2022-8-102X=(x1,x2,xp)T,是可观测的随机向量,且向量均值E(X)0,协方差阵cov(X),且协方差阵与相关矩阵R相等;F(F1,F2,Fm)T,mp,是不可测的向量,其向量均值E(F)0,协方差矩阵cov(F)I,即向量F的各分量是相互独立的;=(1,2,p)T与F相互独立,且E()0,协方差阵是对角阵,说明各分量之间也是相互独立的。则下列模型被称为因子模型:x1=a11F1+a12F2+a1mFm+1x2=a21F1+a22F2+a2mFm+2xp=ap1F1+ap2F2+apmFm+p2022-8-103F1,F2,Fm,被称作公共因子(也称主因子),在各个原
3、观测变量的表达式中都出现,是相互独立的不可观测的理论变量。1,2,p,被称作特殊因子,是向量X的分量Xi(i1,2,n)所特有的因子。aij称作因子载荷,aij的绝对值越大,表明Xi与Fj的相依程度越大。2022-8-104 巴特利特球体检验 KMO测度主成分分析法是一种值得推荐的方法,同时也是应用比较广泛的一类方法。除了经验判断外,特征值法是选用较多的判断方法;因子碎石图(scree plot)提供了因子数目和特征值大小的图形表示。2022-8-105因子旋转目的是使某些变量在某个因子上负载高,而在其它因子上的负载则显著的低。通过在因子上具有较高负载变量的意义进行模型是否适合,其判断常基于残
4、差矩阵。2022-8-106由于我国地区经济发展的不平衡,使各地区人口素质水平存在一定差异,尤其在西部地区。为了从宏观上把握西部地区的人口素质水平,使用因子分析法进行定量分析。考虑到各指标数据的差异以及使得分析结果更加有效,首先将样本数据进行标准化处理,处理后的数据消除了量纲之间的差异。保存在文件“西部地区人口素质.sav”中。2022-8-107抚养比 X1文盲率 X2人均受教育年 X3妇女平均存活子女数 X4平均预期寿命 X5高等学校数 X6高等学校毕业生人数 X7专利申请受理量 X8专利申请授权量 X9教育经费 X10AnalyzeData reductionFactor2022-8-1
5、082022-8-109 输出各个分析变量的初始共同度,特征值以及解释方差的百分比2022-8-10102022-8-10112022-8-1012KMO测度值大于0.5巴特利特球体检验值查表也可以通过2022-8-1013因子载荷矩阵旋转后的因子载荷矩阵2022-8-1014 Component 123抚养比(%)-.489.419.676文盲率(%)-.724.595-.277人均受教育年数(年).624-.714.243妇女平均存活子女数-.410-.147.848平均预期寿命(岁).782-.436-.115高等学校数(所).886.284.316高等学校毕业生人数.909.292.1
6、36专利申请受理量(件).921.307-.060专利申请授权量(件).920.326-.069教育经费(万元).916.287.143 Component 123抚养比(%)-.042-.423.832文盲率(%)-.323-.923.014人均受教育年数(年).170.964-.030妇女平均存活子女数-.251.130.910平均预期寿命(岁).381.721-.387高等学校数(所).940.279.069高等学校毕业生人数.927.239-.108专利申请受理量(件).908.185-.296专利申请授权量(件).915.165-.303教育经费(万元).932.249-.10420
7、22-8-1015因子F1F2F3被解释指标X6,X7,X8,X9,X10X2,X3,X5X1,X4因子命名科教因子人力因子负担因子2022-8-1016地区名称因子得分总因子得分排名F1F2F3内蒙古1.54251.592-0.22831.277广西2.51491.82320.3142.03774重庆2.78151.8454-0.56612.0773四川5.02312.1943-0.75173.58441贵州1.24270.53361.47061.14848云南1.770.48740.97061.40695西藏-0.3788-1.19210.6715-0.361412陕西3.3431.778
8、90.28242.56862甘肃1.22360.74830.66031.04669青海0.02840.11591.09480.214111宁夏0.43011.01331.0790.640610新疆1.53541.41440.48581.346262022-8-1017地区名称人口综合素质的排名按F1排名按F2排名按F3排名内蒙古76510广西4438重庆33211四川11112贵州8891云南55104西藏1212125陕西2249甘肃9986青海1111112宁夏101073新疆6767例如,人口学中研究人口生育分类模式、人口死亡分类模式;营销学中进行市场细分、竞争对手确定等等,都需要对研究
9、对象进行分类。随着多元统计技术的发展,对事物的分类在定量研究方面取得了极大的进步。是多元分析与当代分类学结合的产物,又称为群分析、点群分析或簇类分析。2022-8-10184.4 聚类分析npnnppxxxxxxxxx212222111211p21n21,对象对象对象指标:比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。聚类分析不必事先知道分类对象的结构,从一批样品的多个观测指标中,找出能度量样品之间或指标(变量)之间相似程度或亲疏关系的统计量,构成一个对称相似性矩阵,并按相似程度的大小,把样品或变量逐一归类。2022-8-1019为了消除不同变量的单位对聚类结果的影
10、响,应当首先对所有的数据标准化。可以通过SPSS软件中Analyze菜单下的Classify选择Hierachical Cluster Analysis,打开Hierachical Cluster Analysis对话框,并点击Method按钮,然后在其中的transform values部分来完成数据标准化的转换。将个案看成多维空间的一个点,引用多维空间中点的距离概念,定义不相似测度。距离越小,表示两者之间的关系越紧密,相似特征越多,就越有可能分在同一类;相反,距离越大,表示两者之间差异性越大。通过计算对象之间的两两“距离”,得到“相似关系”矩阵。在具体的计算中,“距离”有多种表达。2022
展开阅读全文