第七章对应分析.课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第七章对应分析.课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 对应 分析 课件
- 资源描述:
-
1、2022-5-311 7.1列联表及列联表分析 7.2 对应分析的基本理论 7.3对应分析的步骤及逻辑框图 7.4对应分析的上机实现 第第 七七 章章 对应分析对应分析 2022-5-312 目录 上页 下页 返回 结束 第第 七七 章章 对应分析对应分析 对应分析是R型因子分析与Q型因子分析的结合,它也是利用降维的思想以达到简化数据结构的目的,不过,与因子分析不同的是,它同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。对应分析的思想首先由(Richardson)和(Kuder)在1933年提出,后来法国统计学家(Jean-Paul Benzcri)和日本统计学家林
2、知己夫(Chikio Hayashi)对该方法进行了详细的论述而使其得到了发展。 对应分析方法广泛用于对由属性变量构成的列联表数据的研究,利用对应分析可以在一张二维图上同时画出属性变量不同取值的情况,列联表的每一行及每一列均以二维图上的一个点来表示,以直观、简洁的形式描述属性变量各种状态之间的相互关系及不同属性变量之间的相互关系。 2022-5-313 目录 上页 下页 返回 结束 7.17.1列联表及列联表分析列联表及列联表分析在讨论对应分析之前,我们先简要回顾一下列联表及列联表分析的有关内容。在实际研究工作中,人们常常用列联表的形式来描述属性变量(定类尺度或定序尺度)的各种状态或是相关关系
3、,这在某些调查研究项目中运用得尤为普遍。比如,公司的管理者为了了解消费者对自己产品的满意情况,需要针对不同职业的消费者进行调查,而调查数据很自然的就以列联表的形式提交出来。见表7-1所示。 2022-5-314 目录 上页 下页 返回 结束 7.1列联表及列联表分析以上是两变量列联表的一般形式,横栏与纵栏交叉位置的数字是相应的频数。这样表露数据就可以清楚地看到不同职业的人对该公司产品的评价,以及所有被调查者对该公司产品的整体评价、被调查者的职业构成情况等信息;通过这张列联表,还可以看出职业分布与各种评价之间的相关关系,如管理者与比较满意交叉单元格的数字相对较大(“相对”指应抵消不同职业在总的被
4、调查对象中的比例的影响),则说明职业栏的管理者这一部分与评价栏的比较满意这一部分有较强的相关性。由此可以看到,借助列联表,人们可以得到很多有价值的信息。2022-5-315 目录 上页 下页 返回 结束 7.1列联表及列联表分析在研究经济问题的时候,研究者也往往用列联表的形式把数据呈现出来。比如说横栏是不同规模的企业,纵栏是不同水平的获利能力,通过这样的形式,可以研究企业规模与获利能力之间的关系。更为一般的,可以对企业进行更广泛的分类,如按上市与非上市分类,按企业所属的行业分类,按不同所有制关系分类等。同时用列联表的格式来研究企业的各种指标,如企业的盈利能力、企业的偿债能力、企业的发展能力等。
5、这些指标即可以是简单的,也可以是综合的,甚至可以是用因子分析或主成分分析提取的公因子;把这些指标按一定的取值范围进行分类,就可以很方便地用列联表来研究。 2022-5-316 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-317 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-318 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-319 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-3110 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-3111 目录 上页 下页 返回 结束 7.1列联
6、表及列联表分析2022-5-3112 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-3113 目录 上页 下页 返回 结束 7.1列联表及列联表分析2022-5-3114 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3115 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 假定我们下面讨论的都是形如表7-3的规格化的列联表数据。为了论述方便,先对有关概念进行说明。 2022-5-3116 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 7.2.1 有关概念1. 行剖面与列
7、剖面2022-5-31中国人民大学六西格玛质量管理研究中心17 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3118 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3119 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3120 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2. 距离与总惯量 2022-5-3121 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3122 目录 上页 下页
8、 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-31中国人民大学六西格玛质量管理研究中心23 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3124 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3125 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 因此,此处总惯量也反映了两个属性变量各状态之间的相关关系。对应分析就是在对总惯量信息损失最小的前提下,简化数据结构以反映两属性变量之间的相关关系。实际上,总惯量的概念类似于主成分分析或因子分析中方差总和的
9、概念,在SPSS软件中进行对应分析时,系统会给出对总惯量信息的提取情况。2022-5-3126 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 7.2.2 对应分析的基本理论 经过以上数据变换,在引入加权距离函数之后,或是对行剖面集的各点进行式(7.8)的变换,对列剖面的各点进行类似变换之后,就可以直接计算属性变量各状态之间的距离,通过距离的大小来反映各状态之间的接近程度,同类型的状态之间距离应当较短,而不同类型的状态之间的距离应当较长,据此可以对各种状态进行分类以简化数据结构。但是,这样做不能对两个属性变量同时进行分析,因此不计算距离,代之求协方差矩阵,进行因子分
10、析,提取主因子,用主因子所定义的坐标轴作为参照系,对两个变量的各状态进行分析。2022-5-3127 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3128 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3129 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3130 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3131 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3132
11、 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3133 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3134 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 7.2.3 对应分析应用于定量变量的情况 上面对对应分析方法的描述都是以属性变量数据为例展开的,这是因为在实际中对应分析广泛地应用于对属性变量列联表数据的研究,实际上,对应分析方法也适用于定距尺度与定比尺度的数据。 2022-5-3135 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 其实,
12、对于定距尺度与定比尺度的情况,完全可以把每一个观测都分别看成是一类,这也是对原始数据进行的最细的分类;同时把每一个变量都看成是一类。这样,对定距尺度数据与定比尺度数据的处理问题就变成与上面分析属性变量相同的问题了,自然可以运用对应分析来研究行与列之间的相关关系。 2022-5-3136 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 7.2.4 需要注意的问题 需要注意的是,同对应分析生成的二维图上的各状态点,实际上是两个多维空间上的点的二维投影,在某些特殊的情况下,在多维空间中相隔较远的点,在二维平面上的投影却很接近。此时,我们需要对二维图上的各点做更深的了解,即
13、哪些状态对公因子的贡献较大,这与在因子分析中判断原始变量对公因子贡献的方法类似 。2022-5-3137 目录 上页 下页 返回 结束 7.2 对应分析的基本理论对应分析的基本理论 2022-5-3138 目录 上页 下页 返回 结束 7.3 对应分析的步骤及逻辑框图对应分析的步骤及逻辑框图 7.3.1 对应分析的步骤 2022-5-3139 目录 上页 下页 返回 结束 7.3 对应分析的步骤及逻辑对应分析的步骤及逻辑框图框图 7.3.2 对应分析的逻辑框图 2022-5-3140 目录 上页 下页 返回 结束 7.4对应分析的上机实现对应分析的上机实现 SPSS软件的Corresponde
14、nce Analysis模块是专门进行对应分析的模块。下面我们举例说明用Correspondence Analysis模块进行对应分析的方法。【例7-1】 选用SPSS软件自带的GSS93 subset.sav数据,该数据在SPSS软件的安装目录下可以找到,该数据共包括1500个观测,67个变量。我们仅借助它来说明Correspondence Analysis模块的使用方法,不对其具体意义作过多的分析。选用该数据集中Degree(学历)与Race(人种)变量为例来说明。其中Degree变量是定类尺度的,其各个取值的含义如下:0中学以下(less than high school),1中学(hi
15、gh school),2专科(junior college),3本科(bachelor),4研究生(graduate),7,8,9缺失;Race变量是定名尺度的,其各个取值的含义如下:1白种人(white),2黑种人(black),3其他(other)。 2022-5-3141 目录 上页 下页 返回 结束 7.4对应分析的上机实现对应分析的上机实现打开GSS93 subset.sav数据,对变量Degree与变量Race进行对应分析,依次点选AnalyzeData ReductionCorrespondence Analysis进入Correspondence Analysis对话框。数据集
16、中所有的变量名(标签)均已出现左边的窗口中,将Degree变量选入右侧行变量(Row)的小窗口中,此时该窗口显示的Degree变量形如:Degree(? ?),同时,其下方的Define Range按钮被击活,点击该按钮,进入Define Row Range对话框,在该对话框中需要确定Degree变量的取值范围,此处我们不研究缺失值,最小值(minimum value)与最大值(maximum value)处分别填上0和4,按右侧的update(更新)按钮,可以看到Degree的取值04已出现在Category Constraints框架左侧的窗口中,该框架的作用是对Degree的各状态加以限
17、定条件的,保持默认值none不变,即对Degree的取值不加限定条件。2022-5-3142 目录 上页 下页 返回 结束 7.4对应分析的上机实现对应分析的上机实现点击Continue继续,回到Correspondence Analysis对话框,可以看到,此时行变量Degree的显示变为Degree(0 4),按同样的方法把Race选为列变量且设定其取值范围为13,点击OK按钮运行,则可以得到如下输出结果7-1: S Su um mm ma ar ry y.144.021.852.852.021.065.060.004.1481.000.026.024 36.482.000a1.0001.
18、000Dimension12TotalSingularValue InertiaChiSquareSig.Accounted forCumulativeProportion ofInertiaStandardDeviation2CorrelationConfidenceSingular Value8 degrees of freedoma. 2022-5-3143 目录 上页 下页 返回 结束 7.4对应分析的上机实现对应分析的上机实现O Ov ve er rv vi ie ew w R Ro ow w P Po oi in nt ts sa a.186 -.462 -.414.008.276
19、.531.750.250 1.000.521 -.078.192.002.022.322.285.715 1.000.060 -.304.193.001.039.037.857.143 1.000.156.723 -.203.012.566.107.968.032 1.000.076.429 -.041.002.096.002.996.004 1.0001.000.024 1.000 1.000RS Highest DegreeLess than HSHigh schoolJunior collegeBachelorGraduateActive TotalMass12Score inDimen
20、sionInertia12Of Point toInertia ofDimension12TotalOf Dimension to Inertiaof PointContributionSymmetrical normalizationa. O Ov ve er rv vi ie ew w C Co ol lu um mn n P Po oi in nt ts sa a.838 .113 .079 .002 .074 .088 .830 .1701.000.112 -1.051-.134 .018 .855 .033 .993 .0071.000.050 .452 -1.026 .005 .0
展开阅读全文