《SPSS统计分析方法及应用》第三章-数据预处理课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《SPSS统计分析方法及应用》第三章-数据预处理课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS统计分析方法及应用 SPSS 统计分析 方法 应用 第三 数据 预处理 课件
- 资源描述:
-
1、本章教学内容及目标:掌握SPSS数据筛选、排序、计数、汇总等基本操作掌握SPSS组距分组的具体操作。 排序目的:排序目的:数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等;通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距数据的全距,初步把握和比较数据的离散程度离散程度;通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。排序方法:排序方法:(1)单值排序单值排序,指排序变量只有一个(2)多重排序多重排序,首先按照主排序变量的大小次序排序,对于有相同主排序变量的数据,再按第二排序变量的大小次序依次安排。说明:说明:
2、1、数据排序是整行数据排序,而不是只对某列变量排序; 2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序; 3、数据排序后,原有数据的排序次序必然被打乱。操作例子:操作例子:职工住房状况调查要求:要求:分析本市户口和外地户口家庭的住房面积情况。方法:方法:采用多重排序,主排序变量为本市户口,【数据】【排序个案】 然后指定主排序变量到【排序依据】中,并在【排列顺序】中升序或者降序 注意:数据排序是整行数据排序,不只是对某列变量排序。数据计算的目的目的:数据的转换处理是在原有数据的基础上,计算产
3、生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有效的特点。SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。(1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。(2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。 变量计算中有三个概念: 一、一、SPSS算术表达式算术表达式(numeric expression)它是由变量、常量、算术运算符、括号、函数等组成的式子。运算先后顺序运
4、算先后顺序:自左向右,先算括号内的;先计算乘方(*),再计算乘(*)、除(/),最后计算加(+)、减() 1、简单的表达式由SPSS关系运算符、变量、常量以及算术表达式组成的式子。 其中关系运算符: (大于)、 =(大于等于)、35、sr=35) and (sr=700) (nl35) | (sr=700) 三是函数指事先编好的并储存在SPSS 软件中,能够事先按照某些特定任务完成计算的一段计算机程序。运行后,会得到一个函数值。结构:函数名(参数)函数名(参数)括号中参数可以是常量(字符型常量用引号括起来),也可以是变量或算术表达式。参数可以是多个,需要用逗号分开。SPSS函数有算术函数、统计
5、函数、与分布相关的函数、查找函数、字符函数、缺失值函数,以及其它函数等(见课本:p41)操作:【转换】【计算变量】在【目标变量】输入存放计算结果的变量名在【如果个案满足条件则包括】选项中输入条件表达式。依据职称级别计算实发工资(sr-bx)*0.5(0.3)3.3 3.3 数据选取数据选取一、数据选取的目的数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。 SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取,这样后面的分析操作就只针对选出的数据,直到用户取消这种选取为止。 提高数据的分析效率,检验模
6、型的需要(部分数据参与建模,剩余用于模型检验)二、选取的基本方式(1)选取全部数据(All cases)(2)按指定条件选取指定条件选取( If condition is satisfied ) SPSS要求用户以条件表达式给出数据选取的条件,SPSS将自动对数据编辑窗口中的所有个案进行条件判断。那些满足条件的个案,即条件判断为真的个案将被自动选取出来,而那些条件判断为假的个案则不被选中。(3)随机抽样随机抽样( Random sample of cases ),即对数据编辑窗口中的所有个案进行随机筛选,包括如下两种方式: 第一,近似抽样(Approximately) 近似抽样要求用户给出一个
展开阅读全文