第八章资料处理课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章资料处理课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 资料 处理 课件
- 资源描述:
-
1、调查资料的整理的主要内容调查资料的整理的主要内容 原始资料的审核和复查原始资料的审核和复查1 数据清理数据清理3 统计表与统计图统计表与统计图4 资料转化与录入资料转化与录入21 1、资料的审核、资料的审核 定义定义:它是指研究者对调查所收集回的原始资料:它是指研究者对调查所收集回的原始资料(主要是问卷)进行初步的审查和核实,校正错填、(主要是问卷)进行初步的审查和核实,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷误填的答案,剔除乱填、空白和严重缺答的废卷目的目的:使得原始资料具有较好的准确性、完整性和:使得原始资料具有较好的准确性、完整性和真实性,从而为后续资料整理录入与统计分析工作
2、真实性,从而为后续资料整理录入与统计分析工作打下较好的基础。打下较好的基础。检查出文件资料中存在的问题检查出文件资料中存在的问题重新向被调查者核实重新向被调查者核实 资资料料的的审审核核工工作作资料审核有两种不同的做法:资料审核有两种不同的做法:一种是实地审核;一种是实地审核;另一种是系统审核或集中审核另一种是系统审核或集中审核 2、资料的复查、资料的复查定义:指的是研究者在调查资料收回后,又由其他定义:指的是研究者在调查资料收回后,又由其他人对所调查的样本中的一部分个案进行第二次调查,人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量以检查和核实第一次调查的质量基本做
3、法:从原来的调查员所调查过的样本中,随基本做法:从原来的调查员所调查过的样本中,随机抽取机抽取5%-15%5%-15%的个案重新进行调查的个案重新进行调查调查内容:一方面核实原来的调查员是否真的对个调查内容:一方面核实原来的调查员是否真的对个案进行过调查;另一方面可将两次调查的结果进行案进行过调查;另一方面可将两次调查的结果进行对比,以检查第一次调查的质量对比,以检查第一次调查的质量通过审核和复查,研究者可以发现并纠正原通过审核和复查,研究者可以发现并纠正原始资料中所存在的一些错误,可以剔除一些始资料中所存在的一些错误,可以剔除一些无法进行再调查但又有明显错误的问卷,还无法进行再调查但又有明显
4、错误的问卷,还可以普遍了解整个资料收集工作的质量,从可以普遍了解整个资料收集工作的质量,从而对资料的真实性和准确性具有更大的信心。而对资料的真实性和准确性具有更大的信心。 1 1、问卷资料转换、问卷资料转换编码手册:为了减少资料转换工作中的误差,编码手册:为了减少资料转换工作中的误差,保证数据的质量,研究者需要编制一份编码手保证数据的质量,研究者需要编制一份编码手册(也称编码簿)发给从事问卷资料转换工作册(也称编码簿)发给从事问卷资料转换工作的人员,以便他们按编码手册的要求,统一进的人员,以便他们按编码手册的要求,统一进行资料转换工作行资料转换工作在编码手册中,研究者要将需要编码的项目在编码手
5、册中,研究者要将需要编码的项目和问题一一列出,逐一规定它们的代码、宽和问题一一列出,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其他度、栏码、简要名称、答案赋值方式及其他特殊规定等等。整个编码手册的格式要规范特殊规定等等。整个编码手册的格式要规范统一,指示要明确,且容易理解,便于操作。统一,指示要明确,且容易理解,便于操作。 “项目名称项目名称”所列的是问卷中的问题或有关项目;所列的是问卷中的问题或有关项目; “变量名变量名”则是调查问卷中所实际测量的一个变量;则是调查问卷中所实际测量的一个变量;“含义含义”是简要地指出该变量的内涵,它往往是变是简要地指出该变量的内涵,它往往是变量
6、的核心内容的反映;量的核心内容的反映;“答案赋值答案赋值”一项十分关键,它可以说是编码手册一项十分关键,它可以说是编码手册的真正内容。在这一栏中,研究者要详细地标明每的真正内容。在这一栏中,研究者要详细地标明每一种答案的赋值安排,以及某些特殊形式的答案赋一种答案的赋值安排,以及某些特殊形式的答案赋值方法值方法 2 2、数据录入、数据录入经过前述的资料转换处理,调查所收回的问经过前述的资料转换处理,调查所收回的问卷中的一个个具体答案都已成功地、系统地卷中的一个个具体答案都已成功地、系统地转换成了由转换成了由0-90-9这这1010个阿拉伯数字构成的数码,个阿拉伯数字构成的数码,接下来的任务就是将
7、这些数码输入计算机内,接下来的任务就是将这些数码输入计算机内,以便进行统计分析了。这就是数据录入的工以便进行统计分析了。这就是数据录入的工作作数据录入的方式主要有两种:数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入计一种是直接从问卷上将编好码的数据输入计算机;算机;另一种是先将问卷上编好码的数据转录到专另一种是先将问卷上编好码的数据转录到专门的登录表上,然后再从登录表上将数据输门的登录表上,然后再从登录表上将数据输入计算机。登录表的横栏为问题及变量名,入计算机。登录表的横栏为问题及变量名,且都有给定的栏码,纵栏为不同的个案记录且都有给定的栏码,纵栏为不同的个案记录数据数据目前运
8、用较普遍的统计分析软件主要有目前运用较普遍的统计分析软件主要有SPSS,SASSPSS,SAS等,尤其是等,尤其是SPSSSPSS应用更为广泛。应用更为广泛。从目前情况看,研究者主要采用两种方法来从目前情况看,研究者主要采用两种方法来输入数据。一种方法是直接在输入数据。一种方法是直接在SPSSSPSS软件上输软件上输入数据。另一类是采用比较专门的数据库管入数据。另一类是采用比较专门的数据库管理软件,如理软件,如FOXBASE,ExcelFOXBASE,Excel等,两种方法各有等,两种方法各有特点特点在在SPSSSPSS中输入比较直观,打开中输入比较直观,打开SPSSSPSS后,显示后,显示的
9、是一个数据录入窗口,每一个纵栏表示一的是一个数据录入窗口,每一个纵栏表示一个变量,每一横行代表一个个案。个变量,每一横行代表一个个案。输入前需要定义变量,做法是先用鼠标点击输入前需要定义变量,做法是先用鼠标点击表下面的表下面的Variable viewVariable view,进入到到变量定义,进入到到变量定义窗口(横行上面分别为变量名、变量类型、窗口(横行上面分别为变量名、变量类型、变量宽度、小数点位数、变量标签等、纵栏变量宽度、小数点位数、变量标签等、纵栏的的1 1、2 2、3 3等表示个案)再用鼠标点击表下方等表示个案)再用鼠标点击表下方Data viewData view,返回数据录
10、入窗口。,返回数据录入窗口。这时就可以第一行开始,直接将每一个个案这时就可以第一行开始,直接将每一个个案的数据逐行一个一个地敲到方格中,数据录的数据逐行一个一个地敲到方格中,数据录完后存盘。然后就可以随时调用作分析了。完后存盘。然后就可以随时调用作分析了。但是,直接输入有时候很容易出错,且输入但是,直接输入有时候很容易出错,且输入时也不容易发现;时也不容易发现;而另一类专门性的数据库管理软件则往往更而另一类专门性的数据库管理软件则往往更能保证输入的正确性,更能减少输入数据时能保证输入的正确性,更能减少输入数据时产生的差错产生的差错由于一项问卷调查的数据总量(每份问卷的由于一项问卷调查的数据总量
11、(每份问卷的栏码总数乘以全部问卷,即为输入数码或字栏码总数乘以全部问卷,即为输入数码或字符总数)往往是很大的,故实践中常常是有符总数)往往是很大的,故实践中常常是有多人共同输入来完成的。多人共同输入来完成的。因此,研究者必须对数据的输入工作进行精因此,研究者必须对数据的输入工作进行精心组织和安排。具体说来,他要做好以下几心组织和安排。具体说来,他要做好以下几方面工作:方面工作:挑选和培训输入人员。数据输入人员应该挑选和培训输入人员。数据输入人员应该是熟悉计算机操作,熟悉调查问卷的人,通是熟悉计算机操作,熟悉调查问卷的人,通常可从大学生调查员中挑选。对选出的录入常可从大学生调查员中挑选。对选出的
12、录入人员要进行一定的培训,熟悉输入方式和具人员要进行一定的培训,熟悉输入方式和具体软件,并合理分工和加强管理。体软件,并合理分工和加强管理。统一规定数据输入格式和数据文件名。由统一规定数据输入格式和数据文件名。由于多人输入,每个输入人员应采取统一的输于多人输入,每个输入人员应采取统一的输入格式,并各自规定自己存放数据的文件名,入格式,并各自规定自己存放数据的文件名,以防与他人输入的数据格式不同或发生混淆以防与他人输入的数据格式不同或发生混淆和丢失。尤其是输入格式一旦确定,每个输和丢失。尤其是输入格式一旦确定,每个输入人员都必须严格遵守执行,否则以后很难入人员都必须严格遵守执行,否则以后很难处理
13、,这一点十分关键。处理,这一点十分关键。每个输入人员独立完成各自所输的那一部每个输入人员独立完成各自所输的那一部分问卷,不同输入人员的问卷相互之间,以分问卷,不同输入人员的问卷相互之间,以及同一个输入人员已输和未输的问卷之间,及同一个输入人员已输和未输的问卷之间,千万不要混淆搞乱,以免造成漏输或重复输千万不要混淆搞乱,以免造成漏输或重复输入,影响数据质量。入,影响数据质量。在每个输入人员完成各自所负责的问卷输在每个输入人员完成各自所负责的问卷输入任务后,由研究者把他们的数据合起来形入任务后,由研究者把他们的数据合起来形成一个总的数据文件,以供统计分析时调用。成一个总的数据文件,以供统计分析时调
展开阅读全文