社会调查研究方法第十章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《社会调查研究方法第十章课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会调查 研究 方法 第十 课件
- 资源描述:
-
1、社会调查研究方法目目 录录 第一节定量资料的整理 第二节定性资料的整理 学习目标学习目标熟悉定量资料审核的内容、方式和步骤。掌握定量资料编码的方式、规则,各种题型的编码方法及编码手册的使用方法。了解数据录入和数据清理的主要方式、方法。掌握定量资料整理中统计分组的方法、次数分布的编制,以及统计表和统计图的制作。了解定性资料的审核内容。熟悉定性资料分类的含义和方法。熟悉定性资料汇总的含义、定性资料编码的主要类型和概念图的绘制。2003年7月,中南财经政法大学社会保障研究所在全国范围内展开了一次“劳动与社会保障问题”抽样调查。按照各地经济发展水平,调查者在浙江、江苏、广东、福建、湖北、广西、河北、河
2、南、四川、陕西、安徽11个省、自治区抽取了38个行政村,然后在每个村抽取30户左右进行入户问卷调查,共发放问卷1 112份,收回有效问卷1 106份,有效回收率99.5。该调查试图从两个角度来考察农民的养老保险参与意向:当前农民的社会养老保险制度参加意愿,分析目标为“根据农村社会养老保险制度的内容及您自己的经济条件,您是否愿意参加”。案例导入“劳动与社会保障问题”抽样调查中的数据整理对社会养老保险的水平选择,分析目标为“根据农村社会养老保险制度的内容及您自己的经济条件,您会选择怎样的投保标准”。这两个指标被作为该调查需要分析的因变量(见表10-1)。表10-1 被解释变量的频数分布该调查的自变
3、量选择了个体情况、家庭情况、社区条件、养老意识与观念和养老保险制度的信息掌握及渠道5个类型共17个变量(见表10-2)。表10-2 自变量的选择及相应处理、赋值续表在社会调查研究过程中,资料的整理就是为完成资料的统计分析而对通过问卷调查或访谈收集到的各种资料进行检查、分类,使其系统化、条理化的过程。资料整理是资料收集的继续,也是资料分析的前提,它是社会调查研究过程中不可缺少的一个环节。根据资料性质的不同,资料整理工作又分为定量资料的整理和定性资料的整理。由于对两类资料的整理有所不同,故本章将对其分开进行介绍。定量资料亦称数据资料,主要来自调查问卷获得的数据。定量资料的整理内容主要包括资料审核、
4、资料编码、数据录入、数据清理、统计分组与统计图表的绘制等。其基本程序如图10-1所示。图10-1 社会调查研究定量资料整理的程序 定量资料的审核 一、定量资料的审核是资料整理的第一步工作,它是指研究者对调查所回收的原始资料(主要是问卷)进行初步的审查和核实,校正错填、误填,剔除乱填、空白和严重缺答的废卷,使原始资料具有较好的准确性、完整性和真实性,从而为后续资料整理录入与统计分析工作打下较好的基础。(一)资料审核的内容 1.资料的完整性(1)问卷的某一页或某几页漏填了。资料的完整性主要是通过问卷填答的完整程度反映出来的,如果在回收的问卷中发现了以下情况,就说明资料不完整:(2)问卷中的一个或多
5、个问题没有填答。实际操作中,特别是在有开放式问题的情况下,调查研究者要对问卷填答的完整程度做出一些规定,使检查人员明确问卷填答到什么程度算是完整的。例如,在调查职业时,就要规定不仅要问职业名称,而且还要具体说明该职业所属行业,以及该职业所从事的工作的具体操作方式。此外还应对可接受的数据缺失情况做出规定,具体说明哪些数据的缺失是可以接受的。2.资料的准确性资料的准确性审核主要是审核调查数据的口径、计算方法、计量单位等是否符合要求。剔除不可靠的数据,使数据更加准确。调查数据还要清楚、易懂,即如果所记录的回答字迹模糊,或者除调查者以外谁都不明白,则应返还问卷,让调查者校正或写清楚。(3)计算审核。调
6、查问卷中某些调查项目之间往往存在着某种数量关系,调查研究者可以利用这些指标之间的数量关系来检查所接收的数据资料的准确性。一般在审核过程中,主要看各数字在计算方法和计算结果上是否有错误。常用的计算审核法有加总法、对比法、平衡法等。3.资料的真实性资料的真实性主要表现在以下2个方面:(1)问卷是否为事先确定的调查对象所提供。尤其是在自填式问卷调查中要特别注意这一点。(2)调查对象提供的资料是否真实,是否就是本人情况的反映。(二)资料审核的方式资料审核的主要方式是通过检查调查问卷资料中的问题,及时地对发现的问题向调查对象核实,确定问卷资料的有效性。资料的审核工作有两种:一种是实地审核,另一种是集中审
7、核(中心办公室审核)。1.实地审核实地审核是在收集资料的过程中进行的,也就是边收集边审核。在问卷调查的过程中,一旦发现填答错误,漏填、误填,或者一些有疑问的情况,就要及时向调查对象进行询问核实。因此,当资料收集工作结束时,资料的审核工作也就完成了。实地审核一般分成两个阶段:第一阶段,调查者在访问即将结束时,或者调查者回收调查对象自己填答的问卷时,要对整个问卷进行检查,看是否有无漏记、漏填或存在逻辑错误的情况。如调查对象往往会认为调查者就在自己的面前,理应知道自己的性别,因而在填答问卷时,对“您的性别?”这一问题不作答,调查者在检查问卷时,不管多么简单的问题都要认真审核,以免丢失信息。另外,还要
8、检查一下调查对象提交的问卷有没有明显的资料错误和逻辑错误,具体方法如前所述。遇到这样的问题时,调查者应该再找被调查对象核实。第二阶段,调查组织者对调查者交回的问卷当面进行审核,对有疏漏的记录、有错误的记录及模糊不清的笔迹等向调查者核实,或由调查者再找到调查对象进行核实。实地审核的优点是能够及时、准确地审核资料,但对于调查者和监督员处理各种情况的能力要求较高,要有及时发现和处理问题的能力。2.集中审核集中审核也称为中心办公室审核,是先将资料全部收回,然后集中时间进行的。这种审核主要是由调查的组织者进行的。集中审核的优点是便于统一组织安排和管理资料的收集工作,审核工作则可以统一在调查研究者的指导下
9、进行。集中审核与实地审核相比,审核的标准比较一致,检查的质量较高。但是集中审核也存在一些问题,比如审核工作的周期相对较长,使得一些需要重新询问的核实工作因时间相隔较长或空间相距太远而无法实行。因此,在调查的过程中应尽可能在每天调查工作结束后,对当天收集的资料进行初步的整理,对问卷中出现的问题及时补充或核实。(三)资料审核的步骤编辑检查接收核查问卷采取相应处理措施资料审核的3个阶段 1.接收核查问卷接收核查问卷又称一审。对不同地区、不同调查者交回的问卷,都应该立即登记和编号。尤其对于大规模的调查,更应做好登记和编号工作。一般负责接收问卷的人员要事先设计好登记表格,上面列有调查者姓名和编号、调查地
10、区和编号、调查实施的时间、交付日期、实发问卷数、上交问卷数和问卷编号、未答或拒答问卷数、丢失问卷数、其他问卷数及合格问卷数等。回收的问卷应分别按照不同调查者和不同地区(或单位)放置,问卷表面应写有编号或注明调查者和调查地区等。否则,大量的问卷混在一起就容易丢失,且不易查找。接收问卷时,对所有的问卷都应检查一遍,将无效的或不能接受的问卷剔除。无效的问卷主要指以下几种情况:(1)答案不完全,即有相当多的问题没有填写答案。(2)调查对象没有理解问卷的内容而答错问题,或没有按照指导语的要求回答问题。例如,要求跳答的问题没有按要求去做,单选题选择多个答案等。(3)问卷中的回答没有什么变化,如在7级的李克
11、特态度量表中,不管是正向的看法还是反向的看法,调查对象的回答全是“4”。(4)缺损的问卷,即有一页或多页丢失或无法辨认的问卷。(5)在截止日期之后回收的问卷。(6)由不属于调查对象的人填写的问卷,如在一项药品的市场调查中,调查对象是患有某种疾病并曾经进行过治疗的人,因此没有患有此项疾病或患有此项疾病但没有治疗过的人填答的问卷都属于无效问卷。(7)前后矛盾或有明显错误的问卷,如年龄为12岁,职务为所长。2.编辑检查编辑检查又称二审,是对问卷进行进一步的更为准确的检查。主要检查的仍是回答的完整性、准确性、真实性等。例如,在有关家庭消费模式的调查中,某调查对象的家庭人均收入仅1 500元,却经常在一
12、些高档商场购物;又如,某题的答案圈在1与2之间,让人难以确定是1还是2,或者是1和2之间。3.采取相应的处理措施对于检查出来的无法令人满意的问卷,常用的处理方法为退回实地重新调查、视为缺失数据或放弃不用。但是,如果有回答令人不满意的问卷与回答令人满意的问卷在人口特征、关键变量等方面的分布存在显著差异,或者判断一份问卷是否令人满意是很主观的,那么简单放弃那些回答令人不满意的问卷可能会产生系统偏差。因此,如果调查研究者决定放弃一些问卷,则应当在报告中说明放弃问卷的数量及判别这些问卷的程序。资料的真实性检查一般是在资料搜集结束后,由熟悉调查者情况的分区(组)督导或专门训练的复查员通过随机抽取515已
13、访问过的调查对象进行回访来实现的。对调查对象的回访既可以采用打电话,也可以通过邮寄回访问卷的方式进行。复查的内容主要是确认调查者是否按规定访问了指定的调查对象,以及调查者在访问中是否有违规操作行为。复查应该是标准化的,要有复查问卷和格式统一的复查记录表。复查问卷应包括以下一些内容:(1)复查对象的原问卷编号。(2)复查的次数及时间记录。拓展阅读回 访(3)确认调查者是否来访过。(4)确认调查者是否访问了指定的调查对象。(5)(如果赠送礼品)确认调查者是否已送出礼品。(6)复查对象对调查者访问态度的评价。(7)从原问卷中挑选一些较敏感、较难回答或事实性的题目,回访复查对象,以此检验调查者是否有违
14、规操作行为。根据复查结果,调查研究者就能通过调查者的行为对问卷的真实性做出判断。如果调查者在操作上正确无误,则问卷资料是真实可信的;如果调查者有违规或舞弊行为,就要考虑将他们的问卷作为废卷处理,以免影响数据质量。定量资料的编码 二、编码就是给每个问题及答案一个数字作为它的代码,将问卷中的文字等信息转化成数字的过程。定量调查的数据一般要输入计算机,用计算机进行整理和分析,数字代码为计算机的输入和分析提供了方便。编码也是数据整理汇总阶段重要而基本的环节。编码的目的是用一组变量来表示各项调查问题,用每一个变量的不同取值表示对这一问题的不同回答。例如,调查对象是否为党员,可用“1”表示“党员”,用“2
15、”表示“非党员”。需要注意的是,在定类和定序变量的编码中,数字仅起到一种代表的作用,并没有任何数量上的意义。(一)编码的方式前编码编码的方式主要有3种边缘编码后编码 1.前编码前编码又称预编码,它是指调查研究者在问卷设计时事先为每一个题目的答案设置一个代码,编码时只要逐一记录调查对象回答的选项代码即可,这种编码的方式与问卷设计是同步进行的。封闭式问题通常采用的就是前编码的形式。2.边缘编码边缘编码是指为了提高录入和查错时的工作效率,事先在问卷上预留编码的位置,这些预留的编码位置通常在问卷的最右边,并用竖线与问题部分隔开,因此称为边缘编码。边缘编码是编码的一种表示形式,一般在数据录入之前编码的表
16、示形式都是边缘编码,也就是将编码值写在相应调查指标对应的位置,然后根据编码录入数据。3.后编码调查研究者在访问结束后,对问卷进行的编码称为后编码。开放式问题和封闭式问题中的“其他”选项的编码,通常采用的都是后编码的形式。因为这些问题往往很难预计,只能在调查问卷回收之后,根据具体的答案设定编码的形式这里需要说明的是,究竟是采用前编码还是后编码的形式并没有固定的顺序和要求,研究者可根据自己的研究需要与进度而定。(二)编码的一般规则资料编码原则上是将调查对象对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。绝大多数情况下,编码都采用数字作为代码,但对于有
17、些特殊答案,调查研究人员偶尔也采用字母作为代码。除了确定上述编码方式外,以下几项规则也是编码时需要特别注意的:(1)在编码的过程中,除了要对调查对象每一个回答的选项进行编码外,还需对问卷编号、调查者编号等相关内容依统一标准进行编码,这样做可以为查找问卷的错误提供极大的便利。(三)各种题型的编码 1.单项选择题的编码单项选择题给出的答案至少有两个,回答者要根据自己的情况选择一个答案作为回答。针对这种题型的编码,通常直接使用问卷设计时赋予每一个答案的数值作为其代码值,如在表10-3中。表10-3 单项选择题的编码 2.多项选择题的编码多项选择题指的是一个问题可选择的答案不止一个,而是有多个,又包括
18、不定项选择题和多项限选题。(1)不定项选择题。不定项选择题指的是在调查时不设定回答者对某一问题的选择答案个数的题目。如表10-4中的A5题,调查对象可以选择1个、2个、3个、5个或10个答案。通俗地讲,即是“任选题,有多少个选项就有多少个变量,每个变量用01编码”。如果一个调查对象选择了2、5、6、8、9项,那么A5题的编码就如表10-4的编码栏所示,每一个答案都有一个相应的栏码相对应。表10-4 不定项选择题的编码形式(2)多项限选题。因为选择的个数太多,有时难以进行统计,因此,多项选择题有时候也会对其限制选择的个数。如表10-5中的A6题,如果选择的要求不是“有几个选几个”,而是设定“请选
19、择最重要的三项”,则编码的方法如下:表10-5 多项限选题的编码形式 采用“0”“1”编码。即使是设定了选择的个数,也可以“0”“1”编码的形式进行编码,这时还是有几个答案就设置几个编码的位置,将其视做任选题,只是选择“1”的答案是确定的,不能超过三个,当然有些人没有那么多的选择,可能只有12个答案,也是可以接受的。用答案前的数字作为代码。因为答案选择的个数确定,最多选择三项,所以在编码时也可以在编码手册中编写成3个变量,即设定3位栏码,以答案前的数字作为代码。简言之,即是“限选题,限选几项就有几个变量,每个变量选什么编什么”。上面A6题的编码就变成了表10-5所示的形式。3.排序题的编码除了
20、多选题之外,另一种常用的特殊题型是排序题。例如,调查研究者若要求调查对象从7种就业信息渠道中选出最常用的三种,依重要顺序排列,则成为一种排序题,如表10-6所示。表10-6 排序题的编码形式这时由于要求调查对象从7个答案选项中选择的答案不止一个,所以具有多选题的特性;与此同时,又由于要求被访者对选项排出顺序,故对于每一个被选中的答案选项来说,其排序位置有1、2、3等多种可能,这样在实际编码和统计分析中,排序题与多选题就有许多相似之处,但排序题会显得更复杂。与前述的多选题类似,题A8虽然是一个询问调查对象最常使用的搜集就业信息渠道的题目,但是由于答案选项有7个,调查对象要进行7次判断才能够完成本
21、题,因此,本题也同样要用7个变量来处理。在编码手册中,应将本题编写成7个不同的变量,即设定7位栏码。但排序题与多选题不同的是,其每个答案选项的取值不是“0”“1”两个,而是“0”“1”“2”“3”四种可能,其中“0”代表该选项没有被选中,“1”“2”“3”则分别代表被指定为第一位、第二位和第三位。不难看出,排序题与多选题最大的不同就是变量的取值不一样,如果只要求多选,不要求排序,每一个选项只有被选中或没有被选中两种可能,被选中时编码为“1”,没有被选中时编码为“0”,因此是一个二分变项。但如果不仅要求多选,而且还要求排序,则每一个选项被选中的状况就不止一种,而形成顺序变量。例如,题A8中,每一
22、个选项是一个“13”的顺序变量,没有被选中时应编码为“0”。表10-7是将5个调查对象对题A8的回答的编码输入计算机后形成的数据文件的片断。表10-7 对排序题的编码从表10-7可以看出,每一位调查对象都指出了三个最常用的就业信息渠道,第一位调查对象指出“招工单位/公司/部门”是最常使用的就业信息渠道,因为多选变量QA8_3取值为1,其次常用的是“其他各类组织”,第三位是“其他”,第二位调查对象也是指出“招工单位/公司/部门”最常用,因此QA8_3取值还是1。4.开放式问题的编码对于开放式题目,如果针对的是定距或定比变量,可以直接用填答的数字进行编码。例如“您每月的收入是 元”这种题在编码时直
23、接采用填写的数字。而对于非数值型的题目,则应先制作编码手册,为其中的每一个选项设计一个代码,再进行编码,如“您的专业是 ”调查完成之后,可以根据随机抽取的一些样本的情况设定代码,如设定“1社会学,2经济学,3教育学”然后再进行编码、录入。(四)答案栏编码的确定编码的目的是为了将文字的资料通过设定一定的代码,使其转化到计算机可以识别的数据时更为简便、快捷。在计算机录入数据的过程中,除了考虑答案的数字代码外,还要考虑每一个题目答案的宽度和栏码数,在数据库编写时进行相应的设置,为数据的录入提供方便。每个问题答案代码的位数通常称为编码的宽度。栏码则是在数据转录到登记表上或录入数据库时每个变量所处的位置
24、,它是根据每个指标或问题答案代码的位数,确定该项目或问题所占的宽度,再根据前后顺序来确定其在整个数据排列中所处的位置,从前依次往后排列。答案的栏码数一般在设计问卷时就直接印在问卷中,如问卷表右侧的编码栏,每一个问题对应编码的横线个数表示这一问题编码的宽度,如性别的两个取值“1男;2女”,那么,这一题目对应的栏码数是1;又如,到城市工作的时间是哪一年,若回答为2005年,那么它对应的位数应该是4位,所以在设定编码栏时设定4位栏码。如表10-8中各问题的栏码分配情况见该表右列所示。表10-8 各问题的栏码分配表(五)编码手册在对资料进行编码时,必须事先制订详尽的计划和明确的规则,通常需要编制一份编
25、码手册,用来记载资料数量化的所有格式、内容,以及使用计算机资料的具体步骤。事前编码和事后编码所用的编码手册最后将合并为一个编码手册。编码手册最直接的作用是提供一套标准化的编码作业程序。由于问卷调查的样本规模一般都成百上千,一份问卷又有几十至上百个问项,故编码作业是由许多人共同完成的。在此情况下,唯一避免发生编码错误的办法就是大家都按编码手册规定的流程进行作业。在编码手册中,研究者要将需要编码的项目和问题一一列出,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其他特殊情况的说明等。整个编码手册要规范统一,指示要明确,并且容易理解,便于操作。表10-9就是一份调查问卷的编码手册的节选。“
展开阅读全文