书签 分享 收藏 举报 版权申诉 / 96
上传文档赚钱

类型第八章问卷检验与数据的录入(讲课)分析课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2263310
  • 上传时间:2022-03-27
  • 格式:PPT
  • 页数:96
  • 大小:877KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第八章问卷检验与数据的录入(讲课)分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第八 问卷 检验 数据 录入 讲课 分析 课件
    资源描述:

    1、第八章第八章 问卷检验与数据录入问卷检验与数据录入第一节第一节 问卷的检验问卷的检验 问卷调查法是营销研究中广泛采用的问卷调查法是营销研究中广泛采用的一种调查方法,根据调查目的设计的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。适用性等具有决定性的作用。 为了保证问卷具有较高的可靠性和有为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信问卷进行试测,并对试测结果进行信度和效度

    2、分析,根据分析结果筛选问度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷题项,调整问卷结构,从而提高问卷的信度和效度。卷的信度和效度。 信度和效度分析的方法包括逻辑分析信度和效度分析的方法包括逻辑分析和统计分析。和统计分析。 一、信度分析 信度(信度(Reliability)即可靠性,它)即可靠性,它是指采用同样的方法对同一对象重复是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。测量时所得结果的一致性程度。 信度指标多以相关系数表示,大致可信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性

    3、)性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四性)。信度分析的方法主要有以下四种:种:1、重测信度法 这一方法是用同样的问卷对同一组这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度属于稳定系数。 重测信度法特别适用于事实式问卷,重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴应有任何差异,大多数被调

    4、查者的兴趣、爱好、习惯等在短时间内也不会趣、爱好、习惯等在短时间内也不会有十分明显的变化。有十分明显的变化。1、重测信度法 如果没有突发事件导致被调查者的如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见突变,这种方法也适用于态度、意见式问卷。态度、意见式问卷。 由于重测信度法需要对同一样本试测由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一短也有一定限制,因此在实施中有一定困难。定困难。 2、复本信度法 复本信度法是让同一组被调

    5、查者一复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。的相关系数。复本信度属于等值系数。 复本信度法要求两个复本除表述方式复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较到这种要求,因此采用这种方法者较少。少。3、折半信度法 折半信度法是将调查项目分为两半,折半信度法是将调查项目分为两半,计算两半得分的相关系数

    6、,进而估计计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分一致性系数,测量的是两半题项得分间的一致性。间的一致性。 这种方法一般不适用于事实式问卷这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。态度、意见式问卷的信度分析。折半信度分析折半信度分析 进行折半信度分析时,如果量表中含进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向作逆向处理,以保证各题项得分方向的一致

    7、性,然后将全部题项按奇偶或的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二前后分为尽可能相等的两半,计算二者的相关系数(者的相关系数(rhh,即半个量表的信,即半个量表的信度系数),最后用斯皮尔曼度系数),最后用斯皮尔曼-布朗布朗(Spearman-Brown)公式:)公式:rtt=2rhh/(1+rhh), 求出整个量表的信度系数(求出整个量表的信度系数(ru)。)。4、信度系数法 Cronbach 信度系数是目前最常用信度系数是目前最常用的信度系数,其公式为:的信度系数,其公式为: 其中,其中,K为量表中题项的总数,为量表中题项的总数, 为为第第i题得分的题内方差,题得分的

    8、题内方差, 为全部题项总为全部题项总得分的方差。从公式中可以看出,得分的方差。从公式中可以看出,系系数评价的是量表中各题项得分间的一数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)法适用于态度、意见式问卷(量表)的信度分析。的信度分析。二、效度分析 效度(效度(Validity)即有效性,它是指)即有效性,它是指测量工具或手段能够准确测出所需测测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:量的事物的程度。效度分为三种类型:内容效度、准则效度和结构效度。效内容效度、准则效度和结构效度。效度分析有多

    9、种方法,其测量结果反映度分析有多种方法,其测量结果反映效度的不同方面。常用于调查问卷效效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种。度分析的方法主要有以下几种。1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测它是指所设计的题项能否代表所要测量的内容或主题。量的内容或主题。 对内容效度常采用逻辑分析与统计分对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是一般由研究者

    10、或专家评判所选题项是否否“看上去看上去”符合测量的目的和要求。符合测量的目的和要求。1、单项与总和相关效度分析 统计分析主要采用单项与总和相关统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据项得分与题项总分的相关系数,根据相关是否显著判断是否有效。相关是否显著判断是否有效。 若量表中有反意题项,应将其逆向处若量表中有反意题项,应将其逆向处理后再计算总分。理后再计算总分。2、准则效度分析 准则效度又称为效标效度或预测效度。准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种准则效度分析是根据已经得到确

    11、定的某种理论,选择一种指标或测量工具作为准则理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著差异,则为有不同取值、特性表现出显著差异,则为有效的题项。效的题项。 评价准则效度的方法是相关分析或差异显评价准则效度的方法是相关分析或差异显著性检验。在调查问卷的效度分析中,选著性检验。在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种择一个合适的准则往往十分困难,使这种方法的应用受到一定限制。方法的应用受到一定限制。3、结构效度分析

    12、结构效度是指测量结果体现出来的结构效度是指测量结果体现出来的某种结构与测值之间的对应程度。结某种结构与测值之间的对应程度。结构效度分析所采用的方法是因子分析。构效度分析所采用的方法是因子分析。有的学者认为,效度分析最理想的方有的学者认为,效度分析最理想的方法是利用因子分析测量量表或整个问法是利用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能卷的结构效度。因子分析的主要功能是从量表全部变量(题项)中提取一是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表定变量高度关联,这些公因子即代表了量表的基本结构。了量表

    13、的基本结构。 通过因子分析可以考察问卷是否能够通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、价结构效度的主要指标有累积贡献率、共同度和因子负荷。共同度和因子负荷。 累积贡献率反映公因子对量表或问卷累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。反映原变量与某个公因子的相关程度。第二节第二节 资料整理的一般

    14、程序资料整理的一般程序问卷接收问卷接收编辑和检查编辑和检查编编 码码数据的分析数据的分析缺失数据处缺失数据处理理数据录入数据录入资料整理程序资料整理程序 数据资料的处理过程是从回收第一份数据资料的处理过程是从回收第一份问卷开始的。问卷开始的。 按照事先调查方案的计划,尽量确保按照事先调查方案的计划,尽量确保每份问卷都是有效问卷(所谓每份问卷都是有效问卷(所谓“有效有效”问卷,指的是在调查过程中按照正确问卷,指的是在调查过程中按照正确的方式执行完成的问卷)。的方式执行完成的问卷)。第一节第一节 数据整理的一般程序数据整理的一般程序问卷接收问卷接收编辑和检查编辑和检查编编 码码数据的分析数据的分析

    15、缺失数据处缺失数据处理理数据录入数据录入数据整理程序数据整理程序一、问卷的接收一、问卷的接收 对于不同地区、不同调查员交来的问卷,应当认对于不同地区、不同调查员交来的问卷,应当认真仔细地做好接收、登记与核对工作。真仔细地做好接收、登记与核对工作。 首先,要对问卷进行登记与编号;首先,要对问卷进行登记与编号; 其次,要将无效问卷的进行剔除;其次,要将无效问卷的进行剔除; 最后,还要确定补充调查。最后,还要确定补充调查。 二、编辑和检查二、编辑和检查 为了增加准确性,对那些初步为了增加准确性,对那些初步接收的问卷还要进一步进行检接收的问卷还要进一步进行检查和校订。主要检查是否清楚查和校订。主要检查

    16、是否清楚可认,是否完全,是否一致以可认,是否完全,是否一致以及是否明确不含糊等。及是否明确不含糊等。 对于检查出来的不满意问卷,对于检查出来的不满意问卷,常用以下方法进行处理常用以下方法进行处理: 1.退回去重新填写;退回去重新填写; 2.按缺失数据处理;按缺失数据处理; 3.丢弃。丢弃。三、编三、编 码码 编码是指用代码来表示各组数编码是指用代码来表示各组数据资料使使其成为可进行计算据资料使使其成为可进行计算机处理和分析的信息。机处理和分析的信息。 编码可以按照预先编码或事后编码可以按照预先编码或事后编码来进行。编码来进行。三、编三、编 码码 无论是哪种编码方式基本程序都包括以下几个方无论是

    17、哪种编码方式基本程序都包括以下几个方面:面: 确定变量确定变量 单选问题与多选问题的编码单选问题与多选问题的编码 无结构式(开放式)问题的编码无结构式(开放式)问题的编码 编码说明书及数据输出格式说明书编码说明书及数据输出格式说明书 四、数据录入四、数据录入 数据录入要求做到准确无误。数据录入要求做到准确无误。控制录入误差的方法有:重复控制录入误差的方法有:重复录入、预值控制、平衡检测。录入、预值控制、平衡检测。 五、缺失数据处理五、缺失数据处理 缺失数据是指由于被调查者没缺失数据是指由于被调查者没有给出明确的答案或调查员没有给出明确的答案或调查员没有记录下他们的答案而造成未有记录下他们的答案

    18、而造成未知变量值。知变量值。 缺失数据处理可以使用以下几缺失数据处理可以使用以下几种方法:种方法: 1.用一个样本统计量去代替;用一个样本统计量去代替; 2.用某些统计模型进行推算;用某些统计模型进行推算; 3.问卷整体剔除;问卷整体剔除; 4.部份排除。部份排除。 六、调查资料的分析六、调查资料的分析 1.数据分析任务书数据分析任务书 数据分析任务书一般应明确列举以下内容:数据分析任务书一般应明确列举以下内容: 编制变量标识和变量制标识。编制变量标识和变量制标识。 需要制作的统计表。需要制作的统计表。 需要制作的统计图。需要制作的统计图。 需要进行的统计分析。需要进行的统计分析。 一、问卷的

    19、接收一、问卷的接收 对于不同地区、不同调查员交来的问卷,应当认对于不同地区、不同调查员交来的问卷,应当认真仔细地做好接收、登记与核对工作。真仔细地做好接收、登记与核对工作。 首先,要对问卷进行登记与编号;首先,要对问卷进行登记与编号; 其次,要将无效问卷的进行剔除;其次,要将无效问卷的进行剔除; 最后,还要确定补充调查。最后,还要确定补充调查。 问卷回收以后,督导员必须按照调查的要求,仔问卷回收以后,督导员必须按照调查的要求,仔细的检查问卷。检查问卷的目的在于将有错误填细的检查问卷。检查问卷的目的在于将有错误填写,或者是挑出不完整或不规范的问卷,保证数写,或者是挑出不完整或不规范的问卷,保证数

    20、据的准确性。据的准确性。 所谓错误填写即出现了那些不合逻辑或根本不可所谓错误填写即出现了那些不合逻辑或根本不可能的结果,通过对调查员的复核,可以检查出哪能的结果,通过对调查员的复核,可以检查出哪些调查员没有按照调查的要求去访问,那么,该些调查员没有按照调查的要求去访问,那么,该调查员完成的问卷可能存在很多问题。调查员完成的问卷可能存在很多问题。 还有可能出现漏答了某些必须回答的问题,比如还有可能出现漏答了某些必须回答的问题,比如被访者的人口特征等基本情况,造成问卷回答不被访者的人口特征等基本情况,造成问卷回答不完整。完整。 鉴于这些情况,不管是由于调查员造成的鉴于这些情况,不管是由于调查员造成

    21、的还是被访者的原因,通常有两种方式进行还是被访者的原因,通常有两种方式进行补救:补救: 对于出现漏答的问卷,通常要求调查员对受访对于出现漏答的问卷,通常要求调查员对受访者进行重访,以补充未答的问题;者进行重访,以补充未答的问题; 如果不便于重访或重访后的问卷还有问题,数如果不便于重访或重访后的问卷还有问题,数目不是很多,可以当作缺失值计。如果数量非目不是很多,可以当作缺失值计。如果数量非常大,这份问卷就只能当作废卷处理,并且按常大,这份问卷就只能当作废卷处理,并且按照被访对象的抽样条件,补作相关的样本。照被访对象的抽样条件,补作相关的样本。二、编辑和检查二、编辑和检查 为了增加准确性,对那些初

    22、步为了增加准确性,对那些初步接收的问卷还要进一步进行检接收的问卷还要进一步进行检查和校订。主要检查是否清楚查和校订。主要检查是否清楚可认,是否完全,是否一致以可认,是否完全,是否一致以及是否明确不含糊等。及是否明确不含糊等。 问卷的检查一般是指对回收问卷的完问卷的检查一般是指对回收问卷的完整性和访问质量的检查,目的是要确整性和访问质量的检查,目的是要确定哪些问卷可以接受,哪些问卷要作定哪些问卷可以接受,哪些问卷要作废。废。检查的要点检查的要点 (1) 规定详细的检查规则,一份问卷哪些规定详细的检查规则,一份问卷哪些问题是必须填写完整的,哪些问题出现缺失时可问题是必须填写完整的,哪些问题出现缺失

    23、时可以容忍等,使督导员明确检查问卷的每一项流程。以容忍等,使督导员明确检查问卷的每一项流程。 (2) 对于每份调查员交回来的问卷必须彻对于每份调查员交回来的问卷必须彻底地检查,以确认调查员或者被访者是否按照相底地检查,以确认调查员或者被访者是否按照相关的要求完成了访问,并且完整的记录在问卷恰关的要求完成了访问,并且完整的记录在问卷恰当的位置。当的位置。 检查的要点检查的要点 (3) 应该将问卷分成三种类型,一种是完成的应该将问卷分成三种类型,一种是完成的问卷,一种是作废的问卷,第三种是有问题的问问卷,一种是作废的问卷,第三种是有问题的问卷,但是通过追访还可以利用的问卷。卷,但是通过追访还可以利

    24、用的问卷。 (4) 如果抽样中有配额的要求,那么应将完成如果抽样中有配额的要求,那么应将完成的问卷中的配额指标进行统计分析,确定问卷是的问卷中的配额指标进行统计分析,确定问卷是否完成配额的要求,以便及时的补充不足的样本。否完成配额的要求,以便及时的补充不足的样本。 检查的要点检查的要点 (5) 通常有下面的情况的问卷是不能接受的:通常有下面的情况的问卷是不能接受的: 回收的问卷明显不完整,缺了一页或者多页;回收的问卷明显不完整,缺了一页或者多页; 问卷中有很多内容没有填答;问卷中有很多内容没有填答; 问卷的模式说明调查员(被访者)没有理解或者遵循问卷的模式说明调查员(被访者)没有理解或者遵循访

    25、问指南回答等;访问指南回答等; 问卷的答案几乎没有什么变化,如在态度的选项上全问卷的答案几乎没有什么变化,如在态度的选项上全部选择第项的情况;部选择第项的情况; 问卷的被访者不符合抽样要求;问卷的被访者不符合抽样要求; 问卷的回收日期超过了的访问的时限等。问卷的回收日期超过了的访问的时限等。 对于检查出来的不满意问卷,对于检查出来的不满意问卷,常用以下方法进行处理常用以下方法进行处理:1.退回去重新填写;退回去重新填写;2.按缺失数据处理;按缺失数据处理;3.丢弃。丢弃。问卷的校订问卷的校订 为了加强问卷的准确性,对那些初步接受的问卷还要进行为了加强问卷的准确性,对那些初步接受的问卷还要进行进

    26、一步的检查和校订,在校订的过程中,通常会发现进一步的检查和校订,在校订的过程中,通常会发现问卷问卷中存在有字迹模糊、问题漏选的、前后回答不一致的、答中存在有字迹模糊、问题漏选的、前后回答不一致的、答案模棱两可的和跳答错误的问题案模棱两可的和跳答错误的问题。问卷的某些问题答案可能出现字迹模糊的情况,特别问卷的某些问题答案可能出现字迹模糊的情况,特别是碰上无结构的开放式的问题时,因为调查员记录的不好,是碰上无结构的开放式的问题时,因为调查员记录的不好,答案不容易识别。如果发现这样的问题,必须对受访者进答案不容易识别。如果发现这样的问题,必须对受访者进行追访,将积极不清楚的地方填写清楚。行追访,将积

    27、极不清楚的地方填写清楚。对于漏选的问题处理方法也是一样,出现漏选的题目对于漏选的问题处理方法也是一样,出现漏选的题目因为各种原因,无法进行补充访问事后,普通的问题,而因为各种原因,无法进行补充访问事后,普通的问题,而且数目不大的情况,通常作为缺失值处理;如果涉及到是且数目不大的情况,通常作为缺失值处理;如果涉及到是受访对象的个人特征的问题,通常只能作为废卷处理。受访对象的个人特征的问题,通常只能作为废卷处理。问卷的校订问卷的校订 问卷中有些问题的答案会出现不容易理解的模棱两可的情问卷中有些问题的答案会出现不容易理解的模棱两可的情况,或者是使用了不是通用的缩写方式或词语,或者在该况,或者是使用了

    28、不是通用的缩写方式或词语,或者在该单选一项的问题中,圈选了两项等,都必须通过追访进行单选一项的问题中,圈选了两项等,都必须通过追访进行补救。补救。 另外就是回答时可能出现跳答错误的情况,这可能是因为另外就是回答时可能出现跳答错误的情况,这可能是因为被访对象没有很好的理解问题。如果出现这种情况,首先被访对象没有很好的理解问题。如果出现这种情况,首先要核实被访对象是否符合抽样调查的条件(跳答题目往往要核实被访对象是否符合抽样调查的条件(跳答题目往往是筛选条件),如果符合,进行追问补充,如果不符合条是筛选条件),如果符合,进行追问补充,如果不符合条件,问卷只能作废,重新补充样本。件,问卷只能作废,重

    29、新补充样本。 问卷的回收、检查与校订可能是非常繁琐、且工作时间很问卷的回收、检查与校订可能是非常繁琐、且工作时间很长的工作,但是却是保证数据处理过程中较少误差的重要长的工作,但是却是保证数据处理过程中较少误差的重要的步骤。的步骤。三、编三、编 码码 编码是指用代码来表示各组数编码是指用代码来表示各组数据资料使使其成为可进行计算据资料使使其成为可进行计算机处理和分析的信息。机处理和分析的信息。 编码可以按照预先编码或事后编码可以按照预先编码或事后编码来进行。编码来进行。问题问题025:您认为打工的外地人对北京市的社会秩:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)序是否有影响?(单选

    30、)1有很大影响 2有较大影响 3没有影响 4不好说 4编码答案 编码的步骤:1)确定变量;变量:变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名变量名和变量值变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问问题题和变量变量。问题问题009:您有几个儿子?几个女儿?:您有几个儿子?几个女儿? 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值编码需要以下几个步骤编码需要以下几个步骤 2) 每个需要编码的项目都必须有一份编码表,将问题和每个需要编码的项目都必须有一份编码表,将问题和项目的代码详细的标注

    31、在编码表的顶端位置,由于事先不项目的代码详细的标注在编码表的顶端位置,由于事先不知道会有多少新的代码或答案出现,所以一定要预备足够知道会有多少新的代码或答案出现,所以一定要预备足够的空间。的空间。2)制作编码表变量名变量名码位码位码数码数尺度尺度编码编码不适用不适用不知道不知道未回答未回答缺失值缺失值备注备注num1-44IntervalDirectW0151CategoryD99W01a6-72ID9999W0281CD99W0391OrdinalD99W04101OD0,9W05.1111C0-199W05.2121C0-199W05.3131C0-199W05.4141C0-199W05

    32、.5151C0-199W05.6161C0-199W05.7171C0-199W06181CD99W07191CD79W08.120-212ID97989999W08.222-232ID97989999W08.324-252ID97989999直接过录直接过录0-1编码编码变量名变量名: 一个数据文件中一个数据文件中,一个变量只能有一个唯一名称。一个变量只能有一个唯一名称。码位:某一变量在码位:某一变量在数据文件中占据的栏位数据文件中占据的栏位码数:码数:某一变量由几位数组成。某一变量由几位数组成。该变量是数值型(该变量是数值型(Numeric)如定距、定比,如定距、定比,还是字串型(还是字串

    33、型(String),如定类、定序。),如定类、定序。前者在统计中可以做高级运算,后者则不可以。前者在统计中可以做高级运算,后者则不可以。不适于被访人回答的问题的编码。不适于被访人回答的问题的编码。一般采用一般采用7,97,997等。等。被访人回答不知道时的编码。被访人回答不知道时的编码。一般采用一般采用8,98,998等。等。被访人拒绝回答某变量时的编码。被访人拒绝回答某变量时的编码。一般采用一般采用9,99,999等。等。问卷中出现漏答时的处理编码。问卷中出现漏答时的处理编码。一般采用一般采用9,99,999等。等。问题问题 001:您的性别:您的性别:1男2女问题问题 002:您目前的婚姻

    34、状况:您目前的婚姻状况(单选) :(单选) :1未婚2已婚3离婚后未再婚4离婚后再婚5丧偶后未再婚6丧偶后再婚7未婚同居23问问 题题 011: 您您 家家 中中 是是 否否 有有 下下 列列 物物 品品 : ( 可可 多多 选选 )1 电 话2 传 真 机3 有 线 电 视4 卫 星 电 视5 大 哥 大6 B P 机100011 如果编码的工作由一个编码员完成,出现错误的可能性如果编码的工作由一个编码员完成,出现错误的可能性相对较小。但实际上,因为需要编码的问题可能很多,一相对较小。但实际上,因为需要编码的问题可能很多,一个认识没有办法按时完成的,这就需要多个编码员。在这个认识没有办法按时

    35、完成的,这就需要多个编码员。在这样的情况下,一定要注意多个编码员工作的协调。样的情况下,一定要注意多个编码员工作的协调。 应该安排编码员在不同的时间,或者相同的时间相同的地应该安排编码员在不同的时间,或者相同的时间相同的地点,使用同一个编码表。这样可以避免编码重复的情况。点,使用同一个编码表。这样可以避免编码重复的情况。注意事项注意事项注意事项注意事项 (3) 研究人员应详细制定编码的守则,指导编码员如何研究人员应详细制定编码的守则,指导编码员如何识别答案,并且将其归类,以及如何分配编码等等,并同识别答案,并且将其归类,以及如何分配编码等等,并同时对编码的过程进行监督和检查。时对编码的过程进行

    36、监督和检查。 (4) 可以对可以对“不知道不知道”、“无所谓无所谓”、“不清楚不清楚”、“缺失缺失”事先规定,但是一定要注意规定的编码与实现对事先规定,但是一定要注意规定的编码与实现对该问题的最大编码的预计的数量一致。该问题的最大编码的预计的数量一致。 (5) 编码的字迹必须清楚,如果可能的话,及时的进行编码的字迹必须清楚,如果可能的话,及时的进行计算机的录入管理。计算机的录入管理。表5.1 公司年终考核表表5.2 公司年终考核表编码表 1.数据文件的结构 数据文件是为了某一特定目的而形成的同类记录的集合,数据的组织方式及内在联系的表示方式决定着数据处理的效率,因而设计数据文件的结构是数据处理

    37、工作的主要内容之一。 2.文件的格式 5.1.3 编码说明书 编码说明书(codebood)是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编 码值之间一一对应关系的文件。表5.3 编码明细表续表续表 5.1.4 预编码 为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码(precoding)。 5.1.5 后编码 后编码是整理开放式问题答案并对其进行编码的有效方法。 5.2 表列 5.2.1 单向表列四、数据录入四、数据录入数据录入是指将问卷或编码表中的每一个项目对应的代码转化成计数据录入是指将问卷或编码表中的每一个项目对应的代码转化成计算机能够识别的

    38、形式的过程。这个过程需要数据录入装置(计算机)算机能够识别的形式的过程。这个过程需要数据录入装置(计算机)和一个存储介质(数据库软件、磁盘)。市场调查发达的国家在数和一个存储介质(数据库软件、磁盘)。市场调查发达的国家在数据的采集中使用据的采集中使用CATI、CAPI的方式很普遍,因此键盘录入的过程已的方式很普遍,因此键盘录入的过程已在访问的时候就已经完成了。而且对于简单的问卷调查,使用调查在访问的时候就已经完成了。而且对于简单的问卷调查,使用调查卡进行光学扫描录入也能从时间上节约不少成本。但是国内目前主卡进行光学扫描录入也能从时间上节约不少成本。但是国内目前主要还是纸面问卷调查的形式居多,所

    39、以在问卷完成后,还需要对问要还是纸面问卷调查的形式居多,所以在问卷完成后,还需要对问卷进行录入的操作。卷进行录入的操作。数据录入要求做到准确无误。控制录入误差的方数据录入要求做到准确无误。控制录入误差的方法有:重复录入、预值控制、平衡检测。法有:重复录入、预值控制、平衡检测。 如将在如将在图图15-1问卷的编码问卷的编码中出现的问题进行录入,中出现的问题进行录入,问卷编号,城市编码,调查员编号,问卷编号,城市编码,调查员编号,Q1、Q2、Q3LLQ12-1、Q12-2、Q12-3、Q13、Q14,对,对应的数据库结构应的数据库结构见图见图15-2。 这样,输入时每份问卷按数据库中指定的位置输这

    40、样,输入时每份问卷按数据库中指定的位置输入相应变量的取值,一行数字就是一份问卷。结入相应变量的取值,一行数字就是一份问卷。结果所有问卷次依输入完毕就形成一个数据库。果所有问卷次依输入完毕就形成一个数据库。 (1) 问卷编码是问卷编码是001号,城市是北京市,号,城市是北京市,12号号调查员完成的问卷,圈选的结果是:调查员完成的问卷,圈选的结果是:Q1男性;男性;Q230岁;岁;Q3大学专科;大学专科;LL Q12圈选的圈选的2 3 5;Q13 非常同意;非常同意;Q14不同意;不同意;(2) 问卷编码是问卷编码是005号,城市是上海市,号,城市是上海市,2号调号调查员完成的问卷,圈选的结果是:

    41、查员完成的问卷,圈选的结果是:Q1女性;女性;Q222岁;岁;Q3大学本科;大学本科;LL Q12圈选的圈选的1 3;Q13 不同意;不同意;Q14非常同意;非常同意;对应的数据库对应的数据库1)001112130423552;2)005202222513045 如果在录入过程中,没有实行双机录入(三机录入)的措如果在录入过程中,没有实行双机录入(三机录入)的措施,在录入完成之后,有必要对数据进行全面的整理检查。施,在录入完成之后,有必要对数据进行全面的整理检查。数据整理主要是尽可能的处理错误或不合理的信息以及进数据整理主要是尽可能的处理错误或不合理的信息以及进行一致性的检查。虽然经过回收问卷

    42、、编码过程以及录入行一致性的检查。虽然经过回收问卷、编码过程以及录入的重重检查,但是数据的整理过程是使用计算机进行的,的重重检查,但是数据的整理过程是使用计算机进行的,对数据的矫正将更为彻底。对数据的矫正将更为彻底。数据整理可使用数据整理可使用SPSS或或SAS统计软件进行,可以很统计软件进行,可以很方便的寻找出超出选项范围、极端值或逻辑上不一样的数方便的寻找出超出选项范围、极端值或逻辑上不一样的数据。据。 小值、最大值等统计分析,超出范围的数据和极小值、最大值等统计分析,超出范围的数据和极端的数值很容易检查出来。例如,端的数值很容易检查出来。例如,图图15-1问卷的问卷的编码编码的调查中,关

    43、于年龄的填写,假定缺失值为的调查中,关于年龄的填写,假定缺失值为“0”,如果出现小于,如果出现小于16,或者大于,或者大于60的数值就是的数值就是超出范围的。根据对应的问卷编号,变量编码找超出范围的。根据对应的问卷编号,变量编码找出问卷,进行核实。出问卷,进行核实。数据整理是对数据进行的最后一道检查程序,数据整理是对数据进行的最后一道检查程序,这一步完成后,数据应该是这一步完成后,数据应该是“整齐、干净的整齐、干净的”,然后进入下一步,对数据进行统计处理分析。然后进入下一步,对数据进行统计处理分析。問卷資料的輸入與計算問卷資料的輸入與計算1.单选题单选题 可以依照题目编号设定为编号,可以依照题

    44、目编号设定为编号,变量名称,变量名称, 例如第例如第1题设为题设为X1 、第、第2题设为题设为X2 、依此类推。、依此类推。問卷內容的問題方向問卷內容的問題方向 品質滿意度品質滿意度 題目題目 1 , 2 , 3 , 4 企業形象企業形象 題目題目 5, 6, 7 購買意願購買意願 題目題目 8, 9, 10負面問題的處理負面問題的處理 為何題目內容要設計負面問題?為何題目內容要設計負面問題? 負面問題負面問題 題目題目 2, 4, 6 1 分分 5 分分 2 分分 4 分分 3 3 4 2 5 12.复选题复选题 多重应答(多重应答(Multiple Response),),又称多选题,是市

    45、场调查研究中十分又称多选题,是市场调查研究中十分常见的数据形式。常见的数据形式。 两种数据录入方式两种数据录入方式 比如说在某次民意调查中,我们希望比如说在某次民意调查中,我们希望了解公众评价宜居城市时,到底是城了解公众评价宜居城市时,到底是城市的哪一些特征决定人们对该城市宜市的哪一些特征决定人们对该城市宜居性的评估。为此,我们在研究中设居性的评估。为此,我们在研究中设计了计了14项标准请被访者从中选出他们项标准请被访者从中选出他们在进行宜居评价时最看重的在进行宜居评价时最看重的5项标准项标准 (1)多重二分法()多重二分法(Multiple dichotomy method) 对于多项选择题

    46、的每一个选项看作一个变对于多项选择题的每一个选项看作一个变量来定义。量来定义。0代表没有被选中,代表没有被选中,1代表被选代表被选中。这样,多项选择题中有几个选项,就中。这样,多项选择题中有几个选项,就会变成有几个单选变量。这些单选变量的会变成有几个单选变量。这些单选变量的选项都只有两个,即选项都只有两个,即0或或1。 比如在上述例子中,我们就可以设置比如在上述例子中,我们就可以设置14个个单选变量,来标示某选项是否被选中;单选变量,来标示某选项是否被选中; (2)多重分类法()多重分类法(Multiple category method)。)。 多项选择题中有几个选项,就定义几个单选变量。每

    47、个变多项选择题中有几个选项,就定义几个单选变量。每个变量的选项都一样,都和多项选择题的选项相同。每个变量量的选项都一样,都和多项选择题的选项相同。每个变量代表被调查者的一次选择,即纪录的是被选中的选项的代代表被调查者的一次选择,即纪录的是被选中的选项的代码。码。 如上述例子中,我们可以设置如上述例子中,我们可以设置X1X5共共5个变量,每个变个变量,每个变量的选项兼为从量的选项兼为从1到到14的的14项宜居标准。项宜居标准。 很多情况下,当问卷中不限定被访者可选择的选项数量时,很多情况下,当问卷中不限定被访者可选择的选项数量时,被调查者可能不会全部选项都选,因此在数据录入时,一被调查者可能不会

    48、全部选项都选,因此在数据录入时,一般从这些变量的最前面几个变量开始录入,这样最后面几般从这些变量的最前面几个变量开始录入,这样最后面几个变量自然就是缺失值。当被调查者对多项选择题中的选个变量自然就是缺失值。当被调查者对多项选择题中的选项全部选择时,这些变量中都有一个选项代码,此时没有项全部选择时,这些变量中都有一个选项代码,此时没有缺失值。缺失值。 事实上,假如被访者所选择的各项选之间不涉及顺序问事实上,假如被访者所选择的各项选之间不涉及顺序问题(如上述例子中,不需要受访者给出哪种因素最重要,题(如上述例子中,不需要受访者给出哪种因素最重要,哪种次重要),那么这两种输入方法所表达的数据信息是哪

    49、种次重要),那么这两种输入方法所表达的数据信息是一样的。但在实际操作中,如果选择项较多,而被调查者一样的。但在实际操作中,如果选择项较多,而被调查者最多只选择其中少数几项时,采用多重二分法录入就显得最多只选择其中少数几项时,采用多重二分法录入就显得繁琐,输入数据时容易出错。繁琐,输入数据时容易出错。 尤其是当样本量增大时,采用多重二分法录入就大大增加尤其是当样本量增大时,采用多重二分法录入就大大增加了录入的工作量,不利于提高工作效率。为此,一般的市了录入的工作量,不利于提高工作效率。为此,一般的市场调查公司大都采用多重分类法的录入方式。场调查公司大都采用多重分类法的录入方式。 大多数问卷的大多

    50、数问题都是封闭式的,在调查大多数问卷的大多数问题都是封闭式的,在调查之前就已经完成了编码的过程,即每一组问题的之前就已经完成了编码的过程,即每一组问题的不同答案的数字编码已经确定。不同答案的数字编码已经确定。而开放式问题,因为不知道会得到什么答案,或而开放式问题,因为不知道会得到什么答案,或者是希望得到比列出的封闭式的选项更详尽的答者是希望得到比列出的封闭式的选项更详尽的答案,所以在调查结束后,必须对这些开放式的问案,所以在调查结束后,必须对这些开放式的问题题进行事后编码。进行事后编码。开放题的事后编码的工作量很开放题的事后编码的工作量很大,无法预知会出现多少个新的代码和答案,而大,无法预知会

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第八章问卷检验与数据的录入(讲课)分析课件.ppt
    链接地址:https://www.163wenku.com/p-2263310.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库