社会研究方法第四版第十一章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《社会研究方法第四版第十一章课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 研究 方法 第四 第十一 课件
- 资源描述:
-
1、第十一章 定量资料分析 目 录 第一节 资料的整理与录入 第二节 单变量统计分析 第三节 双变量统计分析 第四节 多变量统计分析 回顾回顾: : 社会调查的一般程序社会调查的一般程序 准备 阶段 调查 阶段 研究 阶段 总结 阶段 第一节 资料的整理与录入 ? 一、资料的审核一、资料的审核 ? 资料审核是资料处理的第一步工作。它是指研究者对所收集的原始资料(主要是问卷)进行初步的审阅,校正错填、误填的答案,剔出乱填、空白和严重缺答的废卷。其目的是使得原始资料具有较高的准确性、完整性和真实性,从而为后续资料整理录入与统计分析工作打下较好的基础。 ? 在资料审核中,如发现问题,可以分别不同情况予以
2、处理: ? (1)调查中已发现并经认真核实后确认的错误,可由调查者代为更正。 ? (2)资料中的可疑之处或明确有错误与出入的地方,应设法进行补充调查。 ? (3)无法进行或无需进行补充调查的情况下,剔除那些明显错误的或无把握的资料,保证真实性和准确性。 ? 资料审核的方法主要有两种,即逻辑审核与计算审核。 ? 逻辑审核,即核查资料的内容是否合乎逻辑和常识,项目之间有无互相矛盾之处,与其他有关资料进行对照是否有明显出入等等。 ? 计算审核,是针对数字资料进行的审查。要检查计算有无错误。度量单位有没有错,前后数字之间有无相互矛盾之处等等。 在前面介绍问卷设计时,我们曾指出,编码就是给每个问题及答案
3、一个数字作为它的代码。 从资料处理的角度看,编码就是用阿拉伯数字来代替问卷每一个问题的回答,或者说是将问卷中的答案转换成数字的过程。下面两个表就是一份问卷中前几个问题的答案和编码。 二、资料的转换二、资料的转换 在对问卷中的问题进行编码时,要给不同的问题分配合适的栏码,即指定该问题的编码值在整个数据文件中所处的位置。 这种栏码有时在问卷设计时就印在问卷上(每页的右边,用一条竖线与问题及答案隔开),但也有很多情况下是在问卷收回后编码时再指定。 三、数据录入 ? 录入方法:录入方法: ? 1登录表法 ? 直接录入 ? 光学扫描 ? 条形码 四、数据清理 有效范围清理 对于问卷中的任何一个变量来说,
4、它的有效编码值往往都有某种范围,而当数据中的数字超出了这一范围时,可以肯定这个数字一定是错误的。 有效范围数据清理有效范围数据清理 逻辑一致性清理 ? 逻辑一致性清理则是从另一种角度来查找数据中所存在的问题。其基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。 ?例如 性别性别/怀孕次数怀孕次数 ; 无孩子无孩子/子女个数子女个数,年龄年龄 未婚/配偶职业收入等;独生子女/兄妹个数,年龄 数据质量抽查 ? 一个很简单的例子: ?假设某个案的数据在假设某个案的数据在“文化程度文化程度”这一变量上输错了,这一变量上输错了,问卷上填答的答案是2(初中),编码值
5、也是2,但数据录入时却错敲成了3(高中及中专)。 由于3这个答案在正常有效的编码值范围中,因此,前一种方法检查不出这一错误。同时,这一变量值与其他变量之间又没有前述那样的逻辑联系,因此后一种方法也用不上。 第二节 单变量统计分析 ? 一、单变量描述统计一、单变量描述统计 ? 单变量统计分析可以分为两个大的方面,即描述统计和推论统计。描述统计的主要目的在于用最简单的概括形式反映出大量数据资料所容纳的基本信息。它的基本方法包括集中趋势分析、离散趋势分析等。而推论统计的主要目的,则是用从样本中所得到的数据资料来推断总体的情况,它主要包括区间估计和假设检验等。 描述统计 1. 1. 内容内容 ? 搜集
6、数据 ? 整理数据 ? 展示数据 2. 目的目的 ? 描述数据特征 ? 找出数据的基本规律 0 25 50 Q1 Q2 Q3 Q4 ¥ 推断统计 1.内容 ?参数估计 ?假设检验 2.目的 ?对总体特征作出推断 样本 总体 描述统计与推断统计的关系 反映客观现象的数据 总体内在的数量规律性 推断统计 (利用样本信息和概率论对总体的数量特征进行估计和检验等) 概率论 (包括分布理论、大数定律和中心极限定理等) 描述统计 (统计数据的搜集、整理、显示和分析等) 统计学探索现象数量规律性的过程 集中趋势分析 ? 集中趋势分析指的是集中趋势分析指的是用一个典型值用一个典型值来反映来反映一组数据的一般水
7、平一般水平,或者是反映这组数据向这个典型值集中的情况。 ? 这样一个典型值就被称为集中统计量。这样一个典型值就被称为集中统计量。 ? 按照处理方式不同集中统量可分为几类,两最常见的集中趋势有算术平均值、众数和中位数三种。用得最多的是平均数。 ? 1 定类层次:众值(众数) ? 其意义为,在众多数值中,出现次数最多的一个数值。 ? (1)原始资料,求众值 ? 例如:2 2,3 3,5 5,5 5,5 5,6 6,6 6,7 7,8 8 ? 出现次数最多的是5 5,其M M0=5 0=5 ? (2)次数资料,求众值 ? 例如:江村女青年找对象的标准 标准 相貌 人品 文化 健康 职业 能力 经济条
8、件 政治条件 家庭背景 感情 人数 55 122 51 104 13 29 16 13 6 82 其次数最多的为人品其次数最多的为人品122人次,所以人次,所以M0=人品人品 ? (3)分组的频数表中,频数最大的区间的组中值就是众值 区间 组中值 频数 75-79 77 1 70-74 72 3 65-69 67 5 60-64 62 10 55-59 57 4 50-54 52 2 表中频数最大的为表中频数最大的为10,对应的区间是60-6460-64,其组中值是62,所以众,所以众值值=62。 如果在一个次数中出现两个邻近的次数较多者,众数是二次数多的组中值的平均值 ? 2 定序层次:中位
9、值(中位数)(单选) 其意义为按大小顺序排列,处在一群数据中央位置的数值。 (1)原始资料,求中位值 例如:有9个人,他们的月工资分别如下: 47,42,50,51,92,112,71,83,108 首先作排列处理,从小到大排列 42,47,50,51,71,83,92,108,112 其次求中央位置 Md的位置=(N+1)2=(9+1)2=5 最后求中位置Md=71 (3)定距层次:算术平均数 ? 通常称平均数,又称均数或均值。英文为 Mean,故以M表示。如果是由变量 X计算得来的就记为 (读X杠),现在一般都以 表示样本的平均数,以U U 表示总体的平均数。 ? 算术平均数就是各个变量值
展开阅读全文