统计学数据整理课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学数据整理课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 整理 课件
- 资源描述:
-
1、2022-6-9一、数据的预处理一、数据的预处理二、数据的分组二、数据的分组三、品质数据的整理与显示三、品质数据的整理与显示四、数值型数据的整理与显示四、数值型数据的整理与显示五、统计表五、统计表第二章:数据的整理第二章:数据的整理本讲主要内容学习导航本讲主要内容学习导航数据的整理是数据收集与数据分析之间的中间环节数据的整理是数据收集与数据分析之间的中间环节数据整理是对收集来的数据进行加工整理使之符合数据整理是对收集来的数据进行加工整理使之符合统计分析的需要。如对数据进行图表显示,以发现数统计分析的需要。如对数据进行图表显示,以发现数据中的基本规律。据中的基本规律。数据整理的中心任务就是分组与
2、编制频数分布表数据整理的中心任务就是分组与编制频数分布表统计整理的概念和意义统计整理的概念和意义 统计整理统计整理根据统计研究的任务,对统计调查根据统计研究的任务,对统计调查所收集到的大量原始资料进行加工汇总,使其系所收集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综统化、条理化、科学化,以得出反映事物总体综合特征的数据资料的工作过程。合特征的数据资料的工作过程。 统计整理是统计调查的继续,是统计分析统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上的前提和基础,在整个统计工作中,发挥着承上启下的作用。启下的作用。数据的预处理数据的预
3、处理 数据的审核数据的审核 发现数据中的错误发现数据中的错误 数据的筛选数据的筛选 找出符合条件的数据找出符合条件的数据 数据排序数据排序 发现数据的基本特征发现数据的基本特征 升序和降序升序和降序数据的预处理数据的预处理 数据的审核数据的审核(对原始数据对原始数据)-审核的内容审核的内容 完整性审核完整性审核 检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全 准确性审核准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正
4、确等检查数据是否有错误,计算是否正确等 审核数据准确性的方法审核数据准确性的方法 逻辑检查逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核主要用于对定类数据和定序数据的审核 计算检查计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错检查调查表中的各项数据在计算结果和计算方法上有无错误误 主要用于对定距和定比数据的审核主要用于对定距和定比数据的审核数据的预处理数据的预处理 数据的审核数据的审核(对第二手数据对第二手数据) 适用
5、性审核适用性审核 弄清楚数据的来源、数据的口径以及有关的背景弄清楚数据的来源、数据的口径以及有关的背景材料材料 确定这些数据是否符合自己分析研究的需要确定这些数据是否符合自己分析研究的需要 时效性审核时效性审核 应尽可能使用最新的统计数据应尽可能使用最新的统计数据 确认是否必要做进一步的加工整理确认是否必要做进一步的加工整理数据的预处理数据的预处理 数据的筛选数据的筛选 对审核过程中发现的错误应尽可能予以纠正对审核过程中发现的错误应尽可能予以纠正 当发现数据中的错误不能予以纠正,或者有些数据不当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛符合调查的
6、要求而又无法弥补时,需要对数据进行筛选选 数据筛选的内容包括:数据筛选的内容包括: 将某些不符合要求的数据或有明显错误的数据予以剔除将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出数据予以剔出 操作演示操作演示(调用调用Excel文件文件:数据的筛选数据的筛选)数据的预处理数据的预处理 数据的排序数据的排序(要点要点) 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索解决问题的线索 排序有助于对数据检查纠
7、错,以及为重新归类或分组等提供依排序有助于对数据检查纠错,以及为重新归类或分组等提供依据据 在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成排序可借助于计算机完成 数据的排序数据的排序(方法方法) 分类数据的排序分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分中也有笔画多少的升序降序之分 数值型数据的排序数值型数据的排序 递增排序:设一组数
8、据为递增排序:设一组数据为X1,X2,XN,递增排序可表示为:,递增排序可表示为:X(1)X(2)X(2)X(N) 排序后的数据我们在统计学上称之为:排序后的数据我们在统计学上称之为:“顺序统计量顺序统计量”一、数据的分组一、数据的分组 为什么要进行数据分组?为什么要进行数据分组? 通过分类发现数据内部的结构特点通过分类发现数据内部的结构特点 数据分组时的关键问题是什么?数据分组时的关键问题是什么? 选择选择分组标志分组标志:区分为不同组的标准或根据:区分为不同组的标准或根据 分组的原则:体现分组的原则:体现组内同质、组内同质、组间异质;穷尽原则;互斥原则组间异质;穷尽原则;互斥原则 数据分组
9、的类型:按品质标志分组和按数量标志分组数据分组的类型:按品质标志分组和按数量标志分组 确定各组界限确定各组界限 分组标志可以有多个么?数据分组标志可以有多个么?数据分组体系分组体系 平行分组体系平行分组体系 按一个标志对总体进行分组称为简单分组,同一总体的几个简单分组按一个标志对总体进行分组称为简单分组,同一总体的几个简单分组按某一规定排列起来就构成一个平行分组体系。按某一规定排列起来就构成一个平行分组体系。 例如:人口总体分别按性别、年龄、民族等标志进行分组,排列起来例如:人口总体分别按性别、年龄、民族等标志进行分组,排列起来就构成一个就构成一个平行分组体系平行分组体系. 复合分组体系复合分
10、组体系 一个问体同时按两个或多个标志层叠分组,就称为复合分组。复合分一个问体同时按两个或多个标志层叠分组,就称为复合分组。复合分组形成的系列就叫组形成的系列就叫。 例如:某校学生总体可先按学科分例如:某校学生总体可先按学科分(文理文理)、再按、再按(本、硕、博本、硕、博)、最后、最后再按性别分组就构成了一个三级再按性别分组就构成了一个三级复合分组体系复合分组体系。统计分组的作用 (1) 划分现象的类型划分现象的类型类型分组类型分组(2)揭示现象内部结构)揭示现象内部结构结构分组结构分组 (P48)(3)分析现象之间的依存关系)分析现象之间的依存关系分析分组分析分组 ( P48 )揭露社会经济现
11、象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。 类型分组类型分组 类型类型2000年年2001年年2002年年2003年年农业农业13 873.614 462.814 931.5 14870.1林业林业936.5938.81 033.51239.9牧业牧业 7 393.17 963.18 454.69538.8渔业渔业 2 712.62 815.02 971.13137.6合计合计24 915.826 179.627 390.829691.8例例单位:亿元说明社会经济现象的内部结构。说明社会经济现象的内部结构。 结构分组结构分组 年份年份2000200120022003
12、第一产业第一产业16.415.815.314.6第二产业第二产业50.250.150.452.5第三产业第三产业33.434.134.333.1合计合计100.0100.0100.0100.0例例我国国内生产总值构成(%)研究经济现象之间的依存关系。研究经济现象之间的依存关系。 分析分组分析分组 耕作深度分组耕作深度分组(cm)地块数地块数平均收获率平均收获率(斤斤/亩亩)10-12 740012-141046014-161654016-1818-2012 5620680例例某乡某种农作物的耕作深度与收获率的关系二、数据的整理与显示二、数据的整理与显示 一一.分类数据的整理与显示分类数据的整理
13、与显示(基本过程基本过程)1 1、列出各类别、列出各类别2 2、计算各类别的频数、计算各类别的频数3 3、制作频数分布表、制作频数分布表4 4、用图形显示数据、用图形显示数据 一一.分类数据的整理与显示分类数据的整理与显示 频频 数:落在各类别中的数据个数。数:落在各类别中的数据个数。 频频 率:某一类别数据的频数占总体单位个数的比率:某一类别数据的频数占总体单位个数的比重。重。 频数分布频数分布:把频数以表格形式全部列出就是:把频数以表格形式全部列出就是 绘制频数分布表的演示操作绘制频数分布表的演示操作(调用调用Excel文件文件:分类数分类数据的整理据的整理) 比例:各类数据与全部数据之比
14、比例:各类数据与全部数据之比 百分数:把比例基数百分数:把比例基数100化化 比率:各类数据间的比值比率:各类数据间的比值 绘制绘制饼图饼图、柱形图与条形图的演示操作、柱形图与条形图的演示操作(调用调用Excel文件文件:分类数据的整理分类数据的整理)二、顺序数据的整理与显示二、顺序数据的整理与显示二二.顺序数据的整理与显示顺序数据的整理与显示 亦可计算累计频数亦可计算累计频数(累积百分比累积百分比):将各类别的频数逐级累加:将各类别的频数逐级累加 亦可计算累计频率:将各类别的频率亦可计算累计频率:将各类别的频率(百分比百分比)逐级累加逐级累加 累积有两种:向上累积累积有两种:向上累积(沿顺序
15、方向累加沿顺序方向累加)与向下累积与向下累积(逆顺序方向累加逆顺序方向累加)表 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%) 非常不满 不满意 一般 满意 非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0演示累积分布图演示累积分布图:如何在同一图表中演示向上与向下累积分布?如何在同一图表中演示向上与向下累积分布?以本页的下图数据为例当堂演示以本页的下图数据为例当堂演示
16、演示绘制环形图演示绘制环形图:饼图只能绘制同一总体的结构,那么如何绘制多总体结构?环形图!饼图只能绘制同一总体的结构,那么如何绘制多总体结构?环形图!结合下图与上图数据堂堂绘制结合下图与上图数据堂堂绘制表 乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%) 非常不满 不满意 一般 满意 非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0甲百
17、分比(%)836311510乙百分比(%)7.033.026.021.312.7提取甲提取甲乙百分比乙百分比及回答及回答类别共类别共3列列三、数值型数据的整理与显示三、数值型数据的整理与显示频数分布表的编制频数分布表的编制数值型数据的图示数值型数据的图示频数分布的类型频数分布的类型频数分布表的编制频数分布表的编制频数分布表的编制频数分布表的编制(实例)(实例)117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 11211
18、2 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121分组方法分组方法分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组什么是单变量分组?(概念要点)1. 将一个变量值作为一组2. 适合于离散变量3. 适合于变量值较少的情况1.什么是组距分组?(概念要点)2.将变量值的一个区间作为一组3.适合于连续变量4.适合于变量值较多的情况5.必须遵循“不重不漏”的原则6.可采用等距分组,也可采用不等距分组单变量值分组表单变量值分组表(实例)表 某车间50名工人日加工零件
19、数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112组距分组组距分组(步骤)调用调用Excel文件文件组距分组组距分组(几个概念)(几个概念)1. 组限:下限(一个组的最小值)和上限(一个组的最大值)2. 全距:最大值与最小值之差3. 组距:上限与下限之差 组数=全距/组距4. 开口组:首未两组用“*以上”或“*以下”表示的叫5. 闭口组:首未两组上下限俱全的
展开阅读全文