《统计学原理》课件第三章 数据的整理与显示.ppT
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《统计学原理》课件第三章 数据的整理与显示.ppT》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学原理 统计学原理课件第三章 数据的整理与显示 统计学 原理 课件 第三 数据 整理 显示
- 资源描述:
-
1、1、数据审核2、数据筛选3、数据排序一、数据审核审核的内容 完整性审核应调查的单位或个体是否有遗漏调查项目或指标是否填写齐全 准确性审核内容是否真实反映客观实际情况是否有错误:逻辑检查、计算检查适用性审核数据的来源、口径以及有关的背景材料数据是否符合自己分析研究的需要 时效性审核最新的数据 确认是否必要做进一步的加工整理二、数据筛选对审核中发现的无法纠正错误,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。数据筛选的内容包括将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来。数据筛选(data filter)用用ExcelExcel进行数据筛选进行
2、数据筛选 7名学生统计学原理考试成绩数据(单位:分)。名学生统计学原理考试成绩数据(单位:分)。请找出平时成绩等于请找出平时成绩等于80分的学生,卷面成绩最高的前两名学生,分的学生,卷面成绩最高的前两名学生,卷面成绩大于卷面成绩大于70小于小于85的学生;平时成绩和考勤成绩大于的学生;平时成绩和考勤成绩大于80,或者总成绩大于或者总成绩大于85分的学生。分的学生。数据排序(data rank)1、数据排序就是按一定顺序将数据排列,其目的是为了便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。2、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3、在某些场合,排序本身就
3、是分析的目的之一4、排序可借助于计算机完成(1)(2)(n)(1)(2)(n)数据排序(方法)【例3-2】仍以表3-1为例,计算总成绩并按总成绩的递增顺序排序。(一)统计分组的定义统计分组指的是根据统计研究的目统计分组指的是根据统计研究的目的和客观现象的内在特点,按照一定的标志把的和客观现象的内在特点,按照一定的标志把被研究总体划分为若干个性质不同但又有联系被研究总体划分为若干个性质不同但又有联系的组。统计分组可以使资料系统化、科学化、的组。统计分组可以使资料系统化、科学化、条理化,从而得出能够反映事物总体特征的资条理化,从而得出能够反映事物总体特征的资料。料。按品质标志进行分组,就是按研究对
4、象的某种属性特按品质标志进行分组,就是按研究对象的某种属性特征分组,能直接反映事物间质的差别,给人以明确、具体征分组,能直接反映事物间质的差别,给人以明确、具体的概念。例如,人口按性别、民族、职业、文化程度等分的概念。例如,人口按性别、民族、职业、文化程度等分组;企业按所有制分为国有、集体、联营、股份合作、其组;企业按所有制分为国有、集体、联营、股份合作、其他等组。他等组。按数量标志分组,指选择反映事按数量标志分组,指选择反映事物数量差异的数量标志作为分组标志进行分组,物数量差异的数量标志作为分组标志进行分组,例如,按学生人数分组、按人均消费水平分组、例如,按学生人数分组、按人均消费水平分组、
5、按产量分组等。按产量分组等。频数分布是在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组件的分布,又称分布数列。分布数列的两个要素:1、总体按其标志所分的组 2、组的次数或频数 (一)品质数列的编制方法(一)品质数列的编制方法(1)列出各类别(2)计算各类别的频数(3)生成频数分布表1、品质数列的编制方法、品质数列的编制方法【例3-3】一项主要针对高校教师的调查在某学校展开,调查者随机抽取了100名教师调查其文化程度。调查结果如下所示,试用Excel编制一张频数分布表。某高校100名教师文化程度频数分布表2、分类汇总的方法分类汇总的方法如果我们已经建立了一张某高校部分人事统
6、计表,如表所示。试按部门进行分类汇总。3、数据透视表(pivot table)(1)可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图(2)形成一个符合需要的交叉表(列联表)(3)注意:数据源表中的首行必须有列标题数据透视表的编制方法 仍以上题例,若按性别统计各部门的工资总额,建立一个交叉式的复合分组统计表,可使用数据透视表功能。等距分组等距分组异距分组异距分组1.将一个变量值作为一组将一个变量值作为一组2.2.适合于离散变量适合于离散变量3.3.适合于变量值较少的情况适合于变量值较少的情况单项式数列编制方法某班级某班级50名同学某科目成绩频数分布表名同学某科目成绩频数分布表1、将变
7、量值的一个区间作为一组2、适合于变量值较多的连续变量3、遵循“不重不漏”的原则4、可采用等距分组或不等距分组1.下限(low limit):一个组的最小值2.上限(upper limit):一个组的最大值3.组距(class width):上限与下限之差4.组中值(class midpoint):下限与上限之间的中点值22邻组组距下限缺上限开口组组中值邻组组距上限缺下限开口组组中值组距分组步骤1、确 定 组 数:可 以 按 美 国 学 者 斯 特 杰 斯(HA Sturges)提出的经验公式来确定)(lg3.31为观测值的个数NNK2、确定组距:组距(Class Width)是一个组的上限与下
8、限之差.组距(最大值-最小值)组数 3、统计出各组的频数,并整理成频数分布表。【例3-7】某小学图书馆2015年9月至2016年1月120天的入馆登记人数,试对数据进行分组。108120lg3.31K某小学图书馆入馆登记人数频数分布表某小学图书馆入馆登记人数频数分布表某小学图书馆入馆登记人数频数分布表某小学图书馆入馆登记人数频数分布表 为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数(或频率)之和,就需要在分组的基础上计算出累积频数(或频率)。从变量值小的一方向变量值大的一方累加频数(或频率),称为向上累积;从变量值大的一方向变量值小的一方累加频数(或频率),称为向下累积。某小
展开阅读全文