第三章-统计整理课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三章-统计整理课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 统计 整理 课件
- 资源描述:
-
1、第一节第一节 统计整理概述统计整理概述第二节第二节 统计分组统计分组第三节第三节 频数分布频数分布第四节第四节 统计表和统计图统计表和统计图第三章第三章 统计整理统计整理 教学目的教学目的 了解统计整理的基本内容;掌握选择分组标志、编制变量数列、制作统计图表的技术和方法。能够运用统计分组理论和频数分布技术,依据客观事物的数据进行基本统计描述和分析。重点难点重点难点 统计分组的方法;变量数列的编制;统计表和统计图的制作。第一节第一节 统计整理概述统计整理概述统计整理统计整理 1.统计整理是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。2.统计整理是积累历史资料的必要手段。一、统计整理
2、的意义一、统计整理的意义二、统计整理的内容二、统计整理的内容工工 作作 内内 容容资料审核资料审核分组和汇总分组和汇总统计图表统计图表资料积累资料积累完整性完整性准确性准确性及时性及时性三、统计数据预处理三、统计数据预处理1.数据的审核与筛选数据的审核与筛选检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑 二是计算检查,检查调查中各项数据在计算方法和计算结果上有无错误,数字的计量单
3、位有没有差错等。对审核过程中发现的迟报、漏报及计算错误,应及时催报、补报、改正,并针对不同的错误作出不同的处理:(1)对于可以肯定的一般错误,应及时代为更正,并向有关单位核对;(2)对于可疑之处或无法代为更正的错误,应通知原报单位复查更正;(3)对于在一个单位发现的有代表性的重大差错,除通知原报单位更正外,还要将差错情况通报尚未报送资料的单位,以防止类似错误的发生;(4)对于严重的错误,应发还重填,并查明发生错误的原因;属于违反法规的,应依法严肃处理。2.数据的订正数据的订正 数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律,为研究者找到解决问题的线索。此外,排序还有
4、助于对数据的检查纠错,为分组、汇总提供依据。对于定类数据定类数据,可以按字母的顺序或笔画数的多少顺序排序;对于定距数据和定比数据定距数据和定比数据,可以按递增顺序排列或按递减顺序排列。排序后的数据称为顺序统计量。3.数据的排序数据的排序四、统计资料汇总四、统计资料汇总(一)统计资料的汇总技术(一)统计资料的汇总技术1.手工汇总:点线法、凭证法、过录法、折叠法、卡片法2.电子计算机汇总(二)统计汇总的组织形式(二)统计汇总的组织形式1.逐级汇总2.集中汇总3.综合汇总第二节第二节 统计分组统计分组一、统计分组的概念一、统计分组的概念统计分组统计分组 根据统计研究的目的和要求,将总体单位或全部数据
5、按照一定的标志划分成若干类型(组),使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、反映总体特征的资料。统计分组具有分与合的双重功能,是分与合的对立统一。统计分组的目的是要在同质性的基础上研究总体的内在差异性。统计分组存在一定的局限性。统计分组的关键是选择分组标志和划分各组界限。1.划分现象的不同类型划分现象的不同类型 例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济2.反映总体内部结构和特征反映总体内部结构和特征例:上海市按GDP计算的三次产业结构(%)1980年 1990
6、年 1996年 1997年 GDP 100 100 100 100第一产业3.2 4.3 2.5 2.3第二产业75.7 63.8 54.5 52.2第三产业21.1 31.9 43.0 45.5二、统计分组的作用二、统计分组的作用例:研究贫富差别的基本方法:将人口按收入水平等分为 5 组,观察收入差别。20%20%20%20%20%中国2003年:最富的20家庭拥有全部财富的41,最穷的20家庭拥有全部财富的8。3.研究现象之间的依存关系研究现象之间的依存关系 如农作物的耕作深度与收成率之间的关系、家庭收入与生活费支出之间的关系、市场商品价格与其需求量之间的关系等等,都可以通过统计分组来研究
7、。三、统计分组的原则三、统计分组的原则1.穷尽原则:使总体中的每一个单位都应有组可归。2.互斥原则:使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属于几个组。四、分组标志的选择四、分组标志的选择1.要符合统计研究的目的和要求2.必须选择最重要的标志作为分组依据3.要考虑到社会经济现象所处的具体历史条件五、统计分组的类型五、统计分组的类型(一)按照分组标志的性质不同(一)按照分组标志的性质不同 1、品质分组、品质分组2、数量分组、数量分组或称属性或称属性分组。按分组。按照照品质标品质标志志进行的进行的分组。分组。或称变量或称变量分组。按分组。按照照数量标数量标志志进行的进行的分组。
8、分组。1、简单分组、简单分组 2、复合分组、复合分组 将总体按将总体按一个标一个标志志进行分组。它进行分组。它只能从某一方面只能从某一方面说明总体的分布说明总体的分布状况和内部结构。状况和内部结构。对所研究的总体按对所研究的总体按两个或两个以上的两个或两个以上的标志标志重叠重叠起来分组。起来分组。可用于对事物多方可用于对事物多方面、多层次的分析面、多层次的分析研究。研究。(二)按照分组标志的多少和分组的形式不同(二)按照分组标志的多少和分组的形式不同 高校教师的复合分组第一标志(职务)第一标志(职务)第二标志(年龄)第二标志(年龄)第三标志(性别)第三标志(性别)高级职称(教授、副教授)45岁
9、以上男女45岁以下男女非高级职称(讲师、助教)45岁以上男女45岁以下男女 指根据统计研究的要求,对同一总体进行指根据统计研究的要求,对同一总体进行多种不多种不同的分组同的分组而成的一种相互联而成的一种相互联系,相互补充,从不同系,相互补充,从不同角度说明总体的内部状况的认识体系。角度说明总体的内部状况的认识体系。对同一总体选择两个或两个以上对同一总体选择两个或两个以上标志分别进行标志分别进行简单分组简单分组。各分组各分组标志表现并列使用。标志表现并列使用。对同一总体选择两个或两个以上对同一总体选择两个或两个以上标志分别进行标志分别进行层叠分组层叠分组。各分组各分组标志表现交叉结合使用。标志表
10、现交叉结合使用。3、分组体系、分组体系 平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2复合分组体系复合分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类统计分组的程序与原则统计分组的程序与原则选择分组选择分组标志标志确定分组确定分组体系体系总体单位总体单位归类归类科学性:科学性:组间差异组间差异大,组内大,组内差异小。差异小。完备性和互斥完备
11、性和互斥性:性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。等距分组等距分组异距分组异距分组单项式分组单项式分组组距式分组组距式分组分组方法分组方法按品质标志分组按品质标志分组按数量标志分组按数量标志分组六、统计分组方法六、统计分组方法(一)品质标志分组(一)品质标志分组 选择反映事物属性差异的标志作为分组依据。2.复杂品质标志分组 复杂品质分组指分组标志选定以后组间界限不易划分,存在交叉过渡形态,总体中的各单位归并于何组比较困难的统计分组。这种分组又叫分类。1.简单品质标志分组 简单品质分组指分组标志一经确定,组的名称和组数也就随之确定,而且各单位应分在哪一组也比较明确,
12、不存在组与组之间界限区分困难的分组。(二)数量标志分组(二)数量标志分组选择反映事物数量方面的差别的标志作为分组依据。单项式分组单项式分组指用指用单一的数值单一的数值作为分组标志作为分组标志的分组。每个数值作为一个组。的分组。每个数值作为一个组。如某班学生按年龄分组:如某班学生按年龄分组:17岁,岁,18岁,岁,19岁,岁,20岁,岁,21岁,岁,22岁。岁。己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23
13、.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。组距式分组组距式分组将作为分组依据的数量标志的整个将作为分组依据的数量标志的整个取取值范围值范围依次划分为若干个满足互斥性依次划分为若干个满足互斥性和包容性的区间,用这些和包容性的区间,用这些数值区间数值区间作作为组的名称。为组的名称。某班学生统计学某班学生统计学成绩分组成绩分组60分以下分以下6070分分7080分分8090分分90分以上分以上组距式分组中的一些概念组距式分组中的一些概念组限组限上限上限下限下限区间数值的区间数值的最大值最大值区间数值的区间数值的最小值最小值如果分组标志是连续型变量,则组限一般用重合式表达;如果分组
14、标志是离散型变量,则组限一般用不重合式表达。重合式重合式 相邻两组中,前一组的上限与后一组的下限数值相重叠。一般按“上限不在内”的原则处理。不重合式不重合式 前一组的上限与后一组的下限两变量值紧密相连但不重叠。组数组数分组的个数分组的个数等距分组组距=(最大值-最小值)/组数组数与组距成反比,即组数少,则组距大;组数多,组数与组距成反比,即组数少,则组距大;组数多,则组距小。则组距小。组距组距每一组的区间长度每一组的区间长度组距组距=上限上限-下限下限 开口组开口组缺少上限数值或下限数值的组缺少上限数值或下限数值的组各组组距都相等的分组称为等距分组。各组组距不相等的分组则称为异距分组,或称不等
15、距分组。组中值组中值每一组每一组中点位置中点位置的数值的数值注意注意开口组以相邻组的组距作为该组的组距,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。确定其下限或上限,再计算组中值。缺上限开口组的组中值2邻组的组距下限 缺下限开口组的组中值2-邻组的组距上限重合式组限组的组中值2下限上限非重合式组限组的组中值2后一组下限本组下限销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上
16、组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)七、统计资料的再分组七、统计资料的再分组 统计资料的再分组是指把统计分组资料按某种要求重新划定各组界限,再将资料中的单位数或比重分布做出相应的调整。再分组的步骤如下:1.确定再分组的各自范围。2.计算新组各自相连组的比例。可用相连组的部分组距除以相连组的组距之和而求得。3.确定再分组的对应单位数。即计算各组变量值的区间范围所对应的单位数。再分组中用比例分摊相应的单位数是假定现象为均匀变动,而客观情况并非完全如此,故再分组的结果
17、一般表现为近似值。某工业部门劳动生产率分组表某工业部门劳动生产率分组表组号按劳动生产率分组(千元/人)企业数比例(%)职工数比例(%)总产值比例(%)123456789106以下677889910101111121213131414以上11141015209124236.209.4810.7816.2620.0012.9311.545.402.694.729.6612.8313.0016.7819.1210.989.043.821.842.93合 计100100.00100.00某工业部门劳动生产率再分组表某工业部门劳动生产率再分组表组别按劳动生产率分组(千元/人)企业数比例(%)职工数比例(
18、%)总产值比例(%)ABCD7.5以下7.5101012.512.5以上304023721.0741.6527.1710.1128.9942.4021.93 6.68合 计100100.00100.00第三节第三节 频数分布频数分布一、频数分布的概念一、频数分布的概念在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,又称为次数分布或分配数列。ffff频率有两个性质:(1)01,(2)1 各组分配的总体单位数各组分配的总体单位数各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重频数分布单项数列组距数列 变量数列品质数列等距数列异距数列
19、按分组标志和分组形式的不同可分成如下类别:二、频数分布的种类二、频数分布的种类20092009年末我国大陆人口的城乡分布年末我国大陆人口的城乡分布按城乡别分组人口(万人)f构成(%)f/f总人口城镇乡村1334746218671288100.0 46.6 53.4品质频数分布品质频数分布某高校在校学生年龄分布某高校在校学生年龄分布按年龄分组(岁)学生人数(人)f比重(%)f/f171819202122235418922828313197245.418.822.728.113.0 9.6 2.4合 计1006100.0单项式频数分布单项式频数分布某集团公司职工分组表按月工资分组(元)职工人数(人
20、)f比重(%)f/f2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6合 计1262100.0组距式频数分布组距式频数分布三、累计频数和累计频率三、累计频数和累计频率 累计频数和累计频率是将变量频数分布中各组频数或频率依次累加而得到的各组累计频数或累计频率。从变量值低的组开始,将各组次数(频从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。组上限以下各组的累计次数(频率)
21、。从变量值高的组开始,将各组次数(频从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。组下限以上各组的累计次数(频率)。某集团公司职工基本工资分组表按月工资分组(元)职工人数(人)比重(%)向上累计向下累计人数比重%人数比重2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6501222277141082120312624.09.718.056.685.895.4100.0
展开阅读全文