1、第三章第三章 统计整理统计整理学习目标学习目标p(一)知识目标(一)知识目标p1.了解统计整理的意义;了解统计整理的意义;p2.掌握统计整理的步骤;掌握统计整理的步骤;p3.理解统计分组的含义和作用;理解统计分组的含义和作用;p4.掌握统计分组的方法;掌握统计分组的方法;p5.了解次数分布的概念和主要类型;了解次数分布的概念和主要类型;p6.掌握统计图的种类和相应的绘制方法。掌握统计图的种类和相应的绘制方法。p(二)技能目标(二)技能目标p1.能够准确进行分组标志的选择;能够准确进行分组标志的选择;p2.能够编制变量数列;能够编制变量数列;p3.能够编制统计表;能够编制统计表;p4.能够绘制统
2、计图。能够绘制统计图。引导案例引导案例p长期以来,由于部门职责的划分,我国土地资源除了由专门的土地行长期以来,由于部门职责的划分,我国土地资源除了由专门的土地行政主管部门统一管理外,其他部门实际上也参与了对土地资源的管理,政主管部门统一管理外,其他部门实际上也参与了对土地资源的管理,如耕地、草地、林地、水域和水利设施用地、城市建设用地等归农业、如耕地、草地、林地、水域和水利设施用地、城市建设用地等归农业、林业、水利、建设等行政部门管理。这些部门在管理过程中,根据需林业、水利、建设等行政部门管理。这些部门在管理过程中,根据需要也制定了一套适合本部门的管理标准,这在一定程度上就造成我国要也制定了一
3、套适合本部门的管理标准,这在一定程度上就造成我国土地资源分类标准不统一的问题。标准不统一,直接导致各类用地的土地资源分类标准不统一的问题。标准不统一,直接导致各类用地的统计数据差异很大。例如,据有关人士研究指出,关于全国草地的实统计数据差异很大。例如,据有关人士研究指出,关于全国草地的实际面积,相关部门的统计数据相差际面积,相关部门的统计数据相差7亿亩;关于全国林地的面积,统亿亩;关于全国林地的面积,统计数据竟然相差计数据竟然相差20亿亩。土地资源基础数据数出多门,口径不一,亿亩。土地资源基础数据数出多门,口径不一,数据矛盾,对于国土资源规范化管理和国家宏观管理、科学决策带来数据矛盾,对于国土
4、资源规范化管理和国家宏观管理、科学决策带来了不利影响。如果没有一个统一的标准,很难保证土地数据的客观、了不利影响。如果没有一个统一的标准,很难保证土地数据的客观、真实、准确。鉴于上述情况,真实、准确。鉴于上述情况,土地调查条例土地调查条例(以下简称(以下简称条例条例)规定土地调查采用规定土地调查采用土地利用现状分类土地利用现状分类国家标准。根据这一规定,国家标准。根据这一规定,第二次全国土地调查和今后的日常变更调查均应采用第二次全国土地调查和今后的日常变更调查均应采用土地利用现状土地利用现状分类分类国家标准。国家标准。条例条例将国家标准纳入行政法规,为建立权威的将国家标准纳入行政法规,为建立权
5、威的土地调查数据规范体系,合理确定土地分类,保证土地调查质量和数土地调查数据规范体系,合理确定土地分类,保证土地调查质量和数据真实提供了有力的法律保障。据真实提供了有力的法律保障。问题问题p1.为什么相关部门的统计数据会相差那么大?为什么相关部门的统计数据会相差那么大?p2.你了解我国的土地分类标准吗?你了解我国的土地分类标准吗?第一节第一节 统计整理的意义和步骤统计整理的意义和步骤一、统计整理的意义一、统计整理的意义p统计整理是指根据统计研究的任务与要求,对搜集来的各统计整理是指根据统计研究的任务与要求,对搜集来的各种原始资料进行科学的分类和汇总,为统计分析提供系统种原始资料进行科学的分类和
6、汇总,为统计分析提供系统化、条理化的综合资料的工作过程。统计整理是整个统计化、条理化的综合资料的工作过程。统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。统计调查整理是统计调查的继续,又是统计分析的基础。统计调查所搜集到的资料,只能反映总体各单位的具体情况,是分所搜集到的资料,只能反映总体各单位的具体情况,是分散、零碎、表面的。只有通过科学的审核、分类、汇总等散、零碎、表面的。只有通过科学的审核、分类、汇总等整理工作,才能实现由个别到全体、由特殊到一般、由现整理工作,才能实现由个别到
7、全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,物的数量特征。否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。如表也将无法进行。如表3-1只是只是2009年世界五百强的一个年世界五百强的一个排列,还需要进一步整理。排列,还需要进一步整理。p统计整理还是积累历史资料的必要手段。统计研统计整理还是积累历史资料的必要手段。统计研究中经常要进行动态分析,这就需要有长期累积究
8、中经常要进行动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。统计整理工作来完成。二、统计整理的步骤二、统计整理的步骤p统计整理的全过程包括对统计资料的审核、分组、汇总和统计整理的全过程包括对统计资料的审核、分组、汇总和编制统计图表四个环节,需要按照一定的步骤进行。编制统计图表四个环节,需要按照一定的步骤进行。p第一,对搜集到的资料进行全面审核,以
9、确保统计资料符第一,对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误。合统计研究目的的要求,资料准确无误。p第二,根据研究目和统计分析的需要,选择整理的标志,第二,根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。统计分组是统计整理的重要内容和统计并进行划类分组。统计分组是统计整理的重要内容和统计分析的基础,只有正确的分组才能整理出有科学价值的综分析的基础,只有正确的分组才能整理出有科学价值的综合指标,并借助这些指标来揭示现象的本质与规律。合指标,并借助这些指标来揭示现象的本质与规律。p第三,在分组的基础上,将各项资料进行汇总,得出反映第三,在分组的基础
10、上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。各组和总体数量特征的各种指标。p第四,统计资料的显示。即通过编制统计表和绘第四,统计资料的显示。即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序制统计图,将整理出的资料简捷明了、系统有序地显示出来。地显示出来。p第五,对统计数据分门别类地系统积累。第五,对统计数据分门别类地系统积累。p分组、汇总和编制统计图表将会在后面的章节介分组、汇总和编制统计图表将会在后面的章节介绍,这里重点介绍数据的审核。数据的审核是对绍,这里重点介绍数据的审核。数据的审核是对调查资料进行审核是统计整理的第一步,包括以调查资料进行审核是统计整理的
11、第一步,包括以下内容。下内容。p(1)审核资料的完整性和及时性。审核资料的完整性,就是看调查)审核资料的完整性和及时性。审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。有关资料。对不报、漏报或迟报的现象都要及时查清。p(2)审核资料的正确性,是检查所填报的资料是否准确可靠。常用)审核资料的正确性,是检查所填报的资料是否准确可靠。常
12、用的审核方法有逻辑检查和计算检查两种。的审核方法有逻辑检查和计算检查两种。p逻辑检查。首先,从理论上或常识上检查资料是否有悖常理、有无逻辑检查。首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。如一张调查表中,一个人年龄是不切实际或不符合逻辑的地方。如一张调查表中,一个人年龄是9岁,岁,职业却是教师,其中必有一处填报错误。又如在某劳动密集型行业的职业却是教师,其中必有一处填报错误。又如在某劳动密集型行业的报表中,企业规模为大型,而职工人数则是报表中,企业规模为大型,而职工人数则是10人,这其中也必有一人,这其中也必有一错。其次,是检查各项目之间有无相互矛盾的地方。例如
13、,企业的净错。其次,是检查各项目之间有无相互矛盾的地方。例如,企业的净产值大于同期总产值就是明显的逻辑错误。产值大于同期总产值就是明显的逻辑错误。p计算检查,即检查各项指标的计算口径、计量单位是否符合规定,计算检查,即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。并通过各种计算方法来检查各指标间的数字是否相互衔接。p(3)历史资料的审核)历史资料的审核p在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是标含义、所属
14、时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。对不能满足现在要求、缺漏以及指标的变动趋势来检查它的正确性。对不能满足现在要求、缺漏或有疑问的资料,要进行有科学根据的推算、弥补和订正。或有疑问的资料,要进行有科学根据的推算、弥补和订正。p通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补通过上述审核,如发现有缺报
15、、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应视不同情况进行处理。报;如有不正确之处,则应视不同情况进行处理。p对于可以确定的一般错误,应及时代为更正,并通知原报单位。对于对于可以确定的一般错误,应及时代为更正,并通知原报单位。对于可疑之数或无法代为更正的错误,应要求原单位复查更正。如果所发可疑之数或无法代为更正的错误,应要求原单位复查更正。如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。对于严重的错误,应发还重新填报,并查明发生错免发生类似错误。对于严重的错误,应发还重新填报,并查明发
16、生错误的原因。误的原因。第二节第二节 统计分组统计分组一、统计分组的含义一、统计分组的含义p对社会经济现象进行分析研究,不仅需要分析研究总体的对社会经济现象进行分析研究,不仅需要分析研究总体的数量特征,而且需要对总体中各个组成部分进行分析研究,数量特征,而且需要对总体中各个组成部分进行分析研究,这样才能更全面地、深刻地认识事物的本质及其规律。这样才能更全面地、深刻地认识事物的本质及其规律。p统计分组是指根据统计研究的需要,将总体中各单位按照统计分组是指根据统计研究的需要,将总体中各单位按照一定的标志划分为若干部分(组)。一定的标志划分为若干部分(组)。p总体中的各单位在某一(些)方面是相同的(
17、即同质性),总体中的各单位在某一(些)方面是相同的(即同质性),而在其他许多方面则是不同的(即差异性),统计分组的而在其他许多方面则是不同的(即差异性),统计分组的目的是把不同性质的单位分开,把性质相同的单位合在一目的是把不同性质的单位分开,把性质相同的单位合在一起。因此,统计分组同时具有两方面的含义:对总体是起。因此,统计分组同时具有两方面的含义:对总体是“分分”,而对个体是,而对个体是“合合”。二、统计分组的作用二、统计分组的作用(一)区分社会经济现象的类型(一)区分社会经济现象的类型p统计分组的根本作用在于区分现象的性质。经济统计分组的根本作用在于区分现象的性质。经济现象千差万别,性质各
18、异,任何一批数据都存在现象千差万别,性质各异,任何一批数据都存在着差异,在进行统计分组之前,这种差异处于无着差异,在进行统计分组之前,这种差异处于无序状态,显现不出来,通过统计分组,反映出了序状态,显现不出来,通过统计分组,反映出了统计总体的基本性质和特征。分组实际上就是按统计总体的基本性质和特征。分组实际上就是按差异的大小进行分类,差异小的归入一组,差异差异的大小进行分类,差异小的归入一组,差异大的归入不同的组。因此,统计分组的结果使组大的归入不同的组。因此,统计分组的结果使组内的差异缩小,而组与组之间的差异扩大。所以内的差异缩小,而组与组之间的差异扩大。所以说,统计分组的过程就是区别事物性
19、质的过程。说,统计分组的过程就是区别事物性质的过程。p要了解各种社会经济现象的性质、特点及其相互关系,必须按某种标要了解各种社会经济现象的性质、特点及其相互关系,必须按某种标志把它们划分为性质不同的部分。例如国民经济按行业分组,可以划志把它们划分为性质不同的部分。例如国民经济按行业分组,可以划分为分为20个行业门类:个行业门类:(1)农、林、牧、渔业;农、林、牧、渔业;(2)采矿业;采矿业;(3)制造制造业;业;(4)电力、燃气及水的生产和供应业;电力、燃气及水的生产和供应业;(5)建筑业;建筑业;(6)交通、交通、运输、仓储及邮政业;运输、仓储及邮政业;(7)信息传输、计算机服务和软件业;信
20、息传输、计算机服务和软件业;(8)批批发和零售业;发和零售业;(9)住宿和餐饮业;住宿和餐饮业;(10)金融业;金融业;(11)房地产业;房地产业;(12)租赁和商务服务业;租赁和商务服务业;(13)科学研究、技术服务和地质勘探业;科学研究、技术服务和地质勘探业;(14)水利、环境和公共设施管理;水利、环境和公共设施管理;(15)居民服务和其他服务业;居民服务和其他服务业;(16)教育;教育;(17)卫生、社会保障和社会福利业;卫生、社会保障和社会福利业;(18)文化、体育文化、体育和娱乐业;和娱乐业;(19)公共管理和社会组织;公共管理和社会组织;(20)国际组织。通过分类,国际组织。通过分
21、类,可以反映我国各行业的发展,为进一步研究其水平与结构提供了便利可以反映我国各行业的发展,为进一步研究其水平与结构提供了便利条件。又如,产业可以划分为第一产业、第二产业、第三产业;经济条件。又如,产业可以划分为第一产业、第二产业、第三产业;经济类型可以划分为国有、集体、民营、合营、个体、外资、中外合资等类型可以划分为国有、集体、民营、合营、个体、外资、中外合资等多种类型。通过对比分析,可以充分揭示出各类企业的特征及其发展多种类型。通过对比分析,可以充分揭示出各类企业的特征及其发展规律。规律。p表表3-2是我国城镇居民家庭收入消费性支出按商是我国城镇居民家庭收入消费性支出按商品类别分组的统计表,
22、它将全部消费品分为八大品类别分组的统计表,它将全部消费品分为八大类,尽管它们同属于消费品,但在效用上却有类,尽管它们同属于消费品,但在效用上却有“质质”的差别。通过这种分类,可以反映我国居的差别。通过这种分类,可以反映我国居民的商品性消费中不同类别的商品所占的地位和民的商品性消费中不同类别的商品所占的地位和作用,也为进一步研究我国消费品零售额的水平作用,也为进一步研究我国消费品零售额的水平与结构提供了便利条件。与结构提供了便利条件。(二)研究总体内部结构及其变(二)研究总体内部结构及其变化化p从数量上反映总体内部的结构是统计研究的重要从数量上反映总体内部的结构是统计研究的重要任务。利用统计分组
23、,可将社会经济现象分成若任务。利用统计分组,可将社会经济现象分成若干个组成部分,计算出各组成部分的数值在总体干个组成部分,计算出各组成部分的数值在总体中所占的比重,就可揭示总体的内部构成情况。中所占的比重,就可揭示总体的内部构成情况。总体的内部结构可体现部分与整体的关系以及各总体的内部结构可体现部分与整体的关系以及各部分之间存在的差别和相互联系,反映事物从量部分之间存在的差别和相互联系,反映事物从量变到质变的过程,帮助人们掌握事物的特征,认变到质变的过程,帮助人们掌握事物的特征,认识事物的性质。如表识事物的性质。如表3-3,就从我国三次产业构,就从我国三次产业构成的变化,反映出我国经济发展产业
24、结构的变化;成的变化,反映出我国经济发展产业结构的变化;如表如表3-4,就从我国货物进出口额构成的变化,就从我国货物进出口额构成的变化,反映出我国贸易结构的变化。反映出我国贸易结构的变化。(三)探讨现象之间的依存关系(三)探讨现象之间的依存关系p社会经济现象之间都不是孤立的,而是相互联系、相互制社会经济现象之间都不是孤立的,而是相互联系、相互制约的。通过统计分组,可以揭示现象之间这种依存关系。约的。通过统计分组,可以揭示现象之间这种依存关系。统计分组是一切统计研究的基础,应用于统计工作的全过统计分组是一切统计研究的基础,应用于统计工作的全过程,是统计研究的基本方法之一。如农作物的耕作深度与程,
25、是统计研究的基本方法之一。如农作物的耕作深度与收成率之间、合理密植与农产量之间、家庭的工资收入与收成率之间、合理密植与农产量之间、家庭的工资收入与生活费支出之间、工人技术级别与产品质量之间、工人劳生活费支出之间、工人技术级别与产品质量之间、工人劳动生产率与产品成本之间、市场商品价格与其需求量之间动生产率与产品成本之间、市场商品价格与其需求量之间等等,都在一定程度上存在相互依存的关系。所有这些依等等,都在一定程度上存在相互依存的关系。所有这些依存关系,都可通过统计分组分析出影响因素与结果因素之存关系,都可通过统计分组分析出影响因素与结果因素之间的变动规律。如表间的变动规律。如表3-5,可以反映工
26、人劳动生产率与企,可以反映工人劳动生产率与企业成本利润率的关系。业成本利润率的关系。三、分组标志的选择三、分组标志的选择p分组标志,即将同质总体区分为不同组的标准或分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,而掩盖了总体在其他标志该标志下的性质差别,而掩盖了总体在其他标志下的不同。即对同一总体按不同标志进行分组会下的不同。即对同一总体按不同标志进行分组会得到不同的分组结果甚至相反的结论。分组标志得到不同的分组结果甚至相反的结论。分组标志选择不当,不但无法显示现象的根本特征,甚至选择不当,不但无
27、法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。会混淆事物的性质,歪曲社会经济的真实情况。因此,分组标志的选择是统计分组的核心问题。因此,分组标志的选择是统计分组的核心问题。为了达到统计分组的目的,在进行统计分组时要为了达到统计分组的目的,在进行统计分组时要遵循以下原则。遵循以下原则。(一一)根据统计研究的目的选择分根据统计研究的目的选择分组标志组标志p正确选择分组标志是统计分组的关键。分组标志正确选择分组标志是统计分组的关键。分组标志选择得恰当与否,直接影响到分组的科学性。统选择得恰当与否,直接影响到分组的科学性。统计总体中的个体有许多标志,选择什么标志作为计总体中的个体
28、有许多标志,选择什么标志作为分组标志,要根据统计研究的目的来确定。例如,分组标志,要根据统计研究的目的来确定。例如,要了解某单位职工的学历状况,就应选择要了解某单位职工的学历状况,就应选择“文化文化程度程度”为分组标志;要了解学生的学习情况,要为分组标志;要了解学生的学习情况,要以以“成绩成绩”为分组标志,而不能用为分组标志,而不能用“性别性别”、“年龄年龄”为分组标志,因为这些内容与要了解的为分组标志,因为这些内容与要了解的内容无关。内容无关。(二二)要选择最能够反映现象本质要选择最能够反映现象本质的标志作为分组标志的标志作为分组标志p明确了统计研究的目的,还不等于能够选择好分明确了统计研究
29、的目的,还不等于能够选择好分组标志。因为说明同一问题可能有若干个相关标组标志。因为说明同一问题可能有若干个相关标志,在进行分组时,应选择最能反映事物本质特志,在进行分组时,应选择最能反映事物本质特征的标志。征的标志。p如要研究城镇居民家庭生活水平状况时,反映居如要研究城镇居民家庭生活水平状况时,反映居民家庭生活水平的标志有:家庭人口数、就业人民家庭生活水平的标志有:家庭人口数、就业人口数、每一就业者负担人数口数、每一就业者负担人数(含本人含本人)、家庭年收、家庭年收人、平均每人年收人等。其中最能反映居民家庭人、平均每人年收人等。其中最能反映居民家庭生活水平状况的标志是生活水平状况的标志是“平均
30、每人年收入平均每人年收入”,应,应选择这一标志作为分组标志。选择这一标志作为分组标志。(三三)要考虑现象所处的历史条件和经济状况以要考虑现象所处的历史条件和经济状况以及标志内涵的变化来选择分组标志及标志内涵的变化来选择分组标志p社会经济现象随着时间、地点、条件的变化而发生变化,社会经济现象随着时间、地点、条件的变化而发生变化,其标志的内涵也会发生变化。同一分组,在过去适用,现其标志的内涵也会发生变化。同一分组,在过去适用,现在就不一定适用;在这一场合适用,在另一场合就不一定在就不一定适用;在这一场合适用,在另一场合就不一定适用。适用。例如,在计划经济时期,企业按所有制形式分组一般是分例如,在计
31、划经济时期,企业按所有制形式分组一般是分为四组,全民所有制企业、集体所有制企业、私营企业和为四组,全民所有制企业、集体所有制企业、私营企业和其他企业。而现在按企业登记注册类型可分为:其他企业。而现在按企业登记注册类型可分为:(1)国有国有企业;企业;(2)集体企业;集体企业;(3)股份合作制企业;股份合作制企业;(4)联营企联营企业;业;(5)有限责任公司;有限责任公司;(6)股份有限公司;股份有限公司;(7)私营企私营企业;业;(8)港澳台商投资企业;港澳台商投资企业;(9)外商投资企业;外商投资企业;(10)个个体企业等类型。又如,对最低生活水平的确定,就不能沿体企业等类型。又如,对最低生
32、活水平的确定,就不能沿用用20世纪八九十年代的标准,而应根据目前的生活水平世纪八九十年代的标准,而应根据目前的生活水平状况制定标准,然后再进行分组。此外,行业的划分,也状况制定标准,然后再进行分组。此外,行业的划分,也发生了很大变化。发生了很大变化。四、统计分组的方法四、统计分组的方法p统计分组的关键是选择分组标志和划分各组界限。统计分组的关键是选择分组标志和划分各组界限。因此,统计分组的方法就是指分组标志的选择和因此,统计分组的方法就是指分组标志的选择和各组界限的划分方法。各组界限的划分方法。(一)按分组标志的性质可分为(一)按分组标志的性质可分为品质标志分组和数量标志分组品质标志分组和数量
33、标志分组p品质标志是说明事物性质、属性差异的标志。按品质标志品质标志是说明事物性质、属性差异的标志。按品质标志分组是指选择反映事物属性差异的品质标志作为分组标志分组是指选择反映事物属性差异的品质标志作为分组标志进行分组。按品质标志分组能直接反映事物间质的差别,进行分组。按品质标志分组能直接反映事物间质的差别,给人以明确、具体的概念。因为事物的属性差异是客观存给人以明确、具体的概念。因为事物的属性差异是客观存在的,有些品质标志分组,由于界限清晰,分组标志有几在的,有些品质标志分组,由于界限清晰,分组标志有几种具体表现,就分成几组。例如,人口按性别、民族、职种具体表现,就分成几组。例如,人口按性别
34、、民族、职业、文化程度等分组,企业总体按所有制分为国有、集体、业、文化程度等分组,企业总体按所有制分为国有、集体、联营、股份合作、其他等组。有些品质标志分组有时也很联营、股份合作、其他等组。有些品质标志分组有时也很复杂,其相邻组之间的界限不容易划清。有些在理论上容复杂,其相邻组之间的界限不容易划清。有些在理论上容易区分,但在实际社会经济生活中却难于辨别。例如,人易区分,但在实际社会经济生活中却难于辨别。例如,人口按城乡分组,居民一般分为城市和乡村两组,但因目前口按城乡分组,居民一般分为城市和乡村两组,但因目前还存在有些既具备城市形态又具备乡村形态的地区,分组还存在有些既具备城市形态又具备乡村形
35、态的地区,分组时就需慎重考虑。其他如部门分类、职业分类也都存在同时就需慎重考虑。其他如部门分类、职业分类也都存在同样的问题。样的问题。2、数量标志、数量标志p按数量标志分组是指选择反映事物数量差异的数量标志作按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志进行分组。统计的研究对象是社会经济现象的为分组标志进行分组。统计的研究对象是社会经济现象的数量方面,因此按数量标志分组是研究分组的重点。如企数量方面,因此按数量标志分组是研究分组的重点。如企业按工人数、产值、产量等标志进行分组;而居民生活水业按工人数、产值、产量等标志进行分组;而居民生活水平则可以用收入水平、消费水平等标志来进行分
36、组。按数平则可以用收入水平、消费水平等标志来进行分组。按数量标志分组的目的,并不是单纯确定各组在数量上的差别,量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。而是要通过数量上的变化来区分各组的不同类型和性质。因此,按数量标志分组,应根据事物内在特点和统计研究因此,按数量标志分组,应根据事物内在特点和统计研究的要求,先确定总体在某数量标志的特征下有几种性质不的要求,先确定总体在某数量标志的特征下有几种性质不同的组成部分,再研究确定各组成部分之间的数量界限。同的组成部分,再研究确定各组成部分之间的数量界限。(二)正确划分各组界限(二)正确划分各
37、组界限p划分各组界限,就是要在分组标志的变异范围内,划分各组界限,就是要在分组标志的变异范围内,划定各相邻组间的性质界限或数量界限。划定各相邻组间的性质界限或数量界限。p划分各组界限,应当依据统计研究的目的和要求,划分各组界限,应当依据统计研究的目的和要求,确定总体在已选定的分组标志下有多少种性质不确定总体在已选定的分组标志下有多少种性质不同的具体表现,再研究确定各组之间的具体界限。同的具体表现,再研究确定各组之间的具体界限。p例如,人口按年龄分组,男性分为例如,人口按年龄分组,男性分为06岁、岁、717岁、岁、1859岁、岁、60岁以上;女性分为岁以上;女性分为06岁、岁、717岁、岁、18
38、54岁、岁、55岁以上。这是由岁以上。这是由于国家对男女职工规定退休年龄的不同而有所差于国家对男女职工规定退休年龄的不同而有所差别。如表别。如表3-9某村男性村民按年龄分组。某村男性村民按年龄分组。(三)简单分组、复合分组与并(三)简单分组、复合分组与并列分组列分组p1.简单分组简单分组p简单分组是对总体只按一个标志进行的分组,因简单分组是对总体只按一个标志进行的分组,因此只能说明总体某一方面的情况。此只能说明总体某一方面的情况。2.复合分组复合分组p复合分组是对总体按两个或两个以上的标志进行复合分组是对总体按两个或两个以上的标志进行的多层次分组,即在按某一标志分组的基础上再的多层次分组,即在
39、按某一标志分组的基础上再按另一标志进一步分组。如表按另一标志进一步分组。如表3-11将国家的国将国家的国内生产总值按高收入、中等收入、中低收入和低内生产总值按高收入、中等收入、中低收入和低收入来分,然后中等中又分为中等偏上、中等偏收入来分,然后中等中又分为中等偏上、中等偏下,低收入国家又分为最不发达国家和重债国家下,低收入国家又分为最不发达国家和重债国家等等。表等等。表3-12 某校教师按先性别分组、再按职某校教师按先性别分组、再按职称分组。称分组。3.并列分组并列分组p并列分组是同时用两个或两个以上的标志,分别并列分组是同时用两个或两个以上的标志,分别从不同的角度进行不重叠的多种分组。如表从
40、不同的角度进行不重叠的多种分组。如表3-13对对2010年人口数及其构成进行的分组,分别年人口数及其构成进行的分组,分别按性别、区域、年龄进行不重叠的多种分组,从按性别、区域、年龄进行不重叠的多种分组,从不同角度说明不同角度说明2010年我国人口数及其构成。年我国人口数及其构成。第三节第三节 次数分布次数分布一、次数分布的概念一、次数分布的概念p在统计分组基础上,将总体单位按组归并,形成在统计分组基础上,将总体单位按组归并,形成了总体单位在各组间的分布,称之为次数分布或了总体单位在各组间的分布,称之为次数分布或分布数列。分布数列。p分布数列是指将组别与次数按一定的顺序排列所分布数列是指将组别与
41、次数按一定的顺序排列所形成的数列。形成的数列。p次数是分布在各组的单位数叫次数,又称频数。次数是分布在各组的单位数叫次数,又称频数。p比率是各组次数与总次数之比叫比率,又称频率。比率是各组次数与总次数之比叫比率,又称频率。根据分组标志性质不同,分布数列可分为品质数根据分组标志性质不同,分布数列可分为品质数列和变量数列。品质数列是指按品质标志分组所列和变量数列。品质数列是指按品质标志分组所形成的分布数列。形成的分布数列。二、变量数列的编制二、变量数列的编制p变量数列可以分为单项数列和组距数列两种。其中组距数变量数列可以分为单项数列和组距数列两种。其中组距数列又有等距数列和异距数列之分。列又有等距
42、数列和异距数列之分。p(一)单项式分组(一)单项式分组p单项式分组就是用每一个变量值(标志值)作为一组,形单项式分组就是用每一个变量值(标志值)作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合,如表变量变动范围不大的场合,如表3-13所示。所示。p单项式变量数列的编制比较明确、容易。但是用连续变量单项式变量数列的编制比较明确、容易。但是用连续变量分组来编制分配数列时,或者虽是离散变量但数值很多且分组来编制分配数列时,或者虽是离散变量但数值很多且变化范围很大时,单项数列就不能适用,而应考虑采用组变化范围很大时,
43、单项数列就不能适用,而应考虑采用组距数列的形式。距数列的形式。(二)组距式分组(二)组距式分组p组距式分组就是将变量依次划分为几段区间,一组距式分组就是将变量依次划分为几段区间,一段区间表现为段区间表现为“从从到到”距离,把一段区间内的距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。对于连续型变量或者变动范间的距离就是组距。对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。围较大的离散型变量,适宜采用组距式分组。1.组限组限p组限是指确定每组距离的数值,它分下限和上限,下限是组限是指确定每组距离的数值,它分
44、下限和上限,下限是毎组起点数值,上限是毎组终点数值。如表毎组起点数值,上限是毎组终点数值。如表3-16中第二组中第二组“60万元万元”是下限,是下限,“70万元万元”是上限。如果变量是离散是上限。如果变量是离散型变量,并且以自然单位作为计量单位,相邻组的组限可型变量,并且以自然单位作为计量单位,相邻组的组限可以断开;如果计量单位是自然单位的扩大倍数,相邻组的以断开;如果计量单位是自然单位的扩大倍数,相邻组的组限必须重叠。如果变量是连续型变量,相邻组的组限必组限必须重叠。如果变量是连续型变量,相邻组的组限必须重叠。这时就存在数值归属问题。如须重叠。这时就存在数值归属问题。如80万元是应该归属万元
45、是应该归属于第三组于第三组“70万元万元80万元万元”还是第四组还是第四组“80万元万元90万元万元”?这时,应按?这时,应按“上组限不在内(不含上限)上组限不在内(不含上限)”的原的原则处理,反过来说,就是下限在内,即则处理,反过来说,就是下限在内,即80万元应该作为下万元应该作为下限归入第四组,其余依次类推。限归入第四组,其余依次类推。p组距式分组中,常常会遇到首末两组组距式分组中,常常会遇到首末两组“开口开口”的的情况,即用情况,即用“以下以下”表示第一组,用表示第一组,用“以上以上”表示最后一组,这些有上限无下表示最后一组,这些有上限无下限或有下限无上限的组,称为开口组。如表限或有下限
46、无上限的组,称为开口组。如表3-16中中“60万元以下万元以下”和和“100万元以上万元以上”两组。两组。p组限的确定应考虑以下几点:第一,组限的确定应有利于组限的确定应考虑以下几点:第一,组限的确定应有利于表现总体分配的规律性,组限应是决定事物性质的数量界表现总体分配的规律性,组限应是决定事物性质的数量界限。例如,按学生考试成绩分组,限。例如,按学生考试成绩分组,60分必须作为组限,分必须作为组限,因为它是及格与不及格的界限。按计划完成程度分组因为它是及格与不及格的界限。按计划完成程度分组100%必须作为组限,因为它是完成还是未完成计划的必须作为组限,因为它是完成还是未完成计划的界限。第二,
47、最低组下限应低于总体中最小变量值,最高界限。第二,最低组下限应低于总体中最小变量值,最高组上限应高于总体中最大变量值,但不应过于悬殊。第三,组上限应高于总体中最大变量值,但不应过于悬殊。第三,总体中如果出现特大或特小变量值时,最低组和最高组可总体中如果出现特大或特小变量值时,最低组和最高组可采用开口式(即只有上限或只有下限)。第四,为了方便采用开口式(即只有上限或只有下限)。第四,为了方便计算组限应尽可能取整数,最好是计算组限应尽可能取整数,最好是5或或10的整倍数。的整倍数。第第五,由于变量有连续型变量和离散型变量两种,其组限的五,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同
48、的。确定方法是不同的。2.组距组距p组距是毎组的距离,它等于上限与下限之差。如表组距是毎组的距离,它等于上限与下限之差。如表3-16第二组的组距第二组的组距=70万元万元-60万元万元=10万元万元p组距式分组中,根据各组的组距是否相等可以分为等距分组距式分组中,根据各组的组距是否相等可以分为等距分组和异距分组。组和异距分组。p(1)等距分组)等距分组p等距分组就是标志值在各组保持相等的组距,即各组的标等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄
49、、工龄、的情况下,都可采用等距分组。例如,工人的年龄、工龄、工资的分组;零件尺寸的误差、加工时间的分组;农产品工资的分组;零件尺寸的误差、加工时间的分组;农产品单位面积产量、单位产品成本的分组等等。等距分组有很单位面积产量、单位产品成本的分组等等。等距分组有很多好处,它便于绘制统计图,也便于进行各类运算。多好处,它便于绘制统计图,也便于进行各类运算。(2)异距分组)异距分组p异距分组的形式应服从分组的要求,即性质相同异距分组的形式应服从分组的要求,即性质相同的单位应合并在一个组内,性质不同的应当分开。的单位应合并在一个组内,性质不同的应当分开。现象的差别取决于现象的本质,而不在于数学形现象的差
50、别取决于现象的本质,而不在于数学形式,必须根据现象的本质特征和统计研究的目的式,必须根据现象的本质特征和统计研究的目的任务来确定分组的等距与否。在下列情况下,就任务来确定分组的等距与否。在下列情况下,就必须考虑采用异距分组。必须考虑采用异距分组。p标志值分布很不均匀的场合。例如,学生成绩标志值分布很不均匀的场合。例如,学生成绩如果密集于某一范围,如如果密集于某一范围,如60-80分或分或70-90分分之间,其它部分分布十分稀少,在这种场合若仍之间,其它部分分布十分稀少,在这种场合若仍以以10分为组距进行等距式分组,则无法显示出分分为组距进行等距式分组,则无法显示出分布的规律性,会使得这一密集的