数据分布特征的度量课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据分布特征的度量课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 度量 课件
- 资源描述:
-
1、2022-8-171第第4 4章章 统计数据分布特征的度量统计数据分布特征的度量统计学统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-172第第4 4章章 统计数据分布特征的度量统计数据分布特征的度量一、集中趋势的度量一、集中趋势的度量二、离散趋势的度量二、离散趋势的度量三、偏态和峰态的度量三、偏态和峰态的度量四、四、ExcelExcel在数据分布特征度量中的应用在数据分布特征度量中的应用统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-173本章学习目标本章学习目标1.1
2、.掌握反映数据集中趋势度量值掌握反映数据集中趋势度量值众数、中众数、中位数、四分位数、均值的概念及应用场合;位数、四分位数、均值的概念及应用场合;2.2.掌握反映数据离散趋势度量值掌握反映数据离散趋势度量值异众比率异众比率、四分位差、极差、平均差、方差、标准差及、四分位差、极差、平均差、方差、标准差及离散系数的概念及应用场合;离散系数的概念及应用场合;3.3.了解反映数据分布形态度量值了解反映数据分布形态度量值偏态系数偏态系数和峰态系数的测度方法;和峰态系数的测度方法;4.4.熟练运用熟练运用ExcelExcel进行描述统计量分析。进行描述统计量分析。统计学统计学统计学统计学统计学统计学STA
3、TISTICSSTATISTICSSTATISTICS2022-8-174众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差四分位差四分位差异众比率异众比率四分位数四分位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-175一、集中趋势的度量一、集中趋势的度量(一)众数(一)众数(二)中位数与四分位数(二)中位数与四分位数(三)均值(三)均值(四)众数、中位数与均值的比较(四)众数、中位数与均值的比较统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-
4、1761.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.从不同的角度考虑,反映集中趋势的测度值有多个从不同的角度考虑,反映集中趋势的测度值有多个 集中趋势集中趋势统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1771.出现次数最多的变量出现次数最多的变量值,用值,用m mo o表示表示 2.不受极端值的影响不受极端值的影响3.主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和数值型
5、数据数值型数据4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.众数只有在数据较多时才有意义,当数据众数只有在数据较多时才有意义,当数据量较少时,不宜使用众数。量较少时,不宜使用众数。(一)众数(一)众数(mode)(mode)0m统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-178无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:3 5 7 5 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42统计学统计学统计学统计学统计学统计学STATISTICSSTATI
6、STICSSTATISTICS2022-8-179这里的变量为“饮料品牌”,不同饮料的品牌就是变量值。在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即mo可口可乐1.1.根据未分组数据或单项分组确定众数根据未分组数据或单项分组确定众数序号ABCDE12345678910旭日升冰茶露露旭日升冰茶可口可乐百事可乐可口可乐汇源果汁可口可乐露露可口可乐可口可乐旭日升冰茶可口可乐百事可乐露露旭日升冰茶旭日升冰茶百事可乐可口可乐旭日升冰茶旭日升冰茶可口可乐可口可乐旭日升冰茶露露旭日升冰茶可口可乐露露百事可乐百事可乐汇源果汁露露百事可乐可口可乐
7、百事可乐汇源果汁可口可乐汇源果汁可口可乐汇源果汁露露可口可乐旭日升冰茶百事可乐露露汇源果汁可口可乐百事可乐露露旭日升冰茶统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1710这里的数据为这里的数据为顺序数据。变量为顺序数据。变量为“回答类别回答类别”甲城市中对住甲城市中对住房表示不满意的户房表示不满意的户数最多,为数最多,为108108户户,因此众数为,因此众数为“不不满意满意”这一类别,这一类别,即即 m mo o不满意不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%)非常不满意 不满意 一般 满意
8、 非常满意24108934530836311510合计300100.0统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1711产品数(件)工人人数(人)1718192028105合计25解:解:表中日加表中日加工产品数为变工产品数为变量,变量值量,变量值1919的工人人数最的工人人数最多,即出现次多,即出现次数最多,所以数最多,所以Mo19件件统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17122.2.根据组距分组数据确定众数根据组距分组数据确定众数 首先,要确定众数
9、所在的组,若为等距分组数据,首先,要确定众数所在的组,若为等距分组数据,次数最多的那个组就是众数所在组;若为异距分组数据,次数最多的那个组就是众数所在组;若为异距分组数据,需将其换算为次数密度(或标准组距次数),换算后次需将其换算为次数密度(或标准组距次数),换算后次数密度最多的一组才是众数所在组。数密度最多的一组才是众数所在组。然后,运用差值公式来计算众数的近似值。然后,运用差值公式来计算众数的近似值。下限公式:下限公式:dlm2110上限公式:上限公式:dum2120 表示众数所在组的下限表示众数所在组的下限 表示众数所在组的上限表示众数所在组的上限 表示众数所在组的频数与其下限的邻组频数
10、之差 表示众数所在组的频数与其上限的邻组频数之差 众数所在组的组众数所在组的组距距 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1713 某地区利润额的频数分布某地区利润额的频数分布按利润额分组(万元)企业数(个)200-30019300-40030400-50042500-60018600以上11合计120【例】dlmo211(万元)33.433100241212400om统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1714解解:首先,确定众数所在组。本例为等距
11、分组数据首先,确定众数所在组。本例为等距分组数据,频数数值最大的组就是众数所在组。即企业数最多,频数数值最大的组就是众数所在组。即企业数最多的组的组“400-500”400-500”就是众数所在组。就是众数所在组。然后,运用众数的插值公式计算众数。然后,运用众数的插值公式计算众数。dlm2110(万元)33.433100)1842()3042(3042400(万元)33.433100)1842()3042(18425002120dum统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1715排序后处于中间位置上的值排序后处于中间位置上
12、的值m me e50%50%50%50%主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据 不受极端值的影响,不受极端值的影响,在总体标志值差异很大时,在总体标志值差异很大时,具有较强的代表性。具有较强的代表性。各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即(二)中位数与四分位数(二)中位数与四分位数1.中位数中位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1716 变量值变量值 3 3 4 4 5 5 5 5 6 6 9 9 1010
13、中位数中位数 5 5平均值平均值 6 6与中位数离差与中位数离差 -2 -1 0 0 1 4 5-2 -1 0 0 1 4 5与平均数离差与平均数离差 -3 -2 -1 -1-3 -2 -1 -1 0 3 4 0 3 4绝对绝对数值数值之和之和 1313 1414统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1717 首先,对数据进行排序,然后确首先,对数据进行排序,然后确定中位数的位置;定中位数的位置;最后,确定中位数的具体数值。最后,确定中位数的具体数值。原始数据:原始数据:分组数据分组数据统计学统计学统计学统计学统计学统计学
14、STATISTICSSTATISTICSSTATISTICS2022-8-1718(1 1)根据未分组数据确定中位数)根据未分组数据确定中位数为偶数为奇数nnmnnne xx2 1 x)12()2()21(统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1719【例【例】某汽车公司的营销部经理随机抽取某汽车公司的营销部经理随机抽取9 9个汽车销售个汽车销售门店了解门店了解5 5月份的汽车销售情况,获得的汽车销售额月份的汽车销售情况,获得的汽车销售额(单位:万元)数据分别为:(单位:万元)数据分别为:700700、400400、200
15、200、10001000、10001000、12001200、14001400、10001000、12001200。试计算这。试计算这9 9个汽车销个汽车销售门店销售额的中位数。售门店销售额的中位数。解:解:首先,对销售额(万元)数据进行排序,依次为:首先,对销售额(万元)数据进行排序,依次为:200200、400400、700700、10001000、10001000、10001000、12001200、12001200、14001400;然后,计算中位数位置:然后,计算中位数位置:521921n最后,找出第最后,找出第5 5个位置的变量值,即个位置的变量值,即(万元)1000)21(nex
16、m。统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1720【例】:10个家庭的人均月收入数据个家庭的人均月收入数据排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10 统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1721中位数的位置为 300/2150 从累计频数看,中位数在“一般”这一组别中。因此 me=一般一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累
17、计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300(2 2)根据单项分组数据确定中位数)根据单项分组数据确定中位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1722【例【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800 xf计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。em统计学统计学统计学统
18、计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1723(3 3)根据组距分组数据计算中位数)根据组距分组数据计算中位数第一步,根据中位数位置及累计次数确定中位数组;第一步,根据中位数位置及累计次数确定中位数组;第二步,用插补公式计算中位数的近似值。第二步,用插补公式计算中位数的近似值。dfcflmmme12下限公式:dfcfummme12上限公式:表示比中位数所在组下表示比中位数所在组下限小的各组累计次数限小的各组累计次数 表示比中位数所在组上表示比中位数所在组上限大的各组累计次数限大的各组累计次数 统计学统计学统计学统计学统计学统计学STATIST
19、ICSSTATISTICSSTATISTICS2022-8-1724某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200400400600600以上373283104250合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。Xf统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1725排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值不受极端值的影响不受极端值的影响主要用于顺序数据,也可用于数值型数据,主要用于顺序数据,也可用
20、于数值型数据,但不能用于分类数据但不能用于分类数据 计算方法与中位数的类似。计算方法与中位数的类似。qlqmequ25%25%25%25%2.四分位数四分位数统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1726原始数据:原始数据:分组数据:分组数据:四分位数位置的确定四分位数位置的确定统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1727【例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2
21、000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 1 2 3 4 5 6 4 5 6 7 8 9 9统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1728 ql位置=(300)/4=75 qu位置=(3300)/4 =225 从累计频数看,ql在“不满意”这一组别中,qu在“一般”这一组别中
22、。因此,ql=不满意,qu=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300【例】统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17291.集中趋势的最常用测度值集中趋势的最常用测度值2.一组数据的均衡点所在一组数据的均衡点所在,反映这组数据的一般水平反映这组数据的一般水平3.3.将各个数据之间的数量差异抽象掉将各个数据之间的数量差异抽象掉,体现数据的必体现数据的必然性特征然性特征4.易受极端值的影响易受极
23、端值的影响5.用于数值型数据,不能用于分类数据和顺序数据用于数值型数据,不能用于分类数据和顺序数据(三)均值(三)均值均值均值算术均值算术均值调和均值调和均值几何均值几何均值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-17301.1.算术均值算术均值(average)数据集中趋势最主要的测度值数据集中趋势最主要的测度值适用于数值型数据,不适用于用文字表示的分类数据和适用于数值型数据,不适用于用文字表示的分类数据和顺序数据顺序数据凡是总体各单位的标志值之和等于总体的标志总量时凡是总体各单位的标志值之和等于总体的标志总量时,均可使用
24、算术均值来反映总体的一般水平。,均可使用算术均值来反映总体的一般水平。算术均值通常用算术均值通常用“”“”表示,其基本计算公式为:表示,其基本计算公式为:x总体单位总量总体标志总量算术均值x统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1731设一组数据为:x1,x2,xn或各组的组中值为:x1,x2,xk 相应的频数为:f1,f2,fk简单算术均值简单算术均值加权算术均值加权算术均值统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1732平均每人日销售额平均每人日销售
25、额元558527905440750480600520nxx某售货小组某售货小组5 5个人,某天的销售额分别个人,某天的销售额分别为为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则:元,则:【例【例】统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-8-1733【例【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)工人人数(人)总日产量(件)1011121314701003801501007001100456019501400合计8009710计算该企业该日
展开阅读全文