统计数据的描述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计数据的描述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 描述 课件
- 资源描述:
-
1、2022-4-161第三章第三章 数据分布特征的描述数据分布特征的描述2022-4-1623.1.1 什么是集中趋势什么是集中趋势(central tendency)2022-4-1633.1.2 分类数据分类数据-众数众数1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据2022-4-164众数(不惟一性)n无众数无众数原始数据: 10 5 9 12 6 85有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和比如在服装行业中,生产商、批发商和零售商在做有关生产或存货
2、的决策时,零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均更感兴趣的是最普遍的尺寸而不是平均尺寸。尺寸。 2022-4-166 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计5011002022-4-167回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合
3、计300100.02022-4-1683、数值型数据的众数、数值型数据的众数1)单变量值分组数据)单变量值分组数据某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM) (人)(人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM) (人)(人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 STATSTAT2022-4-1692)组距分组数据众数的计算公式)组距分组数据众数的计
4、算公式2022-4-1610GEFDCABfXf3f2f1dLUM012得到证明。同理,上限公式也可以dLMdffffffLMffCDffABABCDdABLM2110123212032120 )()( 众众数的计算公式可以从几何图形得到证明:数的计算公式可以从几何图形得到证明:00 AEBDECEFEGABCDLMdLMABCD图中:,即2022-4-1611 身高身高 人数人数 比重比重 (CM) (人)(人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总
5、计 83 100某年级某年级83名女生身高资料名女生身高资料组距分组数据的众数组距分组数据的众数112oMLd 48.1635102323160oMSTATSTAT2022-4-16123.1.3 顺序数据顺序数据-中位数和分位数中位数和分位数 1、顺序数据-中位数1)排序后处于中间位置上的值2022-4-1613中位数中位数(位置的确定)2022-4-1614回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计3002022-4-1615未分
6、组数值型数据的中位数(奇数个数据的算例)n【例例】 9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 921neXM2022-4-1616未分组数值型数据的中位数(偶数个数据的算例)n【例例】:10个家庭的人均月收入数据排序排序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置: 1 2 3 4 5 6 7 8 9 10 2122nneXX
7、M2022-4-1617dfSfLMmme12组距分组数据中位数的计算公式组距分组数据中位数的计算公式em-1m式中: M中位数 L 中位数组的下限f 中位数的位置值2 S向上累计到中位数组的前一组为止的累计频数 f中位数组的频数 d 中位数组的组距2022-4-1618共共 个单位个单位2f共共 个单位个单位2f共共 个单位个单位1mS共共 个单位个单位1mSL 组距为组距为d共共 个单位个单位mf12memfSMLdf 12mmfSdfU12mfS共有单位数2022-4-1619 身高身高 人数人数 累计累计 (CM) (人)(人) 人数人数 150-155 3 3 155-160 11
8、14 160-165 34 48 165-170 24 72 170以上以上 11 83 总计总计 83 某年级某年级83名女生身高资料名女生身高资料dfSfLMmme1204.16453414283160eMSTATSTAT组距分组数据的中位数组距分组数据的中位数20 如果统计资料中如果统计资料中含有异常的或极含有异常的或极端的数据,就有端的数据,就有可能得到非典型可能得到非典型的甚至可能产生的甚至可能产生误导的平均数,误导的平均数,这时使用中位数这时使用中位数来度量集中趋势来度量集中趋势比较合适。比较合适。比如有比如有5 5笔付款:笔付款: 9 9元,元,1010元,元,1010元,元,1
9、111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。 很明显,这并不很明显,这并不是一个好的代表是一个好的代表值,而中位数值,而中位数1010元是一个更好的元是一个更好的代表值。代表值。2022-4-16212、顺序数据-分位数(1)四分位数QL2022-4-1622A)原始数据四分位数的位置n下四分位数n上四分位数LQ41nQL位置UQ413nQU位置2022-4-1623n【例】某学习小组的统计学考试成绩如下: 要求:要求:(1)计算前)计算前15个学生统计学考试成绩的四分位数;个学生统计学考试成绩的四分位数;(2)如果增加一个学生的成绩)如果增加一个学
10、生的成绩95分,试计算分,试计算16个学个学生统计学考试成绩的四分位数。生统计学考试成绩的四分位数。2022-4-16242022-4-1625B)根据组距数列计算四分位数2022-4-1626根据组距数列计算四分位数2022-4-1627 十分位数是指将按大小顺序排列的一组数据划分为10等分的9个变量值,用以反映一组数据在各个区间的一般水平。 (2) 十分位数2022-4-1628(3) 百分位数29 位置测度的一种常用方法:位置测度的一种常用方法: 百分位数百分位数(Percentile)含义:含义:第第p p个百分位数是这样的数值:至少有个百分位数是这样的数值:至少有p%p%个数值跟它一
11、样大或比它小;至少有个数值跟它一样大或比它小;至少有(100(100p)%p)%个数值跟它一样大或比它大。个数值跟它一样大或比它大。 例如,一个考生入学考试的口语成绩是例如,一个考生入学考试的口语成绩是5555分,分,对应第对应第7070个百分位数,我们就可以知道大约有个百分位数,我们就可以知道大约有70%70%的考生成绩比他低,或者说大约有的考生成绩比他低,或者说大约有30%30%的考的考生成绩比他高。生成绩比他高。 2022-4-1630算术平均数定义:全部变量值之算术平均数定义:全部变量值之和与变量值个数相除所得到的结果。和与变量值个数相除所得到的结果。按其计算形式又有简单算术平均数和按
12、其计算形式又有简单算术平均数和加权加权算术算术平均数之分。平均数之分。STATSTAT平均数(平均数(average )的定义)的定义-变量值的一般水平,变量值的一般水平,通常也称为均值通常也称为均值(mean) 。有算术均值、调和均值和。有算术均值、调和均值和几何均值。几何均值。3.1.4 数值型数据数值型数据-平均数平均数 一一.算术平均数算术平均数2022-4-1631(一)(一)简单算术平均数简单算术平均数n如果是未分组整理的原始资料,则直接将各个数据加总再除以数据的个数即得到平均数。 n设一组数据为 ,则其算术平均数的计算公式为2022-4-1632(二)加权算术平均数(二)加权算术
13、平均数n根据分组整理的数据计算平均数时,需要先用每个组的变量值或组中值分别乘以各自的频数或频率,然后加总再除以总频数或总频率,即得算术平均数。其计算公式为 2022-4-1633n【例】 2005年某市红星幼儿园共有458名儿童,其年龄资料如表3.2所示。 要求:试计算该幼儿园儿童的平均年龄。要求:试计算该幼儿园儿童的平均年龄。单变量值分组数据均值的计算单变量值分组数据均值的计算2022-4-1634 身高身高 组中值组中值 人数人数 比重比重 (cm) xi(cm) fi(人)(人) (%) 150-155 152.5 3 3.61 155-160 157.5 11 13.25 160-16
14、5 162.5 34 40.96 165-170 167.5 24 28.92 170以上以上 172.5 11 13.25 总计总计 - 83 100 组距分组数据均值的计算组距分组数据均值的计算某年级某年级83名女生身高资料名女生身高资料组距数列组距数列次数次数f频率频率f/f变量值变量值xSTATSTAT加权算加权算术平均术平均数数1 6 4 .2 5xfxfx164.25fxxfx 2022-4-1635权数及其起作用的条件权数及其起作用的条件n用各组的组中值代表其实际数据计算算术平均数用各组的组中值代表其实际数据计算算术平均数时,通常时,通常假定各组数据在组内是均匀分布的假定各组数据
15、在组内是均匀分布的,相,相应的组中值近似等于各组的平均数。应的组中值近似等于各组的平均数。 n权数:权数:衡量变量值相对重要性的数值。衡量变量值相对重要性的数值。n各个变量值的权数要起作用必须具备两个条件:各个变量值的权数要起作用必须具备两个条件:一是各个变量值之间有差异;一是各个变量值之间有差异;二是各个变量值的权数有差异。二是各个变量值的权数有差异。n简单算术平均数是加权算术平均数在权数相等时简单算术平均数是加权算术平均数在权数相等时的特例。的特例。2022-4-16361.集中趋势的最常用测度值;集中趋势的最常用测度值;2.一组数据的均衡点所在;一组数据的均衡点所在;3.各变量值与其均值
16、的离差之和等于零,各变量值与其均值的离差之和等于零,即即 ;4.各变量值与其均值的离差平方和最小,即各变量值与其均值的离差平方和最小,即5.由组距分组资料计算的均值有近似值性质;由组距分组资料计算的均值有近似值性质;6.易受极端值的影响;主要用于数值型数据,不能易受极端值的影响;主要用于数值型数据,不能用于分类数据和顺序数据用于分类数据和顺序数据(三)算术平均数(均值)特征(三)算术平均数(均值)特征37思考题思考题 比特啤酒公司雇用了比特啤酒公司雇用了468468名员工,其中有名员工,其中有5656名管理人员,名管理人员,130130名行政和技术人员,名行政和技术人员,其余其余282282人
17、是工人。这三组人的周平均工人是工人。这三组人的周平均工资分别是资分别是500500英镑、英镑、300300英镑和英镑和200200英镑。英镑。财务主管希望计算全体员工的平均工资。财务主管希望计算全体员工的平均工资。)( 33 .3333200300500英镑NXXi2022-4-1638二二. 调和平均数调和平均数原来只是计算原来只是计算时使用了不同时使用了不同的的 数据!数据!2022-4-1639调和平均数 (例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元) xi(已知)(已知)成交额成交额(元元) xi fi(已知)(已知)成交量成交
18、量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计36900480002022-4-1640算术平均数与调和平均数的关系算术平均数与调和平均数的关系n1.从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。n2.计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用加权算术平均法;如果已知比率及其基本计算式的分子资料,则采用加权调和平均法。 2022-4-1641n【例】 某市某行业150个
19、企业的产值利润率及相关资料如表3.8。 n要求:试分别计算该行业150企业第一季度和第二季度的平均产值利润率。 算术平均数与调和平均数的关系算术平均数与调和平均数的关系2022-4-1642三三.几何平均数几何平均数(geometric mean) 1、含义及应用条件、含义及应用条件1)定义:定义:n 个变量值乘积的 n 次方根2)应用范围:应用范围:适用于比率数据的平均,主要用于计算平均发展速度、平均增长率、平均比率3)应用的前提条件:应用的前提条件:2022-4-1643补充:补充:发展速度、增长速度概念及关系发展速度、增长速度概念及关系 环比发展速度 y1/y0 y2/y1 y3/y2
20、yn/yn-1 定基发展速度 y1/y0 y2/y0 y3/y0 yn/y0 注意:环比发展速度的连乘积=相应的定基发展速度 增长速度(率)= 发展速度-1 环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-101230123n yyyyynttttt时间: 水平:2022-4-1644平均增长率平均增长率(average rate of increase )452022-4-1612nnmnGX XXX 2022-4-1646简单几何平均数(例题分析)n 【例例】某水泥生产企业2006年的水泥产量为100万吨,2007年与2006年相比增长率为9%,2008年与2007年相比增长率
21、为16%,2009年与2008年相比增长率为20%。求各年的年平均增长率。472022-4-16482022-4-1680. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产品总合格品492022-4-1680. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产品总合格品550.950.920.900.850.800.534988.24mG502022-4-16512022-4-16522022-4-164.8850044210010010080.010095.0fXfX
22、fmX产品合格品合格率 532022-4-161211121kkiikiiikffffffmkiiGXXXX542022-4-1631V3131V 1511018151313224V第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础552022-4-16 15. 010.05130 . 01V15. 010.05130 . 01V2424本金总的本利和 424 211210.0310.0510.152.2154106.851106.8516.85mmGG 平均年利率562022-4-16:03. 0V:03. 0V15. 0V572022-4-16 fmX本金利息利息率假定本假定本
展开阅读全文