书签 分享 收藏 举报 版权申诉 / 106
上传文档赚钱

类型统计数据的描述课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2421381
  • 上传时间:2022-04-16
  • 格式:PPT
  • 页数:106
  • 大小:4.17MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计数据的描述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计数据 描述 课件
    资源描述:

    1、2022-4-161第三章第三章 数据分布特征的描述数据分布特征的描述2022-4-1623.1.1 什么是集中趋势什么是集中趋势(central tendency)2022-4-1633.1.2 分类数据分类数据-众数众数1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据2022-4-164众数(不惟一性)n无众数无众数原始数据: 10 5 9 12 6 85有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和比如在服装行业中,生产商、批发商和零售商在做有关生产或存货

    2、的决策时,零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均更感兴趣的是最普遍的尺寸而不是平均尺寸。尺寸。 2022-4-166 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计5011002022-4-167回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合

    3、计300100.02022-4-1683、数值型数据的众数、数值型数据的众数1)单变量值分组数据)单变量值分组数据某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM) (人)(人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM) (人)(人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 STATSTAT2022-4-1692)组距分组数据众数的计算公式)组距分组数据众数的计

    4、算公式2022-4-1610GEFDCABfXf3f2f1dLUM012得到证明。同理,上限公式也可以dLMdffffffLMffCDffABABCDdABLM2110123212032120 )()( 众众数的计算公式可以从几何图形得到证明:数的计算公式可以从几何图形得到证明:00 AEBDECEFEGABCDLMdLMABCD图中:,即2022-4-1611 身高身高 人数人数 比重比重 (CM) (人)(人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总

    5、计 83 100某年级某年级83名女生身高资料名女生身高资料组距分组数据的众数组距分组数据的众数112oMLd 48.1635102323160oMSTATSTAT2022-4-16123.1.3 顺序数据顺序数据-中位数和分位数中位数和分位数 1、顺序数据-中位数1)排序后处于中间位置上的值2022-4-1613中位数中位数(位置的确定)2022-4-1614回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计3002022-4-1615未分

    6、组数值型数据的中位数(奇数个数据的算例)n【例例】 9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 921neXM2022-4-1616未分组数值型数据的中位数(偶数个数据的算例)n【例例】:10个家庭的人均月收入数据排序排序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置: 1 2 3 4 5 6 7 8 9 10 2122nneXX

    7、M2022-4-1617dfSfLMmme12组距分组数据中位数的计算公式组距分组数据中位数的计算公式em-1m式中: M中位数 L 中位数组的下限f 中位数的位置值2 S向上累计到中位数组的前一组为止的累计频数 f中位数组的频数 d 中位数组的组距2022-4-1618共共 个单位个单位2f共共 个单位个单位2f共共 个单位个单位1mS共共 个单位个单位1mSL 组距为组距为d共共 个单位个单位mf12memfSMLdf 12mmfSdfU12mfS共有单位数2022-4-1619 身高身高 人数人数 累计累计 (CM) (人)(人) 人数人数 150-155 3 3 155-160 11

    8、14 160-165 34 48 165-170 24 72 170以上以上 11 83 总计总计 83 某年级某年级83名女生身高资料名女生身高资料dfSfLMmme1204.16453414283160eMSTATSTAT组距分组数据的中位数组距分组数据的中位数20 如果统计资料中如果统计资料中含有异常的或极含有异常的或极端的数据,就有端的数据,就有可能得到非典型可能得到非典型的甚至可能产生的甚至可能产生误导的平均数,误导的平均数,这时使用中位数这时使用中位数来度量集中趋势来度量集中趋势比较合适。比较合适。比如有比如有5 5笔付款:笔付款: 9 9元,元,1010元,元,1010元,元,1

    9、111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。 很明显,这并不很明显,这并不是一个好的代表是一个好的代表值,而中位数值,而中位数1010元是一个更好的元是一个更好的代表值。代表值。2022-4-16212、顺序数据-分位数(1)四分位数QL2022-4-1622A)原始数据四分位数的位置n下四分位数n上四分位数LQ41nQL位置UQ413nQU位置2022-4-1623n【例】某学习小组的统计学考试成绩如下: 要求:要求:(1)计算前)计算前15个学生统计学考试成绩的四分位数;个学生统计学考试成绩的四分位数;(2)如果增加一个学生的成绩)如果增加一个学

    10、生的成绩95分,试计算分,试计算16个学个学生统计学考试成绩的四分位数。生统计学考试成绩的四分位数。2022-4-16242022-4-1625B)根据组距数列计算四分位数2022-4-1626根据组距数列计算四分位数2022-4-1627 十分位数是指将按大小顺序排列的一组数据划分为10等分的9个变量值,用以反映一组数据在各个区间的一般水平。 (2) 十分位数2022-4-1628(3) 百分位数29 位置测度的一种常用方法:位置测度的一种常用方法: 百分位数百分位数(Percentile)含义:含义:第第p p个百分位数是这样的数值:至少有个百分位数是这样的数值:至少有p%p%个数值跟它一

    11、样大或比它小;至少有个数值跟它一样大或比它小;至少有(100(100p)%p)%个数值跟它一样大或比它大。个数值跟它一样大或比它大。 例如,一个考生入学考试的口语成绩是例如,一个考生入学考试的口语成绩是5555分,分,对应第对应第7070个百分位数,我们就可以知道大约有个百分位数,我们就可以知道大约有70%70%的考生成绩比他低,或者说大约有的考生成绩比他低,或者说大约有30%30%的考的考生成绩比他高。生成绩比他高。 2022-4-1630算术平均数定义:全部变量值之算术平均数定义:全部变量值之和与变量值个数相除所得到的结果。和与变量值个数相除所得到的结果。按其计算形式又有简单算术平均数和按

    12、其计算形式又有简单算术平均数和加权加权算术算术平均数之分。平均数之分。STATSTAT平均数(平均数(average )的定义)的定义-变量值的一般水平,变量值的一般水平,通常也称为均值通常也称为均值(mean) 。有算术均值、调和均值和。有算术均值、调和均值和几何均值。几何均值。3.1.4 数值型数据数值型数据-平均数平均数 一一.算术平均数算术平均数2022-4-1631(一)(一)简单算术平均数简单算术平均数n如果是未分组整理的原始资料,则直接将各个数据加总再除以数据的个数即得到平均数。 n设一组数据为 ,则其算术平均数的计算公式为2022-4-1632(二)加权算术平均数(二)加权算术

    13、平均数n根据分组整理的数据计算平均数时,需要先用每个组的变量值或组中值分别乘以各自的频数或频率,然后加总再除以总频数或总频率,即得算术平均数。其计算公式为 2022-4-1633n【例】 2005年某市红星幼儿园共有458名儿童,其年龄资料如表3.2所示。 要求:试计算该幼儿园儿童的平均年龄。要求:试计算该幼儿园儿童的平均年龄。单变量值分组数据均值的计算单变量值分组数据均值的计算2022-4-1634 身高身高 组中值组中值 人数人数 比重比重 (cm) xi(cm) fi(人)(人) (%) 150-155 152.5 3 3.61 155-160 157.5 11 13.25 160-16

    14、5 162.5 34 40.96 165-170 167.5 24 28.92 170以上以上 172.5 11 13.25 总计总计 - 83 100 组距分组数据均值的计算组距分组数据均值的计算某年级某年级83名女生身高资料名女生身高资料组距数列组距数列次数次数f频率频率f/f变量值变量值xSTATSTAT加权算加权算术平均术平均数数1 6 4 .2 5xfxfx164.25fxxfx 2022-4-1635权数及其起作用的条件权数及其起作用的条件n用各组的组中值代表其实际数据计算算术平均数用各组的组中值代表其实际数据计算算术平均数时,通常时,通常假定各组数据在组内是均匀分布的假定各组数据

    15、在组内是均匀分布的,相,相应的组中值近似等于各组的平均数。应的组中值近似等于各组的平均数。 n权数:权数:衡量变量值相对重要性的数值。衡量变量值相对重要性的数值。n各个变量值的权数要起作用必须具备两个条件:各个变量值的权数要起作用必须具备两个条件:一是各个变量值之间有差异;一是各个变量值之间有差异;二是各个变量值的权数有差异。二是各个变量值的权数有差异。n简单算术平均数是加权算术平均数在权数相等时简单算术平均数是加权算术平均数在权数相等时的特例。的特例。2022-4-16361.集中趋势的最常用测度值;集中趋势的最常用测度值;2.一组数据的均衡点所在;一组数据的均衡点所在;3.各变量值与其均值

    16、的离差之和等于零,各变量值与其均值的离差之和等于零,即即 ;4.各变量值与其均值的离差平方和最小,即各变量值与其均值的离差平方和最小,即5.由组距分组资料计算的均值有近似值性质;由组距分组资料计算的均值有近似值性质;6.易受极端值的影响;主要用于数值型数据,不能易受极端值的影响;主要用于数值型数据,不能用于分类数据和顺序数据用于分类数据和顺序数据(三)算术平均数(均值)特征(三)算术平均数(均值)特征37思考题思考题 比特啤酒公司雇用了比特啤酒公司雇用了468468名员工,其中有名员工,其中有5656名管理人员,名管理人员,130130名行政和技术人员,名行政和技术人员,其余其余282282人

    17、是工人。这三组人的周平均工人是工人。这三组人的周平均工资分别是资分别是500500英镑、英镑、300300英镑和英镑和200200英镑。英镑。财务主管希望计算全体员工的平均工资。财务主管希望计算全体员工的平均工资。)( 33 .3333200300500英镑NXXi2022-4-1638二二. 调和平均数调和平均数原来只是计算原来只是计算时使用了不同时使用了不同的的 数据!数据!2022-4-1639调和平均数 (例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元) xi(已知)(已知)成交额成交额(元元) xi fi(已知)(已知)成交量成交

    18、量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计36900480002022-4-1640算术平均数与调和平均数的关系算术平均数与调和平均数的关系n1.从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。n2.计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用加权算术平均法;如果已知比率及其基本计算式的分子资料,则采用加权调和平均法。 2022-4-1641n【例】 某市某行业150个

    19、企业的产值利润率及相关资料如表3.8。 n要求:试分别计算该行业150企业第一季度和第二季度的平均产值利润率。 算术平均数与调和平均数的关系算术平均数与调和平均数的关系2022-4-1642三三.几何平均数几何平均数(geometric mean) 1、含义及应用条件、含义及应用条件1)定义:定义:n 个变量值乘积的 n 次方根2)应用范围:应用范围:适用于比率数据的平均,主要用于计算平均发展速度、平均增长率、平均比率3)应用的前提条件:应用的前提条件:2022-4-1643补充:补充:发展速度、增长速度概念及关系发展速度、增长速度概念及关系 环比发展速度 y1/y0 y2/y1 y3/y2

    20、yn/yn-1 定基发展速度 y1/y0 y2/y0 y3/y0 yn/y0 注意:环比发展速度的连乘积=相应的定基发展速度 增长速度(率)= 发展速度-1 环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-101230123n yyyyynttttt时间: 水平:2022-4-1644平均增长率平均增长率(average rate of increase )452022-4-1612nnmnGX XXX 2022-4-1646简单几何平均数(例题分析)n 【例例】某水泥生产企业2006年的水泥产量为100万吨,2007年与2006年相比增长率为9%,2008年与2007年相比增长率

    21、为16%,2009年与2008年相比增长率为20%。求各年的年平均增长率。472022-4-16482022-4-1680. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产品总合格品492022-4-1680. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产品总合格品550.950.920.900.850.800.534988.24mG502022-4-16512022-4-16522022-4-164.8850044210010010080.010095.0fXfX

    22、fmX产品合格品合格率 532022-4-161211121kkiikiiikffffffmkiiGXXXX542022-4-1631V3131V 1511018151313224V第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础552022-4-16 15. 010.05130 . 01V15. 010.05130 . 01V2424本金总的本利和 424 211210.0310.0510.152.2154106.851106.8516.85mmGG 平均年利率562022-4-16:03. 0V:03. 0V15. 0V572022-4-16 fmX本金利息利息率假定本假定本

    23、金为金为V 582022-4-1692. 61283. 014115. 0403. 0VVVVVVfXfX592022-4-163、几何平均数的特点、几何平均数的特点1几何平均数受极端值的影响较算术平均数小。2如果变量值有负值,计算出的几何平均数就会成为负数或虚数。3它仅适用于具有等比或近似等比关系的数据。 4几何平均数的对数是各变量值对数的算术平均数。602022-4-16设设 x 取值为:取值为:、10算术平均与几何平均更为常用一些,算术平均与几何平均更为常用一些,其中几何平均数对小的极端值敏感,其中几何平均数对小的极端值敏感,算术平均数对大的极端值敏感。算术平均数对大的极端值敏感。55.

    24、215.5mmHGx就同一资料计算时,有:就同一资料计算时,有:mmHGx612022-4-16 一名统计学家遇到一位数学家,统计学家一名统计学家遇到一位数学家,统计学家调侃数学家说道:调侃数学家说道:“你们不是说若且你们不是说若且,则吗!那么想必你若是喜欢一个,则吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢女孩,那么那个女孩喜欢的男孩你也会喜欢喽!?喽!?” 数学家想了一下反问道:数学家想了一下反问道:“那么你把左手那么你把左手放到一锅一百度的开水中,右手放到一锅零度放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们的平均温度的冰水里想来也没事吧!因为

    25、它们的平均温度不过是五十度而已!不过是五十度而已!” 统计学家与数学家统计学家与数学家 622022-4-16 如果你的腳已經踩如果你的腳已經踩在爐子上,而頭卻在冰箱在爐子上,而頭卻在冰箱裡,統計學家會告訴你裡,統計學家會告訴你,平均而言平均而言,你相當舒服。你相當舒服。 调侃统计学家 632022-4-163.1.5 几种平均数简评几种平均数简评(一)(一) 评价标准评价标准1严格确定。2感应灵敏。3易于理解。4易于计算。5受抽样的影响较小。6易于用代数处理。 642022-4-161算术平均数。 算术平均数符合上述六个条件,应用范围最广。 易受极端值的影响。 当分布数列中存在开口组时,会影

    26、响平均数的准确性。 算术平均数适用于数值型数据。(二)(二) 简评简评652022-4-16简评简评2调和平均数调和平均数符合上述第1,2,5,6四个条件。适用于计算比率的平均数。它容易受极端值的影响,数列中只要有一个变量值为零,则不能计算调和平均数,故其应用范围受到限制。调和平均数适用于数值型数据。 662022-4-16简评简评3几何平均数几何平均数符合上述第1,2,5,6四个4个条件。适用于各比率连乘积等于总比率的条件下计算比率的平均数。数列中若有一项为零或负数,计算几何平均数无意义,应用范围较小。几何平均数适用于数值型数据。672022-4-16简评简评4众数众数的意义易于理解,有时容

    27、易计算,且不受极端值的影响。当数据分布没有明显的集中趋势而趋于均匀分布时,则无众数可言;对不等距分布数列,众数不易确定。当分布数列中出现双众数或多众数时,难以反映所有数据的一般水平。变量值的变化反映不灵敏。众数适用于分类数据、顺序数据和数值型数据。 682022-4-16简评简评5中位数中位数符合上述第1,3,4,5四个条件。不受极端值的影响。当分布数列中存在极端值或组距数列中存在开口组时,计算中位数比较好。中位数缺乏灵敏性,没有算术平均数可靠,且不易用代数方法计算。中位数适用于顺序数据和数值型数据。 2022-4-1669(三)众数、中位数和平均数的关系(三)众数、中位数和平均数的关系对何种

    28、数据而言的?对何种数据而言的?均值均值=中位数中位数=众数众数 均值均值中位数中位数众数众数均值均值中位数中位数众数众数2022-4-1670三者的数量关系三者的数量关系2022-4-1671众数、中位数和均值都是对数据集中趋势的测度众数、中位数和均值都是对数据集中趋势的测度 1、均值均值由全部数据计算,包含了全部数据的信息,具有良好的数学性质,当数据接近对称分布时,具有较好的代表性;但对于偏态分布,其代表性较差。 2、中位数中位数是一组数据中间位置上的代表值,不受数据极端值的影响,对于偏态分布的数据,其代表性要比均值好。 3、众数众数是一组数据分布的峰值,是一种位置的代表,当数据的分布具有明

    29、显的集中趋势时,尤其对于偏态分布,众数的代表性比均值好。 4、对接近正态的分布数据,常用均值均值描述数据的集中趋势;对偏态分布,常用众数众数或中位数中位数描述数据的集中趋势。 5、均值均值只适用于数值型数据;顺序数据可用中位数中位数或众数众数进行描述,而对分类数据,只能用众数众数进行描述。 (四)众数、中位数和均值的应用场合(四)众数、中位数和均值的应用场合2022-4-1672下面是两个总体关于年龄分布的数据,相对而言,那个总体的年龄分布差异大些?n总体1:n46、47、48、49、50、 51、52、53、54n总体2:n8、15、20、30、50 70、80、85、92501nxx502

    30、nxx2022-4-16732022-4-1674n3.2.1 什么是离散程度什么是离散程度n3.2.2 分类数据:异众比率(分类数据:异众比率(variation ratio)n3.2.3 顺序数据:四分位差(顺序数据:四分位差(quartile range )n3.2.4 数值型数据:数值型数据: 1、极差(、极差( range ) 2、平均差(、平均差(mean deviation) 3、方差和标准差(、方差和标准差( Variance and standard deviation) 4、离散系数(离散系数( Coefficient of Variation )n3.2.5 相对位置的度

    31、量:相对位置的度量: 标准分数(标准分数( standard score)3.2 离散程度的测度离散程度的测度2022-4-16753.2.1 什么是离散程度什么是离散程度2022-4-16763.2.2 分类数据:异众比率分类数据:异众比率(variation ratio)2022-4-1677 异众比率(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计50110

    32、02022-4-16783.2.3 顺序数据顺序数据-四分位差四分位差 (quartile deviation)1.对顺序数据离散程度的测度2.也称为内距或四分间距3.上四分位数与下四分位数之差 QD = QU QL4.反映了中间50%数据的离散程度5.用于衡量中位数的代表性2022-4-16793.2.4 数值型数据离散程度的度量数值型数据离散程度的度量1、极差(R) (range)离散程度的最简单测度值易受极端值影响未考虑数据的分布2022-4-16802、平均差、平均差(average deviation)各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中

    33、应用较少2022-4-1681(例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(xi)频数频数(fi)140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计12020402022-4-1682185xfxf(台)2022-4-16833、方差

    34、和标准差(、方差和标准差( Variance and standard deviation) 方差方差(variance)各变量值与其平均数离)各变量值与其平均数离差平方的平均数差平方的平均数 标准差标准差 (standard deviation)即方差的)即方差的算术平方根;算术平方根;其单位与原变量其单位与原变量X的单位相同的单位相同。n 方差和标准差的计算也分为简单平均法方差和标准差的计算也分为简单平均法和加权平均法。和加权平均法。n 对于总体数据和样本数据,计算公式略对于总体数据和样本数据,计算公式略有不同。有不同。 2022-4-1684(一)总体方差和标准差(一)总体方差和标准差n

    35、未分组数据:2022-4-1685(二)样本方差和标准差(二)样本方差和标准差 (simple variance and standard deviation)n未分组数据:注意:注意:样本方差用自样本方差用自由度由度n-1去除去除!2022-4-1686自由度自由度 (degree of freedom)1.从字面涵义来看,自由度是指一组数据中可以自由取值的个数;2.自由度是指样本数据个数与附加给独立的观测值的约束或限制个数的差;3.当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值;4.按着这一逻

    36、辑,如果对n个观测值附加的约束个数为k个,则自由度为n-k。2022-4-1687自由度自由度 (degree of freedom)1.样本有3个数值,即x1=2,x2=5,x3=8,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值;2.为什么样本方差的自由度是n-1呢?因为在计算离差平方和时,必须先求出样本均值x ,而x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个; 3.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在

    37、抽样估计中,当用样本方差s2去估计总体方差2时,它是2的无偏估计量。2022-4-1688方差和标准差的计算(未分组资料)方差和标准差的计算(未分组资料)编号编号甲甲x xi i乙乙x xi i丙丙x xi i甲甲2 2乙乙2 2丙丙2 21 1440 480 4901936002304002401002 2460 490 4952116002401002450253 3500 500 5002500002500002500004 4540 510 5052916002601002550255 5560 520 510313600270400260100合计合计25002500 2500250

    38、0 25002500 1260400 1251000 1250250标准差标准差50.9915.817.9199.50155/250012604001222甲的标准差甲的标准差nnxxSii2022-4-1689方差和标准差的计算(分组资料)方差和标准差的计算(分组资料)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(xi)频数频数(fi)140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235

    39、4 91627201710 8 4 51600900400100 0100400900160025006400810064002700 0170040007200640012500合计合计12055400185(xfxf台)2022-4-1690方差和标准差的计算(分组资方差和标准差的计算(分组资料)料)2022-4-1691平均差与标准差的区别平均差与标准差的区别l对离差的数学处理方法不同。l平均差是用取绝对值绝对值的方法消除离差的正负号然后用算术平均的方法求出平均离差;而标准差是用平方平方的方法消除离差的正负号,然后对离差的平方计算算术平均数,并开方求出标准差。2022-4-1692标准差

    40、的统计运用l描述数据分布的变异程度l评价两组数据的均值代表性l用于统计推断(区间估计、假设检验、方差分析等) 注意: 1、标准差是名数即有计量单位(与数据值的计量单位相同) 2、标准差的大小与数据值有关2022-4-1693500skg大象0.5skg免子3500 xkg大象2.5xkg免 子不可比不可比2022-4-1694 4、离散系数、离散系数(coefficient of variation)1. 标准差与其相应的均值之比2.对数据相对离散程度相对离散程度的测度3.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5. 计算公式为

    41、2022-4-1695500skg大象0.5skg免子kgx3500大象2.5xkg免 子可比可比2022-4-1696离散系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.02022-4-1697离散系数(例题分析)2022-4-16983.2.5 相对位置的度量:标准分数相对位置的度量:标准分数 ( standard score)n1)也称标准

    42、化值n2)对某一个值某一个值在一组数据中相对位置相对位置的度量n3)可用于判断一组数据是否有离群点n4)用于对变量的标准化处理n5)计算公式为2022-4-1699标准分数(性质)n注意注意: z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为均值为0,标准差为1。 2022-4-16100标准分数标准分数(性质性质)1.均值等于02. 方差等于12022-4-16101标准化值标准化值(例题分析例题分析)9个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表 家庭编号家庭编号人均月收入(元)人均月收入(元)

    43、标准化值标准化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS2022-4-16102数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测度度值值2022-4-161033.3 偏态与峰态的度量n3.3.1 偏态及其测度n3.3.2 峰态及其测度2022-4-161043.3.1 偏态及其测定1.统计学家Pea

    44、rson于1895年首次提出 2.数据分布偏斜程度的测度,数据分布的不对称性称为偏态。3. 计算偏态系数的方法有计算偏态系数的方法有 皮尔逊测度法皮尔逊测度法和和中心矩法中心矩法 两种。两种。2022-4-16105n皮尔逊测度法是利用算术平均数与众数的关系来测度数据分布偏斜程度的一种方法。n计算公式为: n 1皮尔逊测度法皮尔逊测度法2022-4-16106偏度(偏度(skewness):度量数):度量数据分布非对称方向及程度的指标据分布非对称方向及程度的指标0 02 24 46 68 8101012121414161618182020152152 153153 154154 155155

    45、156156 157157 158158 159159 160160 161161 162162 163163 164164 165165 166166 167167 168168 169169 170170 171171 172172 173173 174174 175175SKeMxoM0 02 24 46 68 8101012121414161618182020152152 153153 154154 155155 156156 157157 158158 159159 160160 161161 162162 163163 164164 165165 166166 167167 168168 169169 170170 171171 172172 173173 174174 175175eMxoMox MSKS偏态右正)(0SK偏态左负)(0SKSTATSTAT

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计数据的描述课件.ppt
    链接地址:https://www.163wenku.com/p-2421381.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库