书签 分享 收藏 举报 版权申诉 / 141
上传文档赚钱

类型第4章-数据分布特征的描述课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4107430
  • 上传时间:2022-11-11
  • 格式:PPT
  • 页数:141
  • 大小:3.82MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第4章-数据分布特征的描述课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 分布 特征 描述 课件
    资源描述:

    1、第四章第四章 数据分布特征的描述数据分布特征的描述123 总量指标总量指标是反映在一定时间、空是反映在一定时间、空间条件下某种现象的总规模、总水平间条件下某种现象的总规模、总水平或工作总量的综合指标,以绝对数形或工作总量的综合指标,以绝对数形式表现,亦称式表现,亦称绝对指标绝对指标作作用用分类分类(可连续计数,与时间长短有关,是累计结果可连续计数,与时间长短有关,是累计结果)(间断计数,与时间间隔无关,不能累计间断计数,与时间间隔无关,不能累计)价值指标是用货币来度量社会财富或劳动价值指标是用货币来度量社会财富或劳动成果的总量指标。成果的总量指标。GDP 利润额利润额8:46明确的统计含义明确

    2、的统计含义现象的同类性现象的同类性计量单位必须一致计量单位必须一致总量指标与相对指标、平均指标结合运用总量指标与相对指标、平均指标结合运用 2005 2005年我国对外贸易进口总额年我国对外贸易进口总额增长率为增长率为16.1%16.1%,出口总额增,出口总额增长率为长率为25.7%25.7%。例例100%实实际际完完成成数数计计划划完完成成相相对对数数计计划划数数(一一)计划完成相对指标计划完成相对指标 二、相对指标的种类及其计算二、相对指标的种类及其计算1.1.计算公式计算公式分子与分母的位置不能互换分子与分母的位置不能互换 220100%110%200总产值计划完成相对数计算结果表明该厂

    3、超额10%完成总产值计划。设某工厂某年计划工业总产值为200万元,实际完成220万元,则:100%实实际际平平均均指指标标计计算算公公式式为为:计计划划平平均均指指标标 某化肥厂某年每吨化肥计划成本为200元,实际成本为180元,则:%90%100200180成本计划完成相对数实际单位成本-计划单位成本=180-200=-20(元)计算结果表明该厂化肥单位成本实际比计划降低了10%,平均每吨化肥节约生产费用20元。例例 某企业生产某产品,上年度实际成本为420元/吨,本年度计划单位成本降低6%,实际降低7.6%,则:比计划多完成1.71%;%29.98%100%61%6.71对数成本降低率计划

    4、完成相例例本题也可换算成绝对数计算本题也可换算成绝对数计算:%29.98%1008.39408.388计划-6%394.8元/吨 (1-6%)420实际 7.6%388.08元/吨 (1-7.6%)420 某企业计划规定劳动生产率比上年提高10%,实际比上年提高15%,则:劳动生产率超额4.5%完成计划任务。%5.104%100%101%151对数劳动生产率计划完成相例例水平法水平法能力能力累计法累计法成绩成绩以五年计划为例以五年计划为例2.2.中中长长期计划完成相对数期计划完成相对数计算公式为计算公式为:100%五五年年计计划划末末年年实实际际达达到到的的水水平平五五年年计计划划完完成成程程

    5、度度五五年年计计划划中中规规定定的的末末年年水水平平 那么,提前多少时间完成计划?%5.112%1005663计划完成程度例例第四年9月 第五年8月 产量合计57万吨第四年8月 第五年7月 产量合计55万吨 现假定第四年、第五年各月完成情况如下现假定第四年、第五年各月完成情况如下:(单位:万吨)正好生产正好生产5656万吨的时间应是第四年八月第万吨的时间应是第四年八月第X X天到天到第五年八月第第五年八月第(31-X)(31-X)天。图示如下:天。图示如下:563131651314 )(XX X=15.5(天)即提前四个月又15天半完成五年计划。51(31-x)56(31-x)xx第四年9月第

    6、五年7月第四年8月第五年8月计算公式为:计算公式为:100%五五年年计计划划期期间间实实际际累累计计完完成成数数五五年年计计划划完完成成程程度度五五年年计计划划规规定定的的累累计计数数 某五年计划的基建投资总额为2200亿元,五年内实际累计计划完成2240亿元,则:假定计划提前完成,如果2001-2005年间基建投资总额计划为2200亿元,实际至2005年6月底止累计实际投资额已达2100亿元,7月底累计完成2250亿元,则提前完成计划时间为:5+50/150=5.33(月)%8.101%10022002240计划完成程度例例总体数值部分数值分子与分母的位置不能互换分子与分母的位置不能互换 另

    7、一部分数量某部分数量分子与分母的位置可以互换分子与分母的位置可以互换 乙单位同类指数甲单位某指标分子与分母的位置可以互换分子与分母的位置可以互换 绝对数另一性质不同有联系的某一统计绝对数分子与分母的位置不能互换分子与分母的位置不能互换 基期水平报告期水平分子与分母的位置不能互换分子与分母的位置不能互换 统计相对数的应用范围统计相对数的应用范围利用相对数深化对客观事物的认识利用相对数深化对客观事物的认识利用相对数使本来不可比的现象成为可比利用相对数使本来不可比的现象成为可比我国历年钢产量发展情况 1001基期水平增长百分比增长量绝对值增长%例例集中趋势指标集中趋势指标 数值平均数:算数平均数数值

    8、平均数:算数平均数 调和平均数调和平均数 几何平均数几何平均数位置平均数:众数位置平均数:众数 中位数中位数 集中趋势集中趋势指标即统计平均数,是反指标即统计平均数,是反映若干统计数据一般水平或集中趋势的映若干统计数据一般水平或集中趋势的综合指标。它可能表现为总体内各单位综合指标。它可能表现为总体内各单位某一数量标志的一般水平,也可能表现某一数量标志的一般水平,也可能表现为总体在某一段时期内的数量一般水平。为总体在某一段时期内的数量一般水平。数据集中区数据集中区变量变量x xx动态平均数动态平均数静态平均数静态平均数平均指标平均指标数值平均数值平均数数位置平均数位置平均数算术平均算术平均数数调

    9、和平均调和平均数数几何平均几何平均数数众数众数分位数分位数总体标志值总数算术平均数总体单位数12nxxxxxnnxxn算术平均数算术平均数变量值变量值变量值的个数变量值的个数121221.nnnxxffxffffxxxfff其中,为各组变量值或组中值,各组为次数1212.()nnfxxfffffffxxx121212122112.,.).nnnnnnfxfnfnffffffxxxfffxxxxxx若则 有:(()0()0 xxxx f或12nxxxxxnn22()min()minxxxxf或设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。)(62.8216413550千克平均日产量

    10、ffXX例例fXfXXff在掌握比重权数的情况下,可以直接利用权数在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:系数来求加权算术平均数,其公式为:ffX加加权算术平均数受两因素的影响:权算术平均数受两因素的影响:-变量值大小的影响。变量值大小的影响。-次数多少的影响次数多少的影响。X 而简单算术平均数只反映变量值大小这一而简单算术平均数只反映变量值大小这一因素的影响。因素的影响。各各个变量值与算术平均数离差之和等于零个变量值与算术平均数离差之和等于零4.4.算算术平均数的数学性质术平均数的数学性质 0)(XX简单平均数:加权平均数:0 fXX)(22()()XXfX

    11、X简简单单平平均均数数:最最小小值值加加权权平平均均数数:最最小小值值算术平均数适合用代数方法运算,因此运用算术平均数适合用代数方法运算,因此运用比较广泛;比较广泛;易受极端变量值的影响,使易受极端变量值的影响,使 的代表性变小;的代表性变小;受极大值的影响大于受极小值的影响;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确当组距数列为开口组时,由于组中点不易确定,使定,使 的代表性也不很可靠。的代表性也不很可靠。XX12121212121211111111mnHnnnnnmmmmxmmmmmmxxxxxxxmmmHx121111.Hnnnxxxxxmxff已知某商品在

    12、三个集市贸易市场上的平均价格及销售额资料如下:fXm)(27.1000,75000,951元总平均价格mXmXh1.1.由由平均数计算平均数时调和平均数法的应用:平均数计算平均数时调和平均数法的应用:例例某公司有四个工厂,已知其计划完成程度(%)及实际产值资料如下:fXm%110000,1100,11mXm平均完成计划程度2.2.由由相对数计算平均数时调和平均数法的应用:相对数计算平均数时调和平均数法的应用:例例如果数列中有一标志值等于零,则无法如果数列中有一标志值等于零,则无法计算计算 ;较之算术平均数,较之算术平均数,受极端值的影响要小受极端值的影响要小。hXhX12.nnnGxx xxx

    13、nXXG lglg)(lgGGXarcX 计算时要进行对数变换,即:例例 某机械厂有铸造车间、机加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。3321XXXXG 解:%.%31929092953 这说明该厂车间产品平均合格率为92.31%1212nffffffGnxxxxx式式中中:为为各各变变量量值值的的次次数数或或权权数数将将公公式式两两边边取取对对数数,则则为为:121212112212lglglglglg(lg)LLLLnnGGGGffffffffnnnnXXXXXffXfXfXfXXffffXarcX 投资银行某

    14、笔投资的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。例例%6.108)0360.2()(lg0360.2259002.50lglgarcXarcXfXfXGGG这就是说,25年的平均本利率为108.6%,年平均利率即为8.6%。如果数列中有一个标志值等于零或负值,就无法如果数列中有一个标志值等于零或负值,就无法计算计算 ;受极端值的影响较受极端值的影响较 和和 小;小;它适用于反映特定现象的平均水平,即现象的总它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。标志值是各单位标志值的连

    15、乘积。GXXhX0mM0M0M0M0M0若有两个次数相等的众数,则称复众数。若有两个次数相等的众数,则称复众数。众数的分类众数的分类下三图无众数:下三图无众数:某种商品的价格情况众数M0=3.00(元)112()mmdMoL 下限公式212()mmdMo U 上限公式表中70-80,即众数所在组。例例112()mmdMoL 下限公式212()mmdMo U 上限公式dXML 2110下限公式:上限公式:dXMU 2120由下限公式,日产量众数)(.)()(千克89761036501950195070 由上限公式,日产量众数)(.)()(千克89761036501950365080 众众数的特点

    16、数的特点 众数是一个位置平均数,它只考虑总体分布众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。不受极端值和开口组数列的影响。众数是一个不容易确定的平均指标,当分布众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的众数可言;当变量数列是不等距分组时,众数的位置也不好确定。位置也不好确定。12n

    17、 (n n表示资料的项数)来确定中位数的位次,再根据中位表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可。数的位次找出对应的标志值即可。)(262633215213029262320件件产品为中位数:位工人日产即,第中位数位置,件数,按序排列如下:有五个工人生产某产品eMn)(5.27229265.321621323029262320件至第四人的平均数:这表明中位数是第三、中位数位置,序排列如下:人生产某产品件数,按上例中,假如有六个工eMn12f 根据中位数的位次,将累计次数刚根据中位数的位次,将累计次数刚好超过中位数位次好超过中位数位次 组确定为中位数组确定为中位

    18、数组,该组所对应的标志值即为中位数。组,该组所对应的标志值即为中位数。12f 根据中位数的位次,将累计次数刚根据中位数的位次,将累计次数刚好超过中位数位次好超过中位数位次 组确定为中位数组确定为中位数组,该组所对应的标志值即为中位数。组,该组所对应的标志值即为中位数。某企业按日产零件分组如下:)(34402802件即中位数位置eMf例例方法同单方法同单项数列项数列112()immmmfSdfMe U下限公式012()immmmfSdfMeL下限公式组距内。即中位数在中位数位置90808221642f112()immmmfSdfMe U下限公式012()immmmfSdfMeL下限公式dfSfX

    19、MmmLe 12下限公式下限公式(较小制累计时用):)(.千克8380103679216480 上限公式上限公式(较大制累计时用):)(.千克8380103649216490 dfSfXMmmUe 12 中中位数不受极端值及开口组的影响,位数不受极端值及开口组的影响,具有稳健性具有稳健性。各各单位标志值与中位数离差的绝对值之和单位标志值与中位数离差的绝对值之和 是个最小值。是个最小值。对对某些不具有数学特点或不能用数字测定的某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。现象,可用中位数求其一般水平。minmin即即:或或eeXMXM f 3.3.中中位数的特点位数的特点h

    20、GXXX、(一)(一)三者的关系三者的关系0eXMM、(二)二)三者的关系三者的关系1.1.当当总体分布呈对称状态时,三者合而为一总体分布呈对称状态时,三者合而为一,0即即eXMM 0(1).如如果果分分布布右右偏偏,则则eXMM 2.2.当当总体分布呈非对称状态时总体分布呈非对称状态时如图:0(2).如如果果分分布布左左偏偏,则则eXMM fXX0MeM0 )(oMX如果,则说明分布右偏(或上偏)0 )(oMX如果,则说明分布左偏(或下偏)0 )(oMX如果,则说明分布对称一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:所以分布右偏。,元 )(900

    21、)10002700(31)2(3100MMXXMMee例例根据卡尔皮尔逊经验公式,还可以推算出:XMMe230 )(XMMoe231 )(oeMMX 3211.1.平平均指标只能适用于同质总体。均指标只能适用于同质总体。2.2.用用组平均数补充说明总平均数。组平均数补充说明总平均数。某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下:例例某工业部门100个企业年度利润计划完成程度资料如下:经计算,100个企业年度平均利润计划完成程度为103.35。3.3.用用分配数列补充说明平均数分配数列补充说明平均数例例 变异度指标是用来综合反映数据的离散程度的一类指

    22、标。n极差n四分位差n平均差n方差n标准差n离散系数n偏度n峰度变异度是评价平均数代表性的依据变异度是评价平均数代表性的依据变异度可反映社会经济活动过程的均衡性或稳定性变异度可反映社会经济活动过程的均衡性或稳定性甲、乙两学生某次考试成绩列表甲、乙两学生某次考试成绩列表 甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。组距数列极差可近似值为:组距数列极差可近似值为:极差极差 最大组的上限最大组的上限 -最小组的下限最小组的下限 四分位差是第三个四分

    23、位数四分位差是第三个四分位数Q3减去第减去第一个四分位数一个四分位数Q1的差的一半的差的一半Q.D.=Q3-Q1133(1)144()的的位位置置,的的位位置置为为变变量量值值的的项项数数nnQQn 岁。且他们之间最大差异为岁之间,至人的年龄集中在这表明,该小组有一半岁岁则的位置岁则的位置,为:岁人年龄某外语补习小组92819)9(19-28Q-QQ.D.)28(Q ,64)17(3Q )19(Q ,2417Q 34 28 25 24 22 19 17)(7133311 根根据未分组资料求据未分组资料求Q.D.Q.D.13f3f1)Q,Q44的的位位置置的的位位置置 2)2)若单项数列,则若单

    24、项数列,则Q Q1 1与与Q Q3 3所在组的标志值就是所在组的标志值就是Q Q1 1与与Q Q3 3的数值;的数值;若组距数列,确定了若组距数列,确定了Q Q1 1与与Q Q3 3所在组后,还要用以下所在组后,还要用以下公式求近似值:公式求近似值:131111133313344 QQffSSQLdQLdff 例例95.541.1136.17.)(36.17536584100315Q )(41.1154612410010QQ ,7541003QQ ,254100 13313311QQDQQ件件在第三组则的位置在第二组则的位置这表明有一半工人的日产量分布在11.41件至17.36件之间,且相差5

    25、.95件。四四分位差不受两端各分位差不受两端各25%25%数值的影响,能对开口数值的影响,能对开口组数列的差异程度进行测定;组数列的差异程度进行测定;用用四分位差可以衡量中位数的代表性高低;四分位差可以衡量中位数的代表性高低;四四分位差不反映所有标志值的差异程度,它所描分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。比较粗略的指标。四四分位差的特点分位差的特点简单平均式简单平均式.x xMDn 加权平均式加权平均式 .xx fM Df 由于平均差是根据数列中所有数值计算出来的,受极端值影响较小,所以对整

    26、个统计数列的离中趋势有较充分的代表性。但是在计算过程中,数学处理方法不够理想,所以,其应用受限)(6.6100660.)(421004200X 千克千克ffXXDAXX fXX 例例 平平均差是根据全部标志值与平均数离差而计算均差是根据全部标志值与平均数离差而计算 出的变异指标,能全面反映标志值的差异程度;出的变异指标,能全面反映标志值的差异程度;平平均差计算有绝对值符号,不适合代数方法的均差计算有绝对值符号,不适合代数方法的 演算使其应用受到限制。演算使其应用受到限制。平平均差的特点均差的特点简单平均式2xxn加权平均式2xxff标准差是应用最广泛的变异度指标标准差是应用最广泛的变异度指标)

    27、(85.141645616.36172)(2千克ffXXXX fXX2)()(62.82X 千克由前计算得:例例22()式式中中:为为数数列列中中间间组组的的组组中中值值,为为该该组组组组距距XAXAffdddffAd 10 ,85dA10AX fAX10210 AXfAX210)(85.141005655.02622.21021643916437122)(千克dffdAXffdAX例例2.2.交交替标志的标准差替标志的标准差 在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。统计中,用“是”、“否”或“有”、“无”来表示的标志,称为交替标志,也

    28、称是非标志。N:NN:N1 1,N N2 2N N1 1是具有某种标志的单位数是具有某种标志的单位数N N1 1=P=PN N2 2是不具有这种标志的单位数是不具有这种标志的单位数N N2 2=1-P=1-P具有某种标志具有某种标志变量为变量为1 1不具有这种标志不具有这种标志变量为变量为0 0XX2)(XXfXX2)1()1)(1()(12PPfPPPPffXXPPfXfX 与与R R的关系的关系 与与A.D.A.D.的关系的关系 经验表明,当分布数列接近于正态分布时,经验表明,当分布数列接近于正态分布时,R R和和之间存在以下经验公式:之间存在以下经验公式:R R为为4 4至至6 6个个:

    29、当标志值项数较少时,当标志值项数较少时,R4R4 当标志值项数较多时,当标志值项数较多时,R6R6 对同一资料,所求的平均差一般比标准差要对同一资料,所求的平均差一般比标准差要小,即小,即A.D.A.D.标标准差与全距、平均差的关系准差与全距、平均差的关系%100*XV乙组大于甲组。散程度大于乙组,而是计算表明,并非甲组离计算离散系数来比较:组的水平相差悬殊,应都是不妥的。因为这两数代表性高于甲组,于乙组,或乙组的平均而断言甲组离散程度大件,件,乙组:件,件,甲组:资料:件产量两组不同水平的工人日乙甲乙甲乙乙甲甲%7.48%10073.41V%1.10%100707.07V )(41.3 )7(X 21 9 7 5 2 )07(.7 )70(X 80 75 70 65 60 )(例例

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第4章-数据分布特征的描述课件.ppt
    链接地址:https://www.163wenku.com/p-4107430.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库