度量分布偏斜的程度课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《度量分布偏斜的程度课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 度量 分布 偏斜 程度 课件
- 资源描述:
-
1、第七章第七章 数据的描述统计数据的描述统计目目 录录第一节第一节 集中趋势的度量集中趋势的度量第二节第二节 离散趋势的度量离散趋势的度量第三节第三节 偏斜度与峰度的度量偏斜度与峰度的度量第四节第四节 SPSSSPSS在描述统计中的运用在描述统计中的运用集中趋势(集中趋势(central tendencycentral tendency)是指一组数据向某中是指一组数据向某中心值靠拢的倾向,集中趋势的测度实际上就是对数据心值靠拢的倾向,集中趋势的测度实际上就是对数据一般水平代表值或中心值的测度。一般水平代表值或中心值的测度。不同类型的数据用不同的集中趋势测度值,选用哪一不同类型的数据用不同的集中趋
2、势测度值,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。据的类型来确定。集中趋势的特征数,是代表一组数据典型水平或集中集中趋势的特征数,是代表一组数据典型水平或集中趋势的统计量。常用的集中趋势的特征数包括算术平趋势的统计量。常用的集中趋势的特征数包括算术平均数、加权平均数、几何平均数、中位数、众数等。均数、加权平均数、几何平均数、中位数、众数等。3一、算数平均数一、算数平均数算术平均数(算术平均数(arithmetic meanarithmetic mean)简称为均数()简称为均数(meanmean)。样本均数通常用)。样
3、本均数通常用 表示,总体均数用希腊字母表示,总体均数用希腊字母 表表示。示。算术平均数是集中趋势的最主要测度值。适用于对称算术平均数是集中趋势的最主要测度值。适用于对称分布,特别是正态或近似正态分布的计量资料。分布,特别是正态或近似正态分布的计量资料。根据所掌握数据形式的不同,算术平均数有简单算术根据所掌握数据形式的不同,算术平均数有简单算术平均数和加权算术平均数。平均数和加权算术平均数。4x(1 1)简单算术平均数()简单算术平均数(simple arithmetic meansimple arithmetic mean)。未经分组)。未经分组整理的原始数据,其算术平均数的计算就是直接将一组
4、数据的各整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数。计算公式为:个数值相加除以数值个数。计算公式为:(2 2)加权算术平均数()加权算术平均数(weighted arithmetic meanweighted arithmetic mean)。根据分)。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数为权数计算加权的算术平均数。计算公式为:或频数为权数计算加权的算术平均数。计算公式为:5nxnxxxxniin 121 kiikiiikkkffxffffxfxfxx11212211二、
5、几何平均数二、几何平均数几何平均数(几何平均数(geometric meangeometric mean),是指社会经济现),是指社会经济现象的同质总体在时间上变动速度的平均数,也即统计象的同质总体在时间上变动速度的平均数,也即统计总体在一段时期内的平均发展速度。总体在一段时期内的平均发展速度。几何平均数通常用于计算指数、百分比和增长速度的几何平均数通常用于计算指数、百分比和增长速度的平均数。平均数。根据掌握的数据资料不同,几何平均数可分为简单几根据掌握的数据资料不同,几何平均数可分为简单几何平均数和加权几何平均数两种。何平均数和加权几何平均数两种。6(1 1)简单几何平均数。根据未经分组资料
6、计算平均数。计)简单几何平均数。根据未经分组资料计算平均数。计算公式为:算公式为:(2 2)加权几何平均数。当掌握的数据资料为分组资料,且)加权几何平均数。当掌握的数据资料为分组资料,且各个变量值出现的次数不相同时,应用加权方法计算几何各个变量值出现的次数不相同时,应用加权方法计算几何平均数。计算公式为:平均数。计算公式为:7nniinnGxxxxx121ffniiffffnffGinnxxxxx1212121三、中位数三、中位数中位数(中位数(medianmedian)是一组按大小顺序排列的观察值中)是一组按大小顺序排列的观察值中位居中间的数值,通常用位居中间的数值,通常用 表示。它常用于描
7、述偏态表示。它常用于描述偏态分布资料的集中趋势。分布资料的集中趋势。中位数是一个位置代表值,因此它不受极端变量值的中位数是一个位置代表值,因此它不受极端变量值的影响,特别是当分布末端无确定数据不能求算术平均影响,特别是当分布末端无确定数据不能求算术平均数和几何平均数时,可以用中位数来表示数据分布的数和几何平均数时,可以用中位数来表示数据分布的集中趋势。集中趋势。8eM对于已分组的数据来说,中位数的计算公式为:对于已分组的数据来说,中位数的计算公式为:其中,其中,是到中位数组前面一组为止的向上累计频数是到中位数组前面一组为止的向上累计频数,则是到中位数组后面一组为止的向下累计频数;则是到中位数组
8、后面一组为止的向下累计频数;为中位数组的频数;为中位数组的频数;i i 为中位数组的组距。为中位数组的组距。9ifSfLMmme 12ifSfUMmme 121 mS1 mSmf四、众数四、众数众数(众数(modemode)是指一组数据中出现次数最多的变量)是指一组数据中出现次数最多的变量值,用值,用 表示。从变量分布的角度看,众数是具有明表示。从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对显集中趋势点的数值,一组数据分布的最高峰点所对应的变量值即为众数。当然,如果数据的分布没有明应的变量值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不
9、存在;如果显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就有多个众数。有多个高峰点,也就有多个众数。在统计实践中,当一组数据出现不同质的情况,或分在统计实践中,当一组数据出现不同质的情况,或分布中出现极端数据时,用众数来描述数据的集中趋势布中出现极端数据时,用众数来描述数据的集中趋势较为合适。较为合适。100M设众数组的频数为设众数组的频数为 ,众数前一组的频数为,众数前一组的频数为 ,众数后一组的频,众数后一组的频数为数为 。当众数相邻两组的频数相等时,即。当众数相邻两组的频数相等时,即 =,众数组的,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频组中值即
10、为众数;当众数组的前一组的频数多于众数组后一组的频数时,即数时,即 ,则众数会向其前一组靠,众数小于其组中值;,则众数会向其前一组靠,众数小于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即当众数组后一组的频数多于众数组前一组的频数时,即 ,则众数会向其后一组靠,众数大于其组中值。则众数会向其后一组靠,众数大于其组中值。基于这种思路,借助于几何图形而导出的分组数据众数的计算公式基于这种思路,借助于几何图形而导出的分组数据众数的计算公式为:为:其中,其中,L L表示众数所在组的下限;表示众数所在组的下限;U U表示众数所在组的上限。表示众数所在组的上限。上述下限和上限公式是假定数据分布
11、具有明显的集中趋势,且众数上述下限和上限公式是假定数据分布具有明显的集中趋势,且众数组的频数在该组内是均匀分布的,若这些假定不成立,则众数的代组的频数在该组内是均匀分布的,若这些假定不成立,则众数的代表性就会很差。表性就会很差。11iffffffUMiffffffLMmmmmmm)()()()(11101110mf1 f1 f1 f1 f1 f1 f1 f1 f五、调和平均数五、调和平均数调和平均数(调和平均数(reciprocal meanreciprocal mean)也称倒数平均数,)也称倒数平均数,它是对变量(它是对变量(x x)的倒数求平均,然后再取倒数而得)的倒数求平均,然后再取倒
12、数而得到的平均数。根据掌握的统计资料不同,调和平均数到的平均数。根据掌握的统计资料不同,调和平均数可以分为简单调和平均数和加权调和平均数。可以分为简单调和平均数和加权调和平均数。12(1 1)简单调和平均数:)简单调和平均数:(2 2)加权调和平均数:)加权调和平均数:13121211111111nnnnRxxxxxxxnniiiniinnnnnnxmmxmxmxmmmmmmmxmxmxmR112211212122111六、集中趋势度量的例题分析六、集中趋势度量的例题分析【例例7-17-1】20102010年中国南方某城镇年中国南方某城镇32003200户家庭的平户家庭的平均每一劳动力年收入的
13、频数分布情况如表均每一劳动力年收入的频数分布情况如表7-17-1所示,所示,请计算其算术平均数、中位数和众数。请计算其算术平均数、中位数和众数。14年收入分组年收入分组/元元组中值组中值X/元元频数频数f累积频数累积频数8000-1700017000-2600026000-3500035000-4400044000-5300053000-62000125002150030500395004850057500700100080040020010070017002500290031003200总计总计3200解:解:(1 1)算术平均数)算术平均数(2 2)中位数)中位数(3 3)众数)众数15
14、75.2684311kiikiiiffXXM2510090001000700-2320017000medX 224009000800-1000700-1000700-100017000modX【例例7-27-2】1950 1950年我国总人口为年我国总人口为5.55.5亿,亿,19851985年达到了年达到了10.510.5亿,共计增长了亿,共计增长了1.91.9倍(表倍(表7-27-2)。)。(1 1)测算)测算1950195019851985年,我国平均每年,我国平均每5 5年的人口增长速度;年的人口增长速度;(2 2)测算)测算1950195019751975年,我国平均每年,我国平均每
15、5 5年的人口增长速度;年的人口增长速度;(3 3)如果)如果1975197519851985年期间不实行计划生育政策,请测算年期间不实行计划生育政策,请测算19851985年我国的人口总数。年我国的人口总数。16年度年度人口数人口数/万人万人环比增长速度环比增长速度1950195519601965197019751980198555196614656620772538829929242098705104532-1.1141.0771.0961.1441.1141.0681.059 解:解:(1 1)MMG G=1.1141.0771.0961.1441.1441.0681.059=1.114
16、1.0771.0961.1441.1441.0681.059)1/71/7 1.0961.096,即,即 1950195019851985年,我国平均每年,我国平均每5 5年的人口增长速年的人口增长速度为度为9.6%9.6%;(2 2)MMG G=(1.1141.0771.0961.1441.1441.1141.0771.0961.1441.144)1/51/5 1.10961.1096,即,即1950195019751975年,我国平均每年,我国平均每5 5年的人口增长速年的人口增长速度度10.9%10.9%;(3 3)P P=92420=92420(1.1091.109)2 2=11359
17、0=113590(万人),即(万人),即19851985年年我国的人口总数达到我国的人口总数达到11.35911.359亿。亿。17【例例7-37-3】东方信托投资公司某笔投资的年收益率是东方信托投资公司某笔投资的年收益率是按复利计算的,该笔投资的年收益情况如表按复利计算的,该笔投资的年收益情况如表7-37-3所示所示,请测算该笔投资,请测算该笔投资2525年的平均年收益率。年的平均年收益率。18年收益率年收益率/%环比增长率环比增长率/%年数年数/F3481015103104108110115148102总计总计-25解:用几何平均数求该笔投资的年收益率解:用几何平均数求该笔投资的年收益率
18、X XG G=(103%103%)1 1(104%104%)4 4(108%108%)8 8(110%110%)1010(115%115%)2 2 1/251/25 =(7.65047.6504)1/251/25=108.48%=108.48%则该笔投资的年平均收益率为则该笔投资的年平均收益率为8.48%8.48%。19 【例例7-47-4】某汽车公司某年某汽车公司某年1 11212月份生产的平均成本和月份生产的平均成本和总成本如表总成本如表7-47-4所示。请测算:所示。请测算:(1 1)该公司汽车的月平均生产量;)该公司汽车的月平均生产量;(2 2)该公司某年汽车的平均生产成本。)该公司某
19、年汽车的平均生产成本。20月份月份平均成本(万元)平均成本(万元)生产总成本(亿元)生产总成本(亿元)12345678910111241.841.442.741.241.643.742.541.641.142.541.641.31421.218632433.914422329.62053.93697.51414.42219.425502329.61858.5总计总计25613解:(解:(1 1)每个月的生产总成本除以平均成本,就可以得到)每个月的生产总成本除以平均成本,就可以得到该公司汽车的月平均生产量,分别为:该公司汽车的月平均生产量,分别为:3434,4545,5757,3535,5656
20、,4747,8787,3434,5454,6060,5656,4545。(2 2)通过计算加权调和平均数,就可以得到该公司汽车的)通过计算加权调和平均数,就可以得到该公司汽车的平均生产成本:平均生产成本:即该公司汽车的平均生产成本约为即该公司汽车的平均生产成本约为4242万元。万元。219885.41455645341858.52329.618631421.21221121212211 nnnnnnxmxmxmmmmmmmxmxmxmR公共管理研究或调查所得到的数据,大都具有随机变量的公共管理研究或调查所得到的数据,大都具有随机变量的性质。而对这些随机变量的描述,仅有集中趋势的度量是性质。而对
21、这些随机变量的描述,仅有集中趋势的度量是不够的。集中量数只描述数据的集中趋势和典型情况,还不够的。集中量数只描述数据的集中趋势和典型情况,还不能说明一组数据的全貌。不能说明一组数据的全貌。对于数据变异性即离散趋势进行度量的一组统计量,称作对于数据变异性即离散趋势进行度量的一组统计量,称作差异量数差异量数,这些差异量数有标准差或方差、全距、平均差,这些差异量数有标准差或方差、全距、平均差、四分差及各种百分差等等。、四分差及各种百分差等等。如果一组数据是产品质量检查的结果,那么数据的变异情如果一组数据是产品质量检查的结果,那么数据的变异情况说明生产是否稳定;如果数据是测量的结果,那么变异况说明生产
22、是否稳定;如果数据是测量的结果,那么变异的情况说明测量方法是否正确、仪器是否精密;如果数据的情况说明测量方法是否正确、仪器是否精密;如果数据是学生的成绩,那么变异的情况说明成绩是否整齐(而不是学生的成绩,那么变异的情况说明成绩是否整齐(而不是高低)。是高低)。22一、极差一、极差极差又称全距(极差又称全距(rangerange),是指总体中最大标志值与),是指总体中最大标志值与最小标志值之差。用极差反映总体分布的离散程度,最小标志值之差。用极差反映总体分布的离散程度,十分简便。其计算公式为:十分简便。其计算公式为:其中,其中,和和 分别为数据中的极大值和极小值。分别为数据中的极大值和极小值。2
23、3minmaxxxR maxxminx三、平均差三、平均差平均差(平均差(mean absolute deviationmean absolute deviation,M.D.M.D.)是离差)是离差 (样本值与均值之差)的绝对值的平均数,即:(样本值与均值之差)的绝对值的平均数,即:对于已分组的频数分布(组数为对于已分组的频数分布(组数为k k)平均差反映全部标本数据平均的误差,比极差和四分平均差反映全部标本数据平均的误差,比极差和四分位差更能全面反映总体的数据变动情况,它的缺点是位差更能全面反映总体的数据变动情况,它的缺点是绝对值不适于作进一步的数学分析。绝对值不适于作进一步的数学分析。2
24、4 niixxnDM11.kiiixxfnDM11.三、方差与标准差三、方差与标准差方差(方差(variancevariance)也称变异数、均方,常用符号)也称变异数、均方,常用符号 表表示;作为总体参数时,常用符号示;作为总体参数时,常用符号 表示。它是每个数表示。它是每个数据与该组数据平均数之差平方后的均值,即离均差平据与该组数据平均数之差平方后的均值,即离均差平方后的平均数。方后的平均数。标准差(标准差(standard deviationstandard deviation)即方差的平方根,常)即方差的平方根,常用用S S或或SDSD表示。若用表示。若用 表示,则是指总体的标准差。表
25、示,则是指总体的标准差。25 2S2(1 1)总体方差)总体方差 (未分组的数据)(未分组的数据)(已分组的数据)(已分组的数据)(2 2)样本方差)样本方差(未分组的数据)(未分组的数据)(已分组的数据)(已分组的数据)(3 3)总体标准差)总体标准差(未分组的数据)(未分组的数据)(已分组的数据)(已分组的数据)(4 4)样本标准差)样本标准差(未分组的数据)(未分组的数据)(已分组的数据)(已分组的数据)26 niixxn1221 kiiixxfn1221 niixxnS12211 kiiixxfnS12211 niixxn121 kiiixxfn121 niixxnS1211 kiii
展开阅读全文