统计学-第三章数据的特征值课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学-第三章数据的特征值课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第三 数据 特征值 课件
- 资源描述:
-
1、n第一节第一节 集中趋势集中趋势数值平均数数值平均数n第二节第二节 集中趋势集中趋势位置平均数位置平均数n第三节第三节 离中趋势的测度离中趋势的测度n第四节第四节 偏度与峰度的偏度与峰度的 测度测度第三章第三章 2022-11-111n重点重点:n 了解和掌握算术平均数、众数、中位了解和掌握算术平均数、众数、中位数、方差、标准差、标准分数的含义及数、方差、标准差、标准分数的含义及其计算方法;正确使用离散系数比较不其计算方法;正确使用离散系数比较不同均值的代表性。同均值的代表性。n难点难点:n 是偏度和峰度的含义及其计算方法。是偏度和峰度的含义及其计算方法。2022-11-112n 正确理解平均
2、指标与变异指标的概念的、正确理解平均指标与变异指标的概念的、意义与作用,明确其种类和区别;掌握平意义与作用,明确其种类和区别;掌握平均指标和变异指标的计算方法,以及应用均指标和变异指标的计算方法,以及应用的原则和条件;掌握偏度和峰度的含义及的原则和条件;掌握偏度和峰度的含义及其计算方法;了解各种分位数的概念与意其计算方法;了解各种分位数的概念与意义。义。2022-11-113数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度2022-11-116第一节 n一、算术平均数一、算术平均数n二、调和平均数二、调和平均数n三、几何平均数三、几何平均数数数值值型型数数据据的
3、的平平均均数数2022-11-117集集 中中 趋趋 势势(central tendency)1.一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.注意注意:低层次数据的测度方法也适用于高层次的数低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次据,但高层次数据的测度方法往往不适用于低层次的数据。的数据。2022-11-118n 均值(算术平均数)定义:均值(算术平均数)定义
4、:将一组数据相加后除将一组数据相加后除以数据的个数所得到的一个数值,称为算术平均数以数据的个数所得到的一个数值,称为算术平均数(average)或均值或均值(mean)。n 算数平均数,算数平均数,又有简单算数平均数和加权平均数又有简单算数平均数和加权平均数之分之分2022-11-119 一、算术平均数一、算术平均数组距分组数据)组距分组数据)nxnxxxxniin121ki ik kinkiix fx fx fx fxffff1 12 211212022-11-1110【例【例3.13.1】根据表】根据表3.13.1中的数据,中的数据,计算职工通信费用支出计算职工通信费用支出额平均水平额平均
5、水平。p72解:解:2022-11-1111 身高身高 组中值组中值 人数人数 比重比重 (cm)xi(cm)fi(人)(人)(%)150-155 152.5 3 3.61 155-160 157.5 11 13.25 160-165 162.5 34 40.96 165-170 167.5 24 28.92 170以上以上 172.5 11 13.25 总计总计 -83 100.00 例例3.2 分组资料均值的计算分组资料均值的计算:某年级某年级83名女生身高资料名女生身高资料组距数据组距数据次数次数f频率频率f/f变量值变量值xffxx加权算加权算术平均术平均数数25.164x25.164
6、xfxfx2022-11-1112【例【例3.33.3】依据整理所得表】依据整理所得表3-53-5中的数据,中的数据,计算职工通信计算职工通信费用支出额平均水平费用支出额平均水平。p74解:解:或或2022-11-1113 计算算数平均数,计算算数平均数,注意:注意:n用各组的组中值代表其实际数据计算算术平均数用各组的组中值代表其实际数据计算算术平均数时,通常时,通常假定各组数据在组内是均匀分布的假定各组数据在组内是均匀分布的,相,相应的组中值近似等于各组的平均数。应的组中值近似等于各组的平均数。n权数权数:衡量变量值相对重要性的数值。:衡量变量值相对重要性的数值。n各个变量值的权数要起作用必
7、须具备两个条件:各个变量值的权数要起作用必须具备两个条件:一是各个变量值之间有差异;一是各个变量值之间有差异;二是各个变量值的权数有差异。二是各个变量值的权数有差异。n简单算术平均数是加权算术平均数在权数相等时简单算术平均数是加权算术平均数在权数相等时的特例。的特例。2022-11-1114 算术平均数的性质算术平均数的性质 p75-76n 1各变量值与其算术平均数的离差之各变量值与其算术平均数的离差之和等于零和等于零,即,即。2022-11-11152022-11-11161.集中趋势的最常用测度值;集中趋势的最常用测度值;2.一组数据的均衡点所在;一组数据的均衡点所在;3.易受极端值的影响
8、;易受极端值的影响;4.各变量值与其均值的离差之和等于零;各变量值与其均值的离差之和等于零;5.5、6.6.由组距分组资料计算的均值有近似值性由组距分组资料计算的均值有近似值性质;质;7.7、用于数值型数据,不能用于分类数据和、用于数值型数据,不能用于分类数据和顺序数据顺序数据min12)(nixxi2022-11-1117 二、调和平均数二、调和平均数 n 调和平均数也称调和平均数也称“倒数平均数倒数平均数”,它是对变,它是对变量的倒数求平均,然后再取倒数而得到的平均量的倒数求平均,然后再取倒数而得到的平均数,以数,以 表示。表示。n 根据掌握的资料不同,调和平均数也有简单根据掌握的资料不同
9、,调和平均数也有简单调和平均数和加权平均数两种形式。调和平均数和加权平均数两种形式。其计其计算公算公式为:式为:mHmH2022-11-1118 例题分析例题分析【例【例3.4 3.4 假设甲、乙、丙三种苹果的价格分别为每斤假设甲、乙、丙三种苹果的价格分别为每斤2.42.4元、元、1.81.8元及元及1.51.5元(元(1 1)若三种苹果各买)若三种苹果各买1 1元,试问元,试问所购苹果的平均价格又为多少?(所购苹果的平均价格又为多少?(2 2)如果甲、乙、丙)如果甲、乙、丙三种苹果分别购买三种苹果分别购买5 5元、元、8 8元和元和1010元,试问其平均价格为元,试问其平均价格为多少?多少?
10、解:计算解:计算2022-11-1119 计算调和平均数计算调和平均数,注意:,注意:1.从数学定义角度看算术平均数与调和平均数是不一从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,样的,但在社会经济应用领域,二者本质上是二者本质上是一致的,惟一的区别是计算时使用了不同的数据。一致的,惟一的区别是计算时使用了不同的数据。n2.计算比率的平均数时,如果已知比率及其基本计计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用加权算术平均法;如果已算式的分母资料,则采用加权算术平均法;如果已知比率及其基本计算式的分子资料,则采用加权调知比率及其基本计算式的分子资料,
11、则采用加权调和平均法。和平均法。2022-11-1120三、几何平均数三、几何平均数(geometric mean)p78n几何平均数也称几何均值,它是几何平均数也称几何均值,它是n个变量值乘积个变量值乘积的的n次方根。次方根。n几何平均法是计算平均比率或平均发展速度最几何平均法是计算平均比率或平均发展速度最适用的一种方法。适用的一种方法。n如果分布数列中各变量值呈几何级数变化或频如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算率分布极不对称,也常采用几何平均法来计算平均数。平均数。n根据统计资料的不同,几何平均数也有简单几根据统计资料的不同,几何平均数也有简单
12、几何平均数和加权几何平均数之分。何平均数和加权几何平均数之分。2022-11-1121几何平均数的计算公式几何平均数的计算公式:适用于对比率数据的平均。主要用于计算适用于对比率数据的平均。主要用于计算平均发展速度、平均增长率、平均比率平均发展速度、平均增长率、平均比率n对于未分组的资料,几何平均数的计算公式为对于未分组的资料,几何平均数的计算公式为2022-11-1122补充:发展速度、增长速度概念及关系补充:发展速度、增长速度概念及关系n环比发展速度 y1/y0 y2/y1 y3/y2 yn/yn-1 n定基发展速度 y1/y0 y2/y0 y3/y0 yn/y0:环比发展速度的连乘积=相应
13、的定基发展速度n 增长速度=发展速度-1n 环比增长速度环比增长速度=环比发展速度环比发展速度-1n 定基增长速度定基增长速度=定基发展速度定基发展速度-1 y y y y y 2002 2001 2000 1999n3210产产量量:时时间间:tn2022-11-1123平均增长率(average rate of increase)序列中各逐期环比值序列中各逐期环比值(也称环比发展速度也称环比发展速度)的几何平的几何平均数减均数减1后的结果后的结果描述现象在整个观察期内平均增长变化的程度描述现象在整个观察期内平均增长变化的程度通常用几何平均法求得。计算公式为通常用几何平均法求得。计算公式为)
14、,2,1(1110111201niYYYYYYYYYYGnnniinnn2022-11-1124例题分析例题分析n【例【例3.8】已知某市已知某市20012005年国内生产总值的发展速度年国内生产总值的发展速度(以上年为(以上年为100)依次分别为)依次分别为112%、108%、114%、116%和和113%。试计算这。试计算这5年国内生产总值的平均发展速度。年国内生产总值的平均发展速度。如果已知的是各年的增长速度,要计算若干年的平均如果已知的是各年的增长速度,要计算若干年的平均增长速度,则需要先将增长率加上增长速度,则需要先将增长率加上100%得到发展速度,得到发展速度,再根据上述方法计算平
15、均发展速度,最后用平均发展速再根据上述方法计算平均发展速度,最后用平均发展速度减度减100%则得到平均增长速度。则得到平均增长速度。2022-11-1125例题分析例题分析【例【例3.9】甲投资银行某项投资的年利率是按复利甲投资银行某项投资的年利率是按复利计算的,若将过去计算的,若将过去20年的年利率资料如表年的年利率资料如表3.9所示所示.要求:试计算要求:试计算20年的平均年利率。年的平均年利率。解解:2022-11-1126应用几何平均数时注意应用几何平均数时注意n几何平均数在实际应用中受到很多限制;几何平均数在实际应用中受到很多限制;n如果被平均的变量值中有一个为零,则不能如果被平均的
16、变量值中有一个为零,则不能计算几何平均数;计算几何平均数;n如果变量值为负数,开偶次根会形成虚根,如果变量值为负数,开偶次根会形成虚根,失去意义;失去意义;n几何平均数在实际应用中的范围比算术平均几何平均数在实际应用中的范围比算术平均数要窄。数要窄。2022-11-1127几何平均数的特点几何平均数的特点 n 1几何平均数受极端值的影响较算术平几何平均数受极端值的影响较算术平均数小。均数小。n2如果变量值有负值,计算出的几何平均如果变量值有负值,计算出的几何平均数就会成为负数或虚数。数就会成为负数或虚数。n3它仅适用于具有等比或近似等比关系的它仅适用于具有等比或近似等比关系的数据。数据。n4几
17、何平均数的对数是各变量值对数的算几何平均数的对数是各变量值对数的算术平均数。术平均数。2022-11-1128第二节第二节 集中趋势集中趋势位置平均数位置平均数 p80n一、众数一、众数 Mon二、中位数二、中位数Men三、四分位数三、四分位数QU、QL2022-11-1129集中趋势集中趋势位置平均数位置平均数n位置平均数位置平均数,就是根据总体中处于特殊,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值位置上的个别单位或部分单位的标志值来确定的代表值;来确定的代表值;n对于整个总体来说,具有非常直观的代对于整个总体来说,具有非常直观的代表性,常用来反映分布的集中趋势;表性,常用来反
18、映分布的集中趋势;n常用的位置平均数有常用的位置平均数有众数和中位数众数和中位数。2022-11-1130一、众数一、众数 p80n(一)(一)众数的含义众数的含义n众数众数是指一组数据中出现次数是指一组数据中出现次数最多的变量最多的变量值值,用,用 表示。表示。n众数直观地说明分布的集中趋势,并用它众数直观地说明分布的集中趋势,并用它作为反映变量值一般水平的代表值。作为反映变量值一般水平的代表值。n在某些场合只有众数才适合作为总体的代在某些场合只有众数才适合作为总体的代表值。表值。oM2022-11-1131(二)(二)众数的计算方法众数的计算方法n1观察法求众数观察法求众数n如果数据已按单
19、个变量值整理成频率分布如果数据已按单个变量值整理成频率分布表或者是分类数据表,则表或者是分类数据表,则次数出现最多或次数出现最多或频率最大的那个变量值即为众数频率最大的那个变量值即为众数。n【例【例3.11】某制鞋厂要了解消费者最需要某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场哪种型号的男皮鞋,调查了某百货商场2005年年10月男皮鞋的销售情况,得到资料如表月男皮鞋的销售情况,得到资料如表3.10所示。所示。2022-11-1132众数的计算众数的计算-例题分析例题分析要求:试根据上表资料计算男皮鞋销售量的众数。要求:试根据上表资料计算男皮鞋销售量的众数。解:销售量最多的是规格
20、为解:销售量最多的是规格为25.5厘米的鞋号,销售量厘米的鞋号,销售量320双,占双,占32%,故,故众数为众数为25.5公分公分。2022-11-1133众数的计算众数的计算-例题分析例题分析 p81【例【例3.10】某高校电影院在安排某高校电影院在安排2010年影片放映计划时,分别年影片放映计划时,分别按性别随机抽取按性别随机抽取200名男女学生,登记其对影片类型的取向。统名男女学生,登记其对影片类型的取向。统计结果如表计结果如表3.10所示。所示。要求:要求:试分析学生对影片取向的集中趋势试分析学生对影片取向的集中趋势。n解解:7种类型的影片中,男生最喜欢看动作片,人数为种类型的影片中,
21、男生最喜欢看动作片,人数为48人,占人,占24%,众数即为动作片这种影片类型众数即为动作片这种影片类型;女生最喜欢看言情片,人;女生最喜欢看言情片,人数为数为46人,占人,占23%,众数即为言情片众数即为言情片这种影片类型;男女生对影这种影片类型;男女生对影片类型的取向,综合而言是动作片,片类型的取向,综合而言是动作片,众数为动作片这种影片类型众数为动作片这种影片类型。2022-11-1134数值型数据众数的确定方法数值型数据众数的确定方法 单变量值分组资料单变量值分组资料某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 1
22、56 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 STATSTAT众数2022-11-1135 注意:注意:n 众数不仅适用于测度顺序数据和众数不仅适用于测度顺序数据和数值型数据的集中趋势,而且适用数值型数据的集中趋势,而且适用于测度不能计算平均数的分类数据于测度不能计算平均数的分类数据的集中趋势。的集中趋势。2022-11-1136众数的计算方法众数的计算方法n2插值法求众数插值法求众数n
23、对于对于形成的分布数列,当频率形成的分布数列,当频率分布属于分布属于完全对称分布完全对称分布,而众数所在组的,而众数所在组的变量值分布比较均匀时,可用观察法求众变量值分布比较均匀时,可用观察法求众数,即以众数组的组中值作为所求的众数。数,即以众数组的组中值作为所求的众数。n完全对称分布不存在完全对称分布不存在,众数组前后各组的,众数组前后各组的次数不一定相等,众数就不等于组中值,次数不一定相等,众数就不等于组中值,因此需要采用插值法求众数。因此需要采用插值法求众数。2022-11-1137组距分组数据,众数的计算步骤组距分组数据,众数的计算步骤n1、先找到众数所在的组;、先找到众数所在的组;n
24、2、按该组次数与前后相邻两组分布次数之差所、按该组次数与前后相邻两组分布次数之差所占的比重来推算众数值。占的比重来推算众数值。n如果众数组前一组的次数大于后一组的次数,则如果众数组前一组的次数大于后一组的次数,则众数值小于其所在组的组中值;反之,众数值则众数值小于其所在组的组中值;反之,众数值则大于其所在组的组中值;大于其所在组的组中值;n若众数组前后相邻组的次数相等,则众数值等于若众数组前后相邻组的次数相等,则众数值等于其所在组的组中值。其所在组的组中值。n3、计算众数有上限和下限公式之分。、计算众数有上限和下限公式之分。2022-11-1138众数的计算方法众数的计算方法2022-11-1
25、139 身高身高 人数人数 比重比重 (CM)(人)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100某年级某年级83名女生身高资料名女生身高资料数值型数据众数的确定方法数值型数据众数的确定方法 组距分组资料组距分组资料dLMo21148.1635102323160oMSTATSTAT众数组众数组2022-11-1140 众数的特点众数的特点n1众数不受分布数列的极大或极小值的众数不受分布数列的极大或极小值的影响,众数对分布数列有好的代表性。影响
展开阅读全文