数据的描述性分析讲述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据的描述性分析讲述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 描述 分析 讲述 课件
- 资源描述:
-
1、本章内容第一节 集中趋势的描述第二节 离散程度的描述第三节 分布的偏态与峰度集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。众数位置平均数中位数平均数算术平均数数值平均数调和平均数几何平均数数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果.2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的.数值平均数包括算术平均数、调和平均数和几何
2、平均数.算术平均数(均值, Arithmetic Mean) 总体均值常用 或 表示,样本均值常用 表示,样本均值 的计算公式:Xx简单算术平均数:nxnxxxxniin121加权算术平均数:11niiiniixfxf1. 数值平均数数值平均数权数的意义和作用权数的意义和作用 权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用. 当各组的次数都相同时,即当 时: 加权算术平均数就等于简单算术平均数. 123=nffff1111nnniiiiiiiniixffxxxnfnf例:计算某车间工人加工零件平均数(组距式数列)解:26406640iiiiix fXf个 关于计算结
3、果的说明关于计算结果的说明根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.(1).各变量值与均值的离差之和等于零.=1= 0niixx(2).各变量值与均值的离差平方和最小.2=1= minniixx .调和平均数(倒数平均数, Harmonic Mean)调和平均数分为简单调和平均数和加权调和平均数.(1)简单调和平均数标志值的倒数的算术平均数的倒数标志值的倒数的算术平均数的倒数.1212111111111nnniinnHxxxxxxxn niiiniinnnxmmx
4、mxmxmxmmmmmH11332211321(2) 加权调和平均数 式中,m表示各单位或各组的标志值对应的标志总量. 例例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三种蔬菜该日的平均批发价格.几何平均数(Geometric Mean)是另一种形式的平均数,是n个标志值乘积的 n 次方根.主要用于计算平均比率和平均速度.(1)简单几何平均数112nnniGxxxx 式中G表示几何平均数, 表示各项标志值.ix可以看作均值的一种变形nxxxxnGniin121lg)lglg(lg1lg(2)加权几何平均数121112nniiniiiffffffniGxxxx例3.1.1 一位投资者持有一种股
5、票,1997,1998,1999,2000年收益率分别为 计算该投资者在这四年内的平均收益率.4.5%,2.0%,3.5%,5.4%.例3.1.2 某企业四个车间流水作业生产某产品, 一车间产品合格率99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率.499%95%92%90% =93.94%.注注:(1)(2) 数值平均数主要适用于定量数据,而不适用于定性数据.(3) 简单数值平均数适用于未分组的资料,加权数值平均数适用于分组的资料.众数(Mode) 一组数据中出现次数最多的变量值. 主要特点: 不受极端值的影响. 有的数据无众数或有多个众数.说明说明: :如
6、果所有数据出现的次数都一样如果所有数据出现的次数都一样, ,那么这组数据没那么这组数据没 有众数有众数. .2 位置平均数 众数主要用于分类数据,也可用于顺序数据和数值型数据,对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数.适用范围例:分类数据的众数例:顺序数据的众数.中位数(Median)中位数是一组数据按一定顺序排列后,处于中间位置上的变量负偏正偏注: (1)中位数总是介于众数和平均数之间.(2) 皮尔逊经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:3()oexMxM众数、中位数、平均数的特点和应用1. 众数 不受极端值影响 具有不惟一性 数据
7、分布偏斜程度较大且有明显峰值时应用2. 中位数 不受极端值影响 数据分布偏斜程度较大时应用3. 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用数值平均数与位置平均数的适用场合?60分以下260-70870-802280-901090分以上4案例案例1:甲班:甲班统计学统计学考试情况如下表:考试情况如下表:案例案例2:乙班:乙班统计学统计学考试情况如下表:考试情况如下表:60分以下260-703070-80880-90490分以上1案例案例3:丙班:丙班统计学统计学考试情况如下表:考试情况如下表:60分以下260-70570-801280-902590分以上7问题问题1、
8、计算甲、乙、丙三个班的平均成绩;该平均值是真、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值?实值还是近似值?如是近似值,什么情况下会是真实值?2、计算甲、乙、丙三个班的中位数、众数;、计算甲、乙、丙三个班的中位数、众数;3、如要选择从算术平均数、中位数和众数三个平均数、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么?请问你会选择哪个平均数?为什么?4、如要分别反映甲、乙、丙三个班的考试情况,你会、如要分别反映甲、乙、丙三
9、个班的考试情况,你会选择用哪些指标来衡量?选择用哪些指标来衡量?5、如要比较甲、乙、丙三个班的考试情况的优劣,你、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量?又会选择什么样的指标来衡量?6、甲乙丙、甲乙丙三个班的考试成绩分别服从对称分布、左三个班的考试成绩分别服从对称分布、左偏分布、右偏分布中的哪种分布?为什么?偏分布、右偏分布中的哪种分布?为什么? 先计算各组的累计次数,再按公式 确定中位数的位置,并对照累计次数确定中位数。21niif由组距数列确定中位数下限公式:ifsfLMmmniie112为中位数组的下限;为中位数组的下限;为总次数;为总次数;为中位数组前一
10、组的向上累计次数;为中位数组前一组的向上累计次数;为中位数组的次数;为中位数组的次数;为中位数组的组距。为中位数组的组距。Lf 1mSmfi组距式变量数列计算众数的公式:组距式变量数列计算众数的公式:1012012MLiMLi : :众众数数, :众众数数组组的的下下限限值值;:众众数数组组次次数数与与下下一一组组次次数数之之差差;:众众数数组组次次数数与与上上一一组组次次数数之之差差;:众众数数组组的的组组距距。离散程度的描述反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度.1 离散程度的常用指标=1imimriiiifffVff异众比率式中, 为变量值
展开阅读全文