数据分布特征的测度课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据分布特征的测度课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 测度 课件
- 资源描述:
-
1、数据分布特征的测度 集中趋势集中趋势(Central tendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一一般水平般水平的代表值或中心值。l分类数据:众数l顺序数据:中位数和分位数l数值型数据:均值集中趋势(Central tendency)集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据l例:有5名工人生产的零件数分别为:15、16、17、18、19,平均零件数为多少?l解:(件)l NXXi1751918171615Xl基本公式l影响加权算术平均数的因素:变量值和权数l选择权数的原则:变
2、量值与其乘积是具有实际经济意义的标志总量。l加权算术平均数与简单算术平均数的关系:l当 时,iiiiiiffXffXXAfffn21nxnAxAAxAfxfxl解:(元)工资(x)工人数(f)工资总额(xf)50021000530421207408592086054300102011020合计20143607182014360fxfX66402640fxfX按零件数分组(个)组中值(x)人数(f)xf506055844060706520130070807512900合计402640l 解:(件)l 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下l 甲组:甲组:考试成绩(考试成绩(x):
3、0 20 100l 人数分布(人数分布(f):):1 1 8l 乙组:乙组:考试成绩(考试成绩(x):0 20 100l 人数分布(人数分布(f):):8 1 1)(82108100120101分甲nxxnii)(12101100120801分乙nxxnii1.各变量值与均值的离差之和等于零niixx12min)(niixx10)(l例:某市场某蔬菜销售价格早晨为1.00元,中午为0.5元,晚上为0.2元。在下列两种情况下分别计算平均价格(1)早午晚各买1斤(2)早午晚各买1元。l简单调和平均数l加权调和平均数XMMHXH11某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称
4、批发价格批发价格(元元)x成交额成交额(元元)M成交量成交量(公斤公斤)f甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000(元)批发价格成交额成交额769.04800036900mH按平均单位成本分组(元/件)企业数(个)各组产量在总产量中所占的比重(%)101212141418276224038合计15100l试指出那个厂的总平均成本高,其原因何在?品种单位成本(元)总成本一厂二厂甲乙丙152030210030001500322515001500计划完成%企业数(个)计划产值(万元)90以下714090100223101
5、0011057165011012026710120以上340合计1152850l设l则 (已知m、f)(已知x、f)(已知x、m)fmx xmmxfxfxfmxffNNNXXXXXG21l例1:一位投资者持有一种股票,1997,1998,1999,2000收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。l例2:某企业四个车间流水作业生产某产品。一车间产品合格率为99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率。l算术平均数、调和平均数、几何平均数之间的关系l算术平均数几何平均数调和平均数%84.103%4.105%5.1
6、03%0.102%5.1044%94.93%90%92%95%994%8.6%6.108%)151(%)101(%)81(%)41(%)31(2521084平均年利率为ffXG 投资银行某笔投资是的年利率是按复利计算的,25年利率分配时(按时间数序):有一年是3%,有4年为4%,有8年为8%,有10年为10%,有2年为15%。求平均年利率。0 众数是一组数据中出现次数最多的变量值 无众数或复众数 主要用于分类数据,也可用于顺序数据和数值型数据l对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数。l对于组距数列,若众数组相邻两组次数相等,则众数组的组中值就是众数;若众数组上一组的次数较
7、多,则众数在众数组内靠近上限;若众数组下一组的次数较多,则众数在众数组内靠近下限。计算公式:iLMo211不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893
8、4530836311510合计合计300100.0l中位数是一组数据按一定顺序排列后,处于中间位置上的变量值。l对于未分组数据,中位数位置=(n+1)/2l对于单项式分组数据,中位数位置=l对于组距数列,确定中位数组之后,可按以下公式计算中位数:immefSfLM122/f 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300年收入(元)农户数农户数累计向上累计向下累计500600
9、6007007008008009009001000100011001100120012001300240480105060027021012030240720177023702640285029703000300027602280123063036015030合计3000l解:因第3组次数最多,故其为众数组。=755.9(元)l中位数位置=1500,所以第三组为中位数组。=774.3(元)iLMo211100430570570700immefSfLM122f10010507201500700l在同一变量数据集合中如果变量值分布呈对称型,则算术平均数、中位数和众数三者相等;l若不对称,则中位数必
10、居中,算术平均数和众数分列两侧。右偏 左偏级别12345678人数223861967020135完成生产定额(%)工人数(人)9010051001101311012016120130261301402014015015合计95l标志变异指标的作用 衡量平均数代表性的大小 反映社会经活动过程的均衡性和节奏性例:1、有两个小组工人工资资料如下:甲:50 60 70 80 90 乙:60 65 70 75 80 哪一组工人工资平均数的代表性大?2、某企业计划完成情况如表,哪个车间生产过程均衡?计划数实际完成上旬中旬下旬全月数量 比重%数量比重%数量比重%数量比重%甲车间乙车间120120382031
展开阅读全文