六西格玛基本统计[1]课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《六西格玛基本统计[1]课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛 基本 统计 课件
- 资源描述:
-
1、2022-4-27六西格玛基本统计1六西格玛基本统计六西格玛基本统计六西格玛基本统计1基础统计理论目录4 1235 统计目的数据分类统计概述基本图表六西格玛度量的种类六西格玛基本统计1第一部分第一部分统计目的统计目的六西格玛基本统计1你看到了什么?六西格玛基本统计1你需要整个图片!六西格玛基本统计1数据的重要性数据的重要性数据是来自观察的数据是来自观察的,由一个过程所搜集得来的数据可让由一个过程所搜集得来的数据可让我们描绘过程我们描绘过程,了解过程了解过程,改善过程甚至控制过程改善过程甚至控制过程.Data 数据驱动决策和行动数据驱动决策和行动六西格玛基本统计1数据对六西格玛很重要使用统计学来
2、解决真实的问题使用统计学来解决真实的问题真实的真实的解决方案解决方案统计学统计学解决方案解决方案统计学问题统计学问题真实的问题真实的问题 把问题转换为数字 (Y) 定义 Y 的规格(可接受范围) 理解(xi) 与流程输出(Y)的关系Y = f(x1, x2, x3.) 影响流程表现的关键因子是什么? 找到因子(xi)的水平和操作窗口, 保证输出 (Y) 是在可接受范围内 控制输入 (xi) 避免输出/缺陷六西格玛基本统计1统计思想所有作业是相互关联的工序的系统所有作业是相互关联的工序的系统例) 线路板作业过程原料投入贴插装清洗喷胶所有工序中都存在散布所有工序中都存在散布可避免原因不可避免原因同
3、样原料同样生产工艺同样作业者同样方法发生散布发生散布统计思想是 遵守以下四种根本原则的学习,思考和实践的一种哲学。六西格玛基本统计1 调查散布和减少散布的活动调查散布和减少散布的活动减少工序散布的活动减少产品质量散布顾客满足费用降低考虑判断失误的错误考虑判断失误的错误注意从样本数据的结果判断时发生错误统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是思考的过程。思考的过程。统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维看待和
4、分析问题,避免只看到表面层次的现象就去下结论作决策。看待和分析问题,避免只看到表面层次的现象就去下结论作决策。统计思想统计思想举例:去年公司的顾客满意率为80%,今年调查了100位顾客,有85位顾客表示满意,满意率达到85%。能否说今年的顾客满意率比去年提高了5%?六西格玛基本统计1当重复测量时当重复测量时,经常产生不同的结果经常产生不同的结果,这就是偏差这就是偏差偏差的类型:偏差的类型: 通常原因的偏差:通常原因的偏差: 测量中的差异是被期望的并可以预测的测量中的差异是被期望的并可以预测的 特殊原因的偏差特殊原因的偏差(随机随机): 测量中的差异是不可预测的测量中的差异是不可预测的偏差偏差六
5、西格玛基本统计1我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题如果所有的区域的产品的销售量完全相同如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真我们将怀疑数据的真实性实性.偏差的存在使我们的工作更有挑战性偏差的存在使我们的工作更有挑战性我们通常不相信来源于单个数据的结果我们通常不相信来源于单个数据的结果,通常收集多个数据并注意通常收集多个数据并注意收集的方法以减少偏差收集的方法以减少偏差结论:偏差是自然存在的结论:偏差是自然存在的,被期望的并是统计的基础被期望的并是统计的基础偏差偏差六西格玛基本统计1统计领域用下列方法处理
6、偏差统计领域用下列方法处理偏差 描述型统计描述型统计-用图表或总结性的数字用图表或总结性的数字(中心值中心值,方差方差,标准偏差标准偏差)来描述一系列数据的特征来描述一系列数据的特征. 统计推论统计推论-当结果的差异可能因为随机偏差或不能归属为随当结果的差异可能因为随机偏差或不能归属为随机偏差时所作的决定。机偏差时所作的决定。(置信区间和假设检验置信区间和假设检验) 试验设计试验设计(DOE)-收集并分析数据,以估计过程并改变效果收集并分析数据,以估计过程并改变效果. 统计领域中偏差的处理统计领域中偏差的处理六西格玛基本统计1过程偏差 确定过程是否稳定 如果过程不稳定,鉴别并消除不稳定的要因
7、确定过程的平均值的位置 - 它在目标线上吗?如果不在,确定影响平均值的变量,并决定最优的设置以达到目标值 估计总散布的幅度 - 与顾客的要求(规格限)比起来,是可接受的吗? 如果不是, 确定散布源,而后消除或减少他们对过程的影响。 六西格玛基本统计1第二部分第二部分数据分类数据分类六西格玛基本统计1数据的种类 不间断的 总是可以以更小的单位来测量 经常与测量系统一起出现不可以以更小的单位来测量只能选择几个有限的数值连续型的连续型的离散型的离散型的举例 时间, 重量, 金额, 长度举例 二元的: 男/女, 好/坏, Yes/no 分类的: 周一-周日, 地点 (Paris, London, Be
8、ijing, .) 计数: 一张发票上的错误数目, 一个月内发生意外的次数六西格玛基本统计1连续型数据连续型数据u 益处益处 :1.能够为使用相对小范围抽样的过程提供详细的信息能够为使用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率适用于低缺陷率3. 能够预估发展趋势和情况能够预估发展趋势和情况u 缺点缺点 :1.通常较难得到数据通常较难得到数据2.分析更为复杂分析更为复杂六西格玛基本统计1离散型数据离散型数据u 益处益处 : 容易得到数据容易得到数据,并且计算方法简单并且计算方法简单2. 数据容易理解数据容易理解3. 数据随时可得数据随时可得u 缺点缺点 :1.无法显示缺陷怎样发生及过
9、程如何变化无法显示缺陷怎样发生及过程如何变化2.不适合低缺陷率不适合低缺陷率(需要大量的抽样需要大量的抽样)3.不能预测发展趋势和情况不能预测发展趋势和情况六西格玛基本统计1数据类型比较数据类型比较连续型数据离散型数据连续数据计数数据通常为正态分布通常为二项式分布或泊松分布实际数值合格/不合格实际定义严谨数据定义较差需少量抽样需大量抽样六西格玛基本统计1练习: 这是什么种类的数据 ?申请贷款所需要的时间每张发票上的错误数目每张发票上的缺陷百分比一天内销售酒的数量导线的长度办公室的地点申请贷款所需要的时间 (天)销售人员一天内拜访的客户数量赢得招标的百分比销售人员的销售额销售人员的名字六西格玛基
10、本统计1第三部分第三部分统计概述统计概述六西格玛基本统计1l总体总体 想要测量对象的全部想要测量对象的全部l参数参数 用总体的所有数据计算出的数值用总体的所有数据计算出的数值(如均值如均值, 标准差标准差), 称为总体的参数称为总体的参数 x参数参数总体平均值总体平均值总体标准差总体标准差总体总体统计学基本术语统计学基本术语六西格玛基本统计1统计学基本术语统计学基本术语l样本样本 从总体抽出的部分数据从总体抽出的部分数据l统计量统计量 用样本的所有数据计算出的数值用样本的所有数据计算出的数值(如均值如均值, 标准差标准差), 称为样本的统计量称为样本的统计量x统计量统计量样本平均值样本平均值样
11、本标准差样本标准差s总体总体样本样本六西格玛基本统计1描述计量型数据集描述计量型数据集一组计量型数据能显示以下一组计量型数据能显示以下3个特性个特性:中央趋势中央趋势 (均值均值, 中值中值, 众数众数)变异变异(全距全距, 标准差标准差, 方差方差)形状形状六西格玛基本统计1参数和统计量符号参数和统计量符号Mean 均值均值Variance 方差方差Standard Deviation标准差标准差Proportion 比例比例总体(参数)总体(参数)样本(统计量)样本(统计量) s s2 2s sp p六西格玛基本统计1数据位置测量数据位置测量中心趋势中心趋势均值均值中值中值众数众数四分值四
12、分值六西格玛基本统计1样本均值样本均值若样本(样本量为若样本(样本量为n)的观测值为)的观测值为x1,x2,xn,则样本均则样本均值为:值为: 类似地,一个有着大量但限个(类似地,一个有着大量但限个(N个)观测值的总体,个)观测值的总体,其总体均值其总体均值 为:为:均值均值六西格玛基本统计1练习三练习三10个连接线的拉拔强度为个连接线的拉拔强度为 : 230 240 236 248 252 278 265 262拉拔强度的均值是多少?拉拔强度的均值是多少?10个观测值的均值为:个观测值的均值为:均值均值六西格玛基本统计1练习四练习四199X年一个行动中,战机进行了年一个行动中,战机进行了30
13、00次战斗,总共次战斗,总共用时用时6900小时。那末每次战斗平均用时多少?小时。那末每次战斗平均用时多少?每次战斗平均用时为:每次战斗平均用时为:注意所使用的符号注意所使用的符号均值均值六西格玛基本统计1l 均值的计算使用了每个观测值;每个均值的计算使用了每个观测值;每个观测值对均值都有影响。观测值对均值都有影响。l 所有观测值对均值的偏差的总和为零。所有观测值对均值的偏差的总和为零。l 均值对极端的观测值很敏感,极端值均值对极端的观测值很敏感,极端值会导致均值向他偏移。会导致均值向他偏移。X x x x x x x6 3 5 1 2 7 46 62 24 4均值的特性均值的特性六西格玛基本
14、统计1 将一组观测值按大小顺序排列,位于中心的数将一组观测值按大小顺序排列,位于中心的数值即为中值值即为中值l 若观测值的个数为偶数,则中值为中间若观测值的个数为偶数,则中值为中间2个数值的平均个数值的平均l 若观测值的个数为奇数,则位于中心的数值即中值若观测值的个数为奇数,则位于中心的数值即中值中值中值六西格玛基本统计1样本中值样本中值 l 假如假如x (1),x (2) ,x (n) )是按大小排序的样本值,则样本中是按大小排序的样本值,则样本中值为:值为: l 中值的优点是不受极端大或极端小的观测值的影响。中值的优点是不受极端大或极端小的观测值的影响。中值中值六西格玛基本统计1练习五练习
15、五 假设一个样本观测值为假设一个样本观测值为 : 3 1 2 4 7 8 6l 样本均值和样本中值是多少?样本均值和样本中值是多少?l 这这2个值是测量数据中心趋势的合理指标吗?个值是测量数据中心趋势的合理指标吗? 中值中值六西格玛基本统计1(b) 假如最后一个数值改变为假如最后一个数值改变为 : 3 1 2 4 7 8 2680l 则样本平均值和样本中值是多少?则样本平均值和样本中值是多少?l 据此你有何结论?据此你有何结论? 中值中值六西格玛基本统计1Median vs Mean 中值与均值中值与均值l 因为中值不象均值对极端值敏感,因此,当有极端因为中值不象均值对极端值敏感,因此,当有极
16、端大或极端小值时,中值比均值更能代表数据的位置大或极端小值时,中值比均值更能代表数据的位置l 典型的例子是一个城市居民的收入中位值典型的例子是一个城市居民的收入中位值中值中值六西格玛基本统计1中值有时会有欺骗性中值有时会有欺骗性50%-50% Rule ? 一半一半准则?一半一半准则?l 以下一组数据的中值是多少?以下一组数据的中值是多少? 2,2,2,2,2,2,90l 可以用一半一半准则吗?可以用一半一半准则吗?六西格玛基本统计1l 众数是样本中出现次数最多的观测值。众数是样本中出现次数最多的观测值。l 众数可以是唯一的,也可以有不止一个,有众数可以是唯一的,也可以有不止一个,有时并不存在
17、众数。时并不存在众数。众数众数六西格玛基本统计1练习六练习六如果样本观测值为:如果样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 4 3 7 2 6 8 1众数是什么?众数是什么? 具有一个众数,两个众数或多于两个众数分布的数据分具有一个众数,两个众数或多于两个众数分布的数据分布叫什么布叫什么?(单峰分布单峰分布)众数众数六西格玛基本统计1为何使用众数为何使用众数?l 当观测值为分类式当观测值为分类式(如名义数据如名义数据, 序列数据序列数据)时时.众数是描众数是描述数据位置的最好的指标述
18、数据位置的最好的指标.l典型的例子是典型的例子是,一个公司内员工收入的众数一个公司内员工收入的众数众数的重要信息众数的重要信息l当众数不止当众数不止1个时个时,从中抽取样本的总体通常是多个总体从中抽取样本的总体通常是多个总体 的混合的混合众数众数六西格玛基本统计1均值、中值、众数的比较均值、中值、众数的比较MOMeMeMO正态分布正态分布偏上分布偏上分布偏下分布偏下分布MOMeMOMeMOMe六西格玛基本统计1四分值四分值l 将一组按大小顺序排列的数据平均分为四部分将一组按大小顺序排列的数据平均分为四部分,分界点分界点即四分值即四分值. 第一四分值第一四分值(低四分值低四分值),约约25%的观
19、测值小于它的观测值小于它.第二四分值第二四分值,约约50%的观测值小于它的观测值小于它, 即中值即中值.第三四分值第三四分值(高分值高分值),约约75%的观测值小于它的观测值小于它.六西格玛基本统计1练习七练习七 以下为以下为20个电灯泡失效期间的观测值个电灯泡失效期间的观测值, 已按递增顺序排列已按递增顺序排列.210 216 252 300 366 454 624 720 816 924 12161296 1392 1488 1542 2480 2856 3192 3528 3710请确定三个四分值请确定三个四分值.计算方法:先确定位置再计算四分值计算方法:先确定位置再计算四分值Q1的位置
20、:的位置:(n+1)/4Q2的位置:的位置:2(n+1)/4=(n+1)/2Q3的位置:的位置:3(n+1)/4四分值四分值六西格玛基本统计1答案答案 Q1的位置:的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75则:则:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.5四分值四分值六西格玛基本统计1数据散布的测
21、量数据散布的测量(变异变异)lRange 极差极差lVariance 方差方差lStandard Deviation 标准差标准差lInter-Quartile Range 四分植极差四分植极差 六西格玛基本统计1极差极差l样本极差为样本中最大和最小观测值之间的差别样本极差为样本中最大和最小观测值之间的差别,即即:l极差是测量数据散布或变异的最简单的方法极差是测量数据散布或变异的最简单的方法l但它忽略了最大和最小值之间的所有信息但它忽略了最大和最小值之间的所有信息r =xmax - xmin六西格玛基本统计1l试考虑以下的试考虑以下的2个样本个样本: 10 20 50 60 70 90 and
展开阅读全文