精益六西格玛统计工具介绍-假设检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《精益六西格玛统计工具介绍-假设检验课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精益六西格玛 统计 工具 介绍 假设检验 课件
- 资源描述:
-
1、六西格玛统计工具介绍(二)六西格玛统计工具介绍(二)20142014年年2 2月月2精益六西格玛理论体系全景图客户客户流程描述流程描述控制计划控制计划测量系统测量系统控制控制过程能力过程能力分析分析多变量多变量分析分析实验设计实验设计VoC分析分析失效模式分析失效模式分析流程图流程图(I/O)因果矩阵因果矩阵统计过程统计过程控制控制定性分析定性分析 定量分析定量分析头脑风暴头脑风暴+KJ失效树失效树鱼骨图鱼骨图Why-Why分析分析PFMEA对标分析对标分析访谈访谈现场调研现场调研流程观察流程观察回归分析回归分析软件使用软件使用项目管理项目管理精益六西格玛意识精益六西格玛意识统计基础统计基础精
2、益工具精益工具基本图表基本图表精益六西格玛持续改进体系精益六西格玛持续改进体系精益六西格玛推行综合管理精益六西格玛推行综合管理3课程大纲n假设检验概述假设检验概述n相关与回归相关与回归4统计基础-数据类型n计数型数据(离散型数据,属性型数据):通常表示事物的分类计数型数据(离散型数据,属性型数据):通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器 A,机器 B,机器 C白班/中班/夜班n计量型数据计量型数据(连续型数据):通常是通过测量仪器测量得到的数(连续型数据):通常是通过测量仪器测量得到的数据据压力时间长度重量5目录n假设检验相关基础概念假设检验相关基础概念总体参数及样本统计量
3、推定置信区间n假设检验介绍假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T 与配对T的区别 n讨论及问答讨论及问答6假设检验相关基础概念n总体参数与样本统计量总体参数与样本统计量s=样本标准差X=样本平均值 参数 估计 统计量=总体平均值=总体标准差抽样(Sampling)AABDDDCCCCBAAAAAAABBBBBBCCCCCCDDDDDDD7估计的概念n点估计:通过抽样用一个具体的值估计总体的参数点估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋月饼的保质期是3个月点估计的种类:平均的估计、标准差、方差的估计、比率的估计等n区间估计:
4、通过抽样用一个具体的值估计总体的参数区间估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋的月饼的保质期是1-6个月8置信区间n置信区间的概念(置信区间的概念(Confidence Interval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1-)%n置信水平(置信水平(Confidence Level)是指区间估计时,能够包含总体参数的能力水平,即1-。05.0z05.0z%90%5%5%1525.0z25.0z%50%25%25=0.5(50%)=0.1(10%)信赖水准信赖区间误 差9置信区间n90%的置信区间举例如下图的置信区间举
5、例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均n95%置信区间的解释:置信区间的解释:大约100个置信区间中有95个会包含总体参数,或者我们有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间 总体的平均样本 1样本 2 样本 1010置信区间n置信区间的计算置信区间的计算通用公式:置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式(知道的时候):样本的置信区间公式(不知道,只能计算S):样本的平均遵循t分布nZX2/nStXn 1,2/11置信区间nMinitab中置信区间的计算中置信区间的计
6、算这些都可以计算出置信区间12假设检验n假设检验的目的假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。是为了解决选择的困难性n假设检验的意义假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部门最需要的工具之一。13假设检验n假设检验的概念假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法n假设检验术语假设检验术语假设设定:对要进行判断的情况进行假设设定H0-Null Hypothesis:说明没有变化或者差异的设定Ha-Alternative Hypothesis:说明有变化或者
7、差异的设定n假设设定练习:假设设定练习:为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性14假设检验n假设检验的种类假设检验的种类单边检验 One-sided hypothesisOne-sided hypothesis双边检验 TwoTwo-sided hypothesis-sided hypothesis15n假设检验的两种错误假设检验的两种错误第1种 错误(TypeError,-风险)不顾Null Hypothesis 真实.Null Hypothesis放弃的错误 把良品判断为不良的时候(误判)既,可以说生产者危险1-就是置信区间 第2种
8、错误(TypeError,-风险):不顾Null Hypothesis 假的.Null Hypothesis接受的错误 不良品当成良品的时候(漏失)即,可以说顾客危险1-是检定力,即检出能力16n假设检验的两种错误说明假设检验的两种错误说明你的判定你的判定接受接受 H Ho o真真实实情情况况H Ho o 对对H Ho o 错错I I类错误类错误 (-风险风险)IIII类错误类错误 (-风险风险)正确正确正确正确拒绝拒绝 H Ho o17n假设检验的两种错误举例假设检验的两种错误举例陪审团的判决陪审团的判决他无罪他无罪事实事实实际清白实际清白他有罪他有罪实际有罪实际有罪正确正确正确正确I I类
9、错误类错误 (-风险)风险)后果:II II 类错误类错误 (-风险)风险)后果:18假设检验n假设检验原理假设检验原理假设检验其实是个比较的过程两种假设的比较,是A还是B?我们总是用H0 来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0 放弃H0 的决策不会总是正确的,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大?于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value)19假设检验n假设检验原理假设检验原理(续续)知道了做出放弃H0 的决策的风险的大小,那么风险小于
10、多少时我们才敢于做出放弃H0 的决策呢?于是我们需要提前设定一个风险判断标准 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01、0.05、0.1 等但我们通常设定 为0.05这也就是我们通常拿P值和0.05 进行大小比较的原因。如果P0.05 接受H0;P0.05 放弃H0 (P Low H0 Go)理解练习为什么正态检验,等方差检验P要大于0.05?20假设检验n假设检验原理假设检验原理(续续)(Significance Level)置信水平:风险判断标准P-value 做出放弃H0 的决策犯错误的最大风险值p 值Ho 选择域选择域Ho弃却域弃却域 Ho选择域选择域Ho弃却域
11、弃却域 p值P值值 接受接受H0不能做决策不能做决策,不能说有差异,不能说有差异TPT TPT 21假设检验n假设检验步骤假设检验步骤假设假设 设定设定检定统计量选择检定统计量选择留意水准留意水准 决定决定p-value 计算计算(弃却域弃却域,检定统计量检定统计量 计算计算)判定(统计结论)判定(统计结论)p-value 0.05 时 Ho 接受P-值 0.05 时 Ho 放弃正态数据标准偏差的置信区间一个总体两个以上的总体2 Sample t(方差相等)2 Sample t(方差不相等)1 Sample t 或者1 Sample ZHo:1=(平均值)H1:1 (平均值)Stat-Basi
12、c Stats-1 Sample-t(不知道时候)1Sample Z(知道时候)1 Sample-Sign 或者 1 Sample-WilcoxonMann-Whitney Test两个以上的总体两个母集团1-Proportion2-Proportion一个总体两个总体两个以上的总体非正态数据等 方差YesNoKruskal-Wallis Test一个总体一个总体两个以上的总体Ho:M1=M2H1:M1 M2Stat-Nonparametric-Mann-WhitneyHo:M1=M2=M3=.H1:至少一个是不一样Stat-Nonparametric-Kruskal-WallisHo:1=2
13、H1:1 2Stat-Basic Stats-2-Sample t“assume equal variances”“假定等方差选择按钮”不选择 Test for Equal Variances(Levenes Test)Test for Equal Variances(F Test or Bartletts Test)Ho:1=2=3=.H1:至少有一个不一样Stat-Anova-Test for Equal Variances两个总体比较的时候 用F-testHo:1=(标准差)H1:1 (标准差)标准差的置信区间使用Minitab 路径 Stat-Basic Statistics-Disp
14、lay Descriptive Stats计量型数据数据稳定性研究(控制图)配对T(Paired T)Ho:D=0 (差值)H1:D 0(差值)要对差值进行正态性检验Minitab 路径 Stat-Basic Statistics Paired t test(配对T)假设检验-常用路径图23假设检验-单样本T检验24“单样本t检验”解决什么问题?典型的问题为典型的问题为:“我们抽取了新坐席员我们抽取了新坐席员Bob的的30通电话录音数据,想知道坐席员通电话录音数据,想知道坐席员A的的话后整理时长的平均值是否刚好等于考核要求的话后整理时长的平均值是否刚好等于考核要求的25秒?秒?”当然问题也可以
15、是当然问题也可以是“Bob的平均整理时长大于的平均整理时长大于25秒吗?秒吗?”或者或者“Bob的平均整理时长刚好小于的平均整理时长刚好小于25秒吗?秒吗?”251.建立零假设和备选假设:平均整理时间等于目标值平均整理时间不等于目标值2.决定显著性水平:=0.05(5%)3.随机抽取30通电话的整理时间数据作为样本4.选取适合方法计算P值(参考下页详细步骤)5.依据P值结果做出结论秒25:0=H秒25:1H按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设 H0n如果P值小于a,推翻零假设 H026选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25不是正态分布
16、是正态分布单样本T检验单样本T检验单样本T检验先把数据转换为正态后再使用单样本T检验检验数据正态性数据不稳定应先解决稳定性问题NOYES算出P值样本数据n个27分析路线图 单样本T28步骤1:检验稳定性29步骤1:检验稳定性是否有任何明显的变化趋势或模式,足以证明数据并非来自单一的总体/流程?212223242526272829Bob3691215182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob 的 单个测量Bob 的 单个测量01234“Bob”的移动控制范围3691215182124273033样本平均数=1.20控制下限=0.00控制上限=3.
17、91Bob 的 移动控制范围Bob 的 移动控制范围控制图控制图30步骤2:检验正态性31步骤2:检验正态性32步骤 3:检验均值假设值实际估计值df标准差2524.8482290.86932检验统计量p 值|t|p 值 tp 值 0.05),或者说,),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论:由于均值的置信区间包含了目标值,我们可以作出下述结论:n我们没有足够的证据拒绝零假设。我们没有足够的证据拒绝零假设。n是否可以说零假设是正确的(是否可以说零假设是正确的(Bob的均值的均值=25秒)?秒)?不!不!n但是,我们通常在假定零假设是正确的情况下执行操作。但是,我们通常在
18、假定零假设是正确的情况下执行操作。34延伸如果问题是如果问题是:“Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”如何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?35假设检验-双样本t检验36“双样本t检验”解决什么问题?典型的问题为典型的问题为:“我们各抽取了坐席员我们各抽取了坐席员Bob和和Jane的的30通电话样本,想知道坐席员通电话样本,想知道坐席员A和和B的平均话后整理时长是否的平均话后整理时长是否相等相等?”当然问题也可以是当然问题也可以是“Bob的平均整理时长的平均整理时长大于大于Jane的平均整理时的平均整理时长吗?长吗?”或者或
19、者“Bob的平均整理时长的平均整理时长小于小于Jane的平均整理时长的平均整理时长吗?吗?”371.建立零假设和备选假设:Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值2.决定显著性水平:=0.05(5%)3.随机抽取Bob和Jane各30通电话的整理时间数据作为样本4.选取适合方法计算P值(参考下页详细步骤)5.依据P值结果做出结论按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设 H0n如果P值小于a,推翻零假设 H0JaneBob:1HJaneBob:0H=38选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n2539样本量n在获取
20、数据并试图得出一些陈述之前在获取数据并试图得出一些陈述之前,我们需要确定进行这种检验我们需要确定进行这种检验数要多少数据数要多少数据.n记住记住,我们有一些基于估计值的抽样我们有一些基于估计值的抽样“经验方法经验方法 Rules of Thumbn并不要求并不要求Bob和和Jane的两组样本量一定是相同的的两组样本量一定是相同的n注意注意:我们将在以后的模块中讲解样本量的计算我们将在以后的模块中讲解样本量的计算40工具或统计工具或统计 最小样本量最小样本量 平均值5-10 标准偏差 25-30 有缺陷的比例(P)100 并且 nP=5 直方图 或帕累托图 50 散点图 25 控制图 20不同工
21、具的样本量通常41步骤1:检验稳定性42步骤1:检验稳定性212223242526272829Bob3691215182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob 的 单个测量Bob 的 单个测量01234“Bob”的移动控制范围3691215182124273033样本平均数=1.20控制下限=0.00控制上限=3.91Bob 的 移动控制范围Bob 的 移动控制范围2223242526272829Jane3691215182124273033样本平均数=25.45控制下限=22.89控制上限=28.00Jane 的 单个测量Jane 的 单个测量
22、-0.50.00.51.01.52.02.53.03.5“Jane”的移动控制范围3691215182124273033样本平均数=0.962控制下限=0.000控制上限=3.143Jane 的 移动控制范围Jane 的 移动控制范围43步骤2:检验正态性44步骤2:检验正态性45步骤2:检验正态性位置离差类类 型型参参 数数25.4460730.9880899估估 计计25.0771140.78692179 95 5%下下 限限25.8150321.32830439 95 5%上上 限限参参 数数 估估 计计 Shapiro-Wilk W 检验0.974329W W 0.6630p p 值值
23、 W W注:Ho=数据来自 正态 分布。小 p 值拒绝 Ho。拟拟 合合 优优 度度 检检 验验正正 态态 拟拟 合合位置离差类类 型型参参 数数24.8482070.8693181估估 计计24.5235980.69233099 95 5%下下 限限25.1728151.16863759 95 5%上上 限限参参 数数 估估 计计 Shapiro-Wilk W 检验0.932453W W 0.0571p p 值值 Fp 值 F2.4882t 检验t 检验等方差检验等方差检验50步骤4:均值检验 51步骤4:均值检验 232425262728整理时长BobJane坐席员R 平方调整 R 平方均
24、方根误差响应均值观测值(或权重和)0.0964490.0808710.93060125.1471460拟合汇总拟合汇总Jane-Bob假定方差相等差分差的标准误差差的置信上限差的置信下限置信0.597870.240281.078840.116890.95t 比率DFp 值|t|p 值 tp 值 t2.488207580.0157*0.0079*0.9921-0.8-0.40.00.40.8t 检验t 检验52结论的陈述n由于由于P值小于临界置信水平(本例中值小于临界置信水平(本例中P=0.01570.05,我们可以作,我们可以作出下述结论:出下述结论:n我们有足够的证据拒绝零假设我们有足够的证
25、据拒绝零假设53假设检验 多样本比较54n假设检验用于比较假设检验用于比较数据样本的数据样本的nANOVA检验陈述的原假设(检验陈述的原假设(null hypothesis)是所有样本的均是所有样本的均值都相同值都相同Ho:a=b=c=d=e nANOVA检验陈述的备择假设(检验陈述的备择假设(alternate hypothesis)是至少有是至少有一个均值是不同的一个均值是不同的Ha:至少一对至少一对 是不同的是不同的方差分析 ANOVA55“方差分析(ANOVA)”解决什么问题?典型的问题为典型的问题为:“我们各抽取了坐席员我们各抽取了坐席员Bob,Jane和和Walt的各的各30通电话
展开阅读全文