六西格玛绿带教程(相关与回归)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《六西格玛绿带教程(相关与回归)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛 绿带 教程 相关 回归 课件
- 资源描述:
-
1、相关分析和回归分析绿带培训教程 DMAIC阶段阶段 Define 界定界定Measure 测量测量Analyze 分析分析Improve 改进改进Control 控制控制项目启动项目启动寻找寻找Y=f(x)建立基准建立基准测量测量Y=f(x)确定要因确定要因分析分析Y=f(x)消消 除要因除要因 优化优化Y=f(x)贯彻执行贯彻执行更新更新Y=f(x)SIPOC过程图过程图C&E矩阵和矩阵和FMEA多变量研究多变量研究假设检验假设检验试验设计筛选试验设计筛选优化的过程优化的过程30 50个个X10-15 个个X8 10个个 X4-8 关键的关键的X 3-6个个关键的关键的X 漏斗效应控制计划控
2、制计划MAI CD相关分析和回归分析 因果矩阵分析因果矩阵分析 多变量分析多变量分析 相关与回归分析相关与回归分析相关分析和回归分析 因果矩阵分析因果矩阵分析 多变量分析多变量分析 相关与回归分析相关与回归分析因果矩阵分析法因果矩阵分析法 因果矩阵分析法是寻找影响主要过程输出变量因果矩阵分析法是寻找影响主要过程输出变量的主要输入变量的一种方法。的主要输入变量的一种方法。因果矩阵分析法步骤:因果矩阵分析法步骤:(1)确定主要过程输出变量;)确定主要过程输出变量;(2)确定主要过程输出变量的重要度;)确定主要过程输出变量的重要度;(从重要到不重要(从重要到不重要101级)级)(3)列出过程步骤(工
3、序);)列出过程步骤(工序);(4)针对每个主要过程输出变量,确认对该输出)针对每个主要过程输出变量,确认对该输出有影响的输入变量;有影响的输入变量;(5)确定输入变量和输出变量之间相关程度)确定输入变量和输出变量之间相关程度(从相关到不相关(从相关到不相关100级)级)(6)计算每个工序输入变量的总分;)计算每个工序输入变量的总分;(7)根据总分确定输入变量的优先级别(得分最)根据总分确定输入变量的优先级别(得分最高的几个输入变量可能为关键输入变量)高的几个输入变量可能为关键输入变量)(8)对关键输入变量影响的真实性加以验证。)对关键输入变量影响的真实性加以验证。案例:案例:某公司加工某公司
4、加工X产品,为了确认对输出存在主要产品,为了确认对输出存在主要影响的过程输入变量,该公司决定对生产过程进行影响的过程输入变量,该公司决定对生产过程进行因果分析。因为缺陷有几种,所以用因果图分析效因果分析。因为缺陷有几种,所以用因果图分析效率较低,该公司六西格玛团队决定最终用因果矩阵率较低,该公司六西格玛团队决定最终用因果矩阵分析法来帮助分析。分析法来帮助分析。1.确定过程主要输出变量确定过程主要输出变量 通过头脑风暴法,结合目前的过程缺陷,通过头脑风暴法,结合目前的过程缺陷,得出得出X产品加工过程主要输出如下:产品加工过程主要输出如下:X产品加工过程产品加工过程ABCDEF主要输出主要输出2.
5、确定过程主要输出变量的重要度如下表:确定过程主要输出变量的重要度如下表:过程主要输出重要度A10B8C5D10E10F93.列出过程步骤,并与过程主要输出联立成关列出过程步骤,并与过程主要输出联立成关 系矩阵,如表所示:系矩阵,如表所示:过过程程输输出出108510109工工序序输输入入变变量量ABCDEF评评分分a32724141Ib12561c1220IId134494IIIe27644186f14422102IVg1222276h32731121Vi101056105410j833119VIk24262l536104VIIm213263VIIIn357105o8410220IXp1081
6、40Xq1560XIr21133XIIs215534.针对每个主要输出变量,在每个工序列出对针对每个主要输出变量,在每个工序列出对 该输出有影响的输入变量,如表。该输出有影响的输入变量,如表。5.确定输入变量与输出变量之间的相关程度,确定输入变量与输出变量之间的相关程度,如表。如表。6.计算每个工序输入变量的总分计算每个工序输入变量的总分 从表中可知,从表中可知,“i”的总分为的总分为410,“0”的总的总分为分为220,“e”的总分为的总分为186,占前三位,因此,占前三位,因此,认为以上几个输入变量为影响过程输出的关键认为以上几个输入变量为影响过程输出的关键输入变量,需重点给予改进。输入变
7、量,需重点给予改进。7.根据总分确定输入变量的优先级别根据总分确定输入变量的优先级别8.对关键输入变量影响的真实性加以验证对关键输入变量影响的真实性加以验证相关分析和回归分析 因果矩阵分析因果矩阵分析 多变量分析多变量分析 相关分析与回归分析相关分析与回归分析多变量分析多变量分析多变量图(多变量图(Multi-Vari Chart):适用于):适用于连续型数据,描述变量间的关系连续型数据,描述变量间的关系多变量图多变量图:直观地提供过程各影响因素之直观地提供过程各影响因素之间的关系以及它们对过程输出影响的坐标间的关系以及它们对过程输出影响的坐标图。六西格玛团队在研究多个变量时,可图。六西格玛团
8、队在研究多个变量时,可用多变量图形象地描述变量间的关系。这用多变量图形象地描述变量间的关系。这些图在方差分析等数据分析之前做,可以些图在方差分析等数据分析之前做,可以对数据有一些初步的形象了解对数据有一些初步的形象了解。多变量图多变量图 例例:项目团队研究三种材料在某种条件下项目团队研究三种材料在某种条件下的时间效应。数据收集过程是在三个通的时间效应。数据收集过程是在三个通电时间电时间0.5,1.0,1.5分钟里分别测量每种材分钟里分别测量每种材料(材料料(材料1,材料,材料2和材料和材料3)的)的5个样品,个样品,在进行数据分析前,了解是否有明显的在进行数据分析前,了解是否有明显的趋势成交互
9、作用。趋势成交互作用。A通电时间通电时间B材料材料 C超导强度超导强度0.50.50.50.50.50.50.50.50.51.01.01.01.01.01.01.01.01.01.51.51.51.51.51.51.51.51.511122233311122233311122233323202122192019182122201924252220192218181621232020222432125242322212019181716B材料C超 导 强 度0.5 1.0 1.5 材 料 多 变 量 图A通电时间多变量图多变量图 在输出的多变量图中,每一材料类型上都有连在输出的多变量图中,每一
10、材料类型上都有连接三个点的连线,这三个点表示在对应的材料接三个点的连线,这三个点表示在对应的材料类型下,各个时间段里材料的超导强度的平均类型下,各个时间段里材料的超导强度的平均值,反映了各个材料类型组内的信息,值,反映了各个材料类型组内的信息,图中虚线连线上的各个点分别代表三种材料的图中虚线连线上的各个点分别代表三种材料的超导强度的平均值,反映了各个材料类型组间超导强度的平均值,反映了各个材料类型组间的信息的信息,它们虽有差别,但并不严重。它们虽有差别,但并不严重。同种材料内分别对应的通电时间(通电时间分同种材料内分别对应的通电时间(通电时间分别为:别为:0.5,1.0,2.0分钟)的超导强度
11、差异较大,分钟)的超导强度差异较大,而且不同材料对应同样的通电时间的图象样子而且不同材料对应同样的通电时间的图象样子差别很大,差别很大,说明材料的种类与通电时间的长度说明材料的种类与通电时间的长度有交互作用。有交互作用。回归分析回归分析(Regression Analysis)二类关系二类关系 相关系数相关系数 相关系数的检验相关系数的检验 一元线性回归模型一元线性回归模型 回归方程的显著性检验回归方程的显著性检验 利用回归方程作预测利用回归方程作预测 利用回归方程作控制利用回归方程作控制 可化为线性回归的例子可化为线性回归的例子两变量间关系两变量间关系l确定关系确定关系:例:圆面积例:圆面积
12、S与半径与半径Rl相关关系相关关系:例:(例:(1)儿子的身高与父亲的身高)儿子的身高与父亲的身高 (2)教育投资与家庭收入)教育投资与家庭收入 (3)体重与身高)体重与身高 (4)合金钢强度与合金钢中的碳含量)合金钢强度与合金钢中的碳含量l因果关系因果关系:l例:发炎与发烧例:发炎与发烧例例1 1 由专业知识知道,合金的强度由专业知识知道,合金的强度y(107Pa)与合金中碳的含量与合金中碳的含量x(%)有关。为了生产强度满足有关。为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?用户需要的合金,在冶炼时如何控制碳的含量?如果在冶炼过程中通过化验得如果在冶炼过程中通过化验得12组数据
13、,列于下组数据,列于下表中:表中:为解决这类问题就需要研究两个变量间的关系。为解决这类问题就需要研究两个变量间的关系。序号 i xi(%)y(107Pa)1 0.10 42.0 2 0.11 43.0 3 0.12 45.0 4 0.13 45.0 5 0.14 45.0 6 0.15 47.5 7 0.16 49.0 8 0.17 53.0 9 0.18 50.0 10 0.20 55.0 11 0.21 55.0 12 0.23 60.0 画画散点图散点图。为了研究两个量间存在什么关系,。为了研究两个量间存在什么关系,可以画一张散点图,具体见下图:可以画一张散点图,具体见下图:回归分析是研
14、究一个随机变量回归分析是研究一个随机变量y与另一些变量与另一些变量x1,x2,xk(普通变量或随机变量)之间关系的统(普通变量或随机变量)之间关系的统计方法。计方法。在某些问题中,诸在某些问题中,诸x带有带有“原因原因”的性质,故的性质,故称之为自变量。而称之为自变量。而y带有带有“结果结果”的性质,故称的性质,故称之为因变量。之为因变量。有时有时x与与y之间并无明显的因果关系,但仍沿之间并无明显的因果关系,但仍沿用自变量与因变量的名称。用自变量与因变量的名称。有时也称有时也称x为为“因子因子”或或“因素因素”,称,称y为为“指标指标”或或“响应响应”。相相 关关 系系 数(数(correla
15、tion coefficients)散点图呈现上图的形状,即散点图呈现上图的形状,即n个点基本在一条个点基本在一条直线附近,但又不完全在一条直线上,我们希望用直线附近,但又不完全在一条直线上,我们希望用一个量来表示他们的密切程度,这个量称为相关系一个量来表示他们的密切程度,这个量称为相关系数,记为数,记为r,它被定义为:,它被定义为:可以证明有可以证明有-1r1。yyxxxyn1in1i2i2in1iiilll)yy()xx()yy)(xx(rn1iixn1x,n1iiyy2n1i2in1i2ixxxnx)xx(lyxnyx)yy)(xx(ln1iiin1iiixy2n1i2in1i2iyyy
16、ny)yy(l在合金钢的例子中可算得:在合金钢的例子中可算得:1583.0 x 2083.49y 3194.0 x2i 75.29392y2i9250.95yxii4292.22083.491583.0129250.95l2292.3352083.491275.29392l01869.01583.0123194.0lxy2yy2xx2292.33501869.04292.2lllryyxxxy 9705.05031.24292.2相关系数相关系数r 示意图与说明示意图与说明相关系数相关系数r大小是表示两个变量大小是表示两个变量x与与y之间线之间线性相关的程度。性相关的程度。当当r=1时,时,n
17、个点在一条直线上,这时两个个点在一条直线上,这时两个变量间变量间完全线性相关完全线性相关。xy r=1,完全线性正相关xyr=-1,完全线性负相关当当r0时,称两个变量间具有时,称两个变量间具有正相关正相关,这时,这时当当x的值增加时,的值增加时,y的值也有增大的趋势。的值也有增大的趋势。0yx强正相关强正相关变量之间有很强的正相关性,变量之间有很强的正相关性,暗示变量之间可能存在显著暗示变量之间可能存在显著的因果关系。在此模式下,的因果关系。在此模式下,一般能够建立起有效的回归一般能够建立起有效的回归方程。方程。yx0弱正相关弱正相关变量之间有一定的正相关性,变量之间有一定的正相关性,暗示变
18、量之间可能存在较弱暗示变量之间可能存在较弱的因果关系,或者变量(其的因果关系,或者变量(其中之一或全部)受其他变量中之一或全部)受其他变量的显著影响。的显著影响。当当r0.576,如今,如今r=0.9705,可以显著性水平,可以显著性水平=0.05认认为,合金强度为,合金强度y与其碳含量与其碳含量x间存在线性关系。间存在线性关系。)2n(rrW21)1n(r2121相关系数检验的临界值表相关系数检验的临界值表 n-2 5%1%n-2 5%1%n-2 5%1%1 0.997 1.000 16 0.468 0.590 35 0.325 0.418 2 0.950 0.990 17 0.456 0.
19、575 40 0.304 0.393 3 0.878 0.959 18 0.444 0.561 45 0.288 0.372 4 0.811 0.917 19 0.433 0.549 50 0.273 0.354 5 0.754 0.874 20 0.423 0.537 55 0.250 0.325 6 0.707 0.834 21 0.413 0.526 60 0.232 0.302 7 0.666 0.798 22 0.404 0.515 70 0.217 0.283 8 0.632 0.765 23 0.396 0.505 80 0.205 0.267 9 0.602 0.735 24
20、0.388 0.496 90 0.195 0.254 10 0.576 0.708 25 0.381 0.487 100 0.174 0.228 11 0.553 0.684 26 0.374 0.478 150 0.159 0.208 12 0.532 0.661 27 0.367 0.470 200 0.138 0.181 13 0.514 0.641 28 0.361 0.463 300 0.113 0.148 14 0.497 0.623 29 0.355 0.456 400 0.098 0.128 15 0.482 0.606 30 0.349 0.449 1000 0.062 0.
21、081 一元线性回归模型一元线性回归模型假定有两个变量:假定有两个变量:x是自变量,其值是可以控制或精确测量的,是自变量,其值是可以控制或精确测量的,认为它的非随机变量。认为它的非随机变量。y是因变量,对给定的是因变量,对给定的x值,值,y的取值事先不的取值事先不确定,故确定,故y是随机变量。是随机变量。假设(假设(x,y)的散点图显示有直线关系,则)的散点图显示有直线关系,则我们可以认为观测值我们可以认为观测值y由两部分迭加而成:一是由两部分迭加而成:一是随随x的变化而呈线性变化的趋势,用的变化而呈线性变化的趋势,用0+1x表示;表示;二是其它随机因素影响的总和,用二是其它随机因素影响的总和
22、,用表示,常设表示,常设N(0,2)。故有如下的数据结构式:。故有如下的数据结构式:yi=0+1x+i,i=1,2,n回归系数的最小二乘估计回归系数的最小二乘估计。按最小二乘法:按最小二乘法:记记若若 与与 满 足 如 下 等 式:满 足 如 下 等 式:则称则称 ,为为0,1的最小二乘估计。的最小二乘估计。n1i2i10i10)xy(),(Q01),(Qmin),(Q101,010010 与与1的最小二乘估计的最小二乘估计可以验证:可以验证:,使使Q(0,1)达到最小,故其为最达到最小,故其为最小二乘估计。小二乘估计。回归方程:回归方程:此回归方程总经过此回归方程总经过 和和 二点二点 xy
展开阅读全文