第五章-回归设计课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第五章-回归设计课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 回归 设计 课件
- 资源描述:
-
1、5.1 5.1 回归设计的基本概念回归设计的基本概念5.2 Box5.2 BoxBenhkenBenhken设计设计5.3 5.3 二次回归的中心组合设计二次回归的中心组合设计5.4 5.4 二次回归正交设计二次回归正交设计5.5 5.5 二次回归旋转设计二次回归旋转设计5.6 D5.6 D最优混合设计最优混合设计第五章第五章 回归设计回归设计5.1 回归设计的基本概念回归设计的基本概念 回归设计方法是由英国统计学家回归设计方法是由英国统计学家G.BoxG.Box在在2020世世纪纪5050年代初针对化工生产提出的。年代初针对化工生产提出的。回归设计也称为响应面设计,目的是寻求试回归设计也称为
2、响应面设计,目的是寻求试验指标与各定量因子间的定量规律,找到工作验指标与各定量因子间的定量规律,找到工作条件的最优值(最优工艺、最佳配方等)。条件的最优值(最优工艺、最佳配方等)。它是在多元线性回归的基础上用主动收集数它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种据的方法获得具有较好性质的回归方程的一种试验设计方法。试验设计方法。5.1.1 回归分析回归分析数据处理由被动变主动数据处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,古典的回归分析方法只是被动地处理已有的试验数据,对试验点的安排不提任何要求,试验点散乱而不均匀,预对试验点的安排不提任
3、何要求,试验点散乱而不均匀,预测值的标准误很大,且对于回归方程的精度研究也很少。测值的标准误很大,且对于回归方程的精度研究也很少。其后果:其后果:(1 1)盲目增加试验次数盲目增加试验次数,这些试验数据还不能提供充分,这些试验数据还不能提供充分的信息,在许多复因子试验问题中达不到试验目的。的信息,在许多复因子试验问题中达不到试验目的。(2 2)对模型的合适性有时无法检验对模型的合适性有时无法检验,因为在被动处理数,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。据时在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数为了适应寻求最佳工艺、最佳配方、建
4、立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。较高的回归方程。为此,要求摆脱古典回归分析的被动局面,主动把试验为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。试验次数
5、,而且使数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的这就是二十世纪五十年代发展起来的“回归设计回归设计”所研所研究的问题。究的问题。回归设计的分类:回归设计的分类:根据建立的回归方程的次数不同,回归设计通常有一次根据建立的回归方程的次数不同,回归设计通常有一次回归设计、二次回归设计等;回归设计、二次回归设计等;根据设计的性质又有正交设计、旋转设计、通用设计和根据设计的性质又有正交设计、旋转设计、通用设计和最优设计等。最优设计等。本章仅介绍二次回归的各种设计方法。本章仅介绍二次回归的各种设计方法。5.1.2 多项式回归模型多项式回归模型 在一些试验中希望建立试验指标在一些试
6、验中希望建立试验指标 y 与各个与各个定量因子定量因子 之间关系的定量表达式,之间关系的定量表达式,即回归方程,以便通过该回归方程找出使指标即回归方程,以便通过该回归方程找出使指标满足极值要求的各因子的取值。满足极值要求的各因子的取值。可以假定可以假定 y与与 间有如下关系:间有如下关系:这里这里 是是 的一个函数,的一个函数,其图形也称为响应曲面。其图形也称为响应曲面。是随机误差,通常假定它服从均值为是随机误差,通常假定它服从均值为0 0,方差为方差为 的正态分布。的正态分布。pzzz,21pzzz,21),(21pzzzfy),(21pzzzfpzzz,212 试验设计中,我们称试验设计中
7、,我们称 为因子或自变量。为因子或自变量。称称 的可能取值的空间为因子空间。的可能取值的空间为因子空间。我们的任务就是从因子空间中寻找一个最佳工艺我们的任务就是从因子空间中寻找一个最佳工艺条件(最优点)条件(最优点),使,使y满足要求。满足要求。当当f 的函数形式已知时,可以通过最优化的方法的函数形式已知时,可以通过最优化的方法去寻找去寻找 。在许多情况下。在许多情况下f 的形式并不知道,这时的形式并不知道,这时常常用一个多项式去逼近它,即假定:常常用一个多项式去逼近它,即假定:pzzz,21),(002010pzzzz 20jijiijjjjjjjjzzzzy 这里各这里各 为未知参数,称为
8、回为未知参数,称为回归系数,通常需要通过试验数据对它们进行估计。归系数,通常需要通过试验数据对它们进行估计。,0ijjjj),(21pzzzz0z在实际中常用如下的一次与二次回归方程:在实际中常用如下的一次与二次回归方程:jjjzbby0 20jijiijjjjjjjjzzbzbzbby若用若用 表示相应的估计,则称表示相应的估计,则称 ,0ijjjjbbbb ybb zb zb z zjjjjjjjijijij02为为y关于关于 的的多项式回归方程多项式回归方程。pzzz,215.1.3 多元线性回归多元线性回归 多项式回归模型,在对变量作了变换并重新命名后也可多项式回归模型,在对变量作了变
9、换并重新命名后也可以看成是一个多元线性回归模型。比如对二次回归模型以看成是一个多元线性回归模型。比如对二次回归模型令令即变成五元线性回归模型。即变成五元线性回归模型。1 1回归模型回归模型 假定回归模型为:假定回归模型为:),0(,2,12110Nnixxyiiippii,21122222211122110zzzzzzy2211223142512,xz xzxzxzxz z记随机变量的观测向量为记随机变量的观测向量为回归参数向量为回归参数向量为 ,随机误差向量为,随机误差向量为结构矩阵结构矩阵上述模型可以表示为矩阵形式:上述模型可以表示为矩阵形式:nyyyY21p10n21npnppxxxxx
10、xX12211111112(0,)nnYXNI 2回归系数的最小二乘估计回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。估计回归模型中回归系数的方法是最小二乘法。记回归系数的最小二乘估计为记回归系数的最小二乘估计为 ,应满足,应满足如下正规方程组:如下正规方程组:当当 存在时,最小二乘估计为:存在时,最小二乘估计为:在求得了最小二乘估计后,可以写出回归方程:在求得了最小二乘估计后,可以写出回归方程:01(,)pBb bb X XBX Y1XX1BXXXYppxbxbby110 3对回归方程的显著性检验对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设:对回归方程的
11、显著性检验是指检验如下假设:H0:H1:不全为不全为0 则平方和分解式则平方和分解式 其中其中 为残差平方和,自由度为为残差平方和,自由度为 为回归平方和,自由度为为回归平方和,自由度为 当当H0为真时,有为真时,有 给定的显著性水平给定的显著性水平 ,拒绝域为拒绝域为 021pp,21REniiniiiniiTSSyyyyyyS121212)()()(iiiEyyS2)(1pnfE2)(yySiRpfR),(/EREERRffFfSfSF)1,(1pnpFF 4失拟检验失拟检验 当在某些点有重复试验数据,便可以对试验指标当在某些点有重复试验数据,便可以对试验指标 y 的期的期望是否是望是否是
12、 的函数进行检验,这种检验称为失的函数进行检验,这种检验称为失拟检验,它检验如下假设:拟检验,它检验如下假设:当在有些试验点上有当在有些试验点上有mi重复试验时,试验点为重复试验时,试验点为n,总试,总试验次数为验次数为N,残差平方和可进一步分解为组内平方和与组,残差平方和可进一步分解为组内平方和与组间平方和,其中组内平方和就是纯误差平方和,记为间平方和,其中组内平方和就是纯误差平方和,记为 ,组间平方和称为失拟平方和,记为组间平方和称为失拟平方和,记为 ,即:,即:pxxx,21001 1101 1:ppppHyxxHyxxeSLfeESSSLfSnimjiijeiyyS121)(efNni
13、mjijiiymy11niiiiLfyymS12)(1pnfLf,检验统计量为检验统计量为 在在H H0 0为真时,为真时,对于给定的显著性水平,对于给定的显著性水平 下,拒绝域为:下,拒绝域为:当拒绝当拒绝H H0 0时,需要寻找原因,改变模型,否则接受线性回时,需要寻找原因,改变模型,否则接受线性回归模型合适,可以将归模型合适,可以将S Se e与与S SLfLf合并作为合并作为S SE E检验方程是否显著。检验方程是否显著。其中其中eeLfLfLffSfSF/),(eLfLfffFF),(1eLfLfffFF 5对回归系数的显著性检验对回归系数的显著性检验 当回归方程显著时,可进一步检验
14、某个回归系数是否为当回归方程显著时,可进一步检验某个回归系数是否为0 0,也即检验如下假设:也即检验如下假设:每一项回归系数每一项回归系数j=1,2,=1,2,p逐一进行。逐一进行。常用的检验方法是常用的检验方法是t t检验或等价的检验或等价的F F检验,检验,F F统计量为:统计量为:其中其中 是是 中的第中的第j j+1+1个对角元素。个对角元素。记分子为记分子为 ,它是因子,它是因子 的回归平方和。的回归平方和。分母分母 是模型中是模型中 的无偏估计。的无偏估计。0010jjjjHH:,:222/jjjjjcbtFjjc1)(XX2/jjjjbcSjx22/EESf 当当H H0j0j为
15、真时,有为真时,有 。给定的显著性水平给定的显著性水平 ,当,当 时拒绝原假时拒绝原假设设H H0j0j,即认为,即认为 显著不为零,回归关系显著;否则人为显著不为零,回归关系显著;否则人为回归关系不显著,可以将对应的变量从回归方程中删除。回归关系不显著,可以将对应的变量从回归方程中删除。注:当有不显著的系数时,一般情况下一次只能删除注:当有不显著的系数时,一般情况下一次只能删除一个一个F F值最小的变量,重新计算回归系数,再重新检验。值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著时为止。通常要到余下的系数都显著时为止。),1(EjfFF),1(1EjfFFj5.1.4
16、因子水平的编码因子水平的编码 在回归问题中各因子的量纲不同,其取值的范围也不在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个换,使所有因子的取值范围都转化为中心在原点的一个单位单位“立方体立方体”中,这一变换称为对因子水平的编码。中,这一变换称为对因子水平的编码。方法如下:方法如下:设因子设因子 的取值范围为:的取值范围为:与与 分别为因子分别为因子 的下水平的下水平()()与上水平与上水平()()其中心也称为零水平:其中心也称为零水平:因子的变化半径为
17、因子的变化半径为 令编码值令编码值 ,而实际值,而实际值 此变换式就称为此变换式就称为“编码变换编码变换”zmMzzzzmzMz0()/2mMzzz()/2Mmzz 0zzx0zzx 例例5.1.1 5.1.1 因子因子z z的取值范围为:的取值范围为:1030,对其作编码:对其作编码:编码后,编码后,10对应对应-1,30对应对应1,20对应对应0。变换后,正交点在编码空间变换后,正交点在编码空间为中心在原点的立方体,其边为中心在原点的立方体,其边长为长为2 2。22010zx 编码变换后,编码变换后,z zm m对应的编码对应的编码为为 ,z zM M对应的编码为对应的编码为 ,z z0
18、0对应的编码为对应的编码为0 0。这样不管什么。这样不管什么取值范围,都转化为值域取值范围,都转化为值域-1,1-1,1或或-,-,。见示意图。见示意图。15.2 BoxBoxBenhkenBenhken设计设计BoxBoxBehnkenBehnken设计是由统计学家设计是由统计学家BoxBox和和BehnkenBehnken 提出的一种比较常用的回归设计提出的一种比较常用的回归设计方法,适用于方法,适用于2 2至至5 5个因子的优化实验。个因子的优化实验。BoxBoxBehnkenBehnken设计首先假定实验范围内设计首先假定实验范围内因子存在二次项,其基试验点的选取为编因子存在二次项,其
19、基试验点的选取为编码立方体的每条棱的中点,即码立方体的每条棱的中点,即任意两因子任意两因子做做2 22 2交互,而交互,而其它因子固定在其它因子固定在0 0水平水平。再加上中心点。再加上中心点。三因子三因子Box-Box-BehnkenBehnken设计设计 试验点示意图试验点示意图BoxBoxBenhkenBenhken设计设计例题例题:对超高压杀灭枯草芽孢:对超高压杀灭枯草芽孢杆菌效果杆菌效果Y Y的研究发现:温度、的研究发现:温度、压力、保压时间是灭活枯草芽压力、保压时间是灭活枯草芽孢杆菌显著影响因子。孢杆菌显著影响因子。研究结果表明杀灭研究结果表明杀灭6 6个数量个数量级的枯草芽孢杆菌
20、的杀菌条件:级的枯草芽孢杆菌的杀菌条件:温度为温度为T T=30=306060,压力为,压力为P P=200=200600 600 MPaMPa,保压时间为,保压时间为M M=10=1020min20min,试分析最优杀,试分析最优杀菌工艺参数。菌工艺参数。BoxBoxBenhkenBenhken设计设计BoxBoxBenhkenBenhken设计设计题解:题解:本试验采用本试验采用Box-Box-BehnkenBehnken设计,以温设计,以温度度T T,压力,压力P P,保压时间,保压时间M M 三个外界因子为三个外界因子为自变量,并以自变量,并以+1+1、0 0、-1-1分别代表自变量的
21、分别代表自变量的高、中、低水平,对自变量进行编码。高、中、低水平,对自变量进行编码。超高压杀灭菌的数量级超高压杀灭菌的数量级Y Y为响应值(为响应值(Y Y=-log-log1010 N Nt t/N/N0 0,即经超高压作用后枯草芽孢,即经超高压作用后枯草芽孢杆菌死亡的数量级,杆菌死亡的数量级,N Nt t为超高压处理后为超高压处理后1ml1ml菌液中的活菌数,菌液中的活菌数,N N0 0为对照为对照1ml1ml菌液中的活菌液中的活菌数)菌数)BoxBoxBenhkenBenhken设计设计因子因子代号代号水平水平编码编码-1-10 01 1温度温度()()T T303045456060压力
22、压力(MPaMPa)P P200200400400 600600保压时间保压时间(min)(min)M M101015152020试验因子的水平及编码表试验因子的水平及编码表BoxBoxBenhkenBenhken设计设计试验设计与试验结果列表试验设计与试验结果列表Trial No.Trial No.T TP PM MY Y1 1-1-10 0-1-14.274.272 21 10 0-1-15.445.443 3-1-10 01 15.115.114 41 10 01 15.795.795 5-1-1-1-10 02.112.116 61 1-1-10 03.213.217 7-1-11 1
23、0 06.046.048 81 11 10 06.876.879 90 0-1-1-1-12.702.7010100 0-1-11 13.443.4411110 01 1-1-16.236.2312120 01 11 16.436.4313130 00 00 05.455.4514140 00 00 05.325.3215150 00 00 05.675.6716160 00 00 05.435.4317170 00 00 05.235.23BoxBoxBenhkenBenhken设计设计分析结果分析结果Factor DF SS MS F PT 4 2.041247 0.510312 13.6
24、7 0.0020P 4 26.797874 6.699469 179.46 .0001M 4 0.716485 0.179121 4.80 0.0352 在在0.050.05水平下,只有温度(水平下,只有温度(T T)压力()压力(P P)和保压时间(和保压时间(M M)与灭菌效果都存在显著的)与灭菌效果都存在显著的回归关系。回归关系。在在T=60.37,P=663.87,M=13.51 T=60.37,P=663.87,M=13.51 时,灭菌时,灭菌效果最大,达到效果最大,达到6.796.79。需要进行试验验证。需要进行试验验证。BoxBoxBenhkenBenhken设计设计T=60.3
25、7,P=663.87,M=13.51T=60.37,P=663.87,M=13.51时,极大值时,极大值Y=6.79Y=6.795.3 二次回归的中心组合设计二次回归的中心组合设计 一、中心组合设计方案一、中心组合设计方案 中心组合设计中的试验点由三部分组成:中心组合设计中的试验点由三部分组成:(1 1)将编码值)将编码值-1-1与与1 1看成每个因子的两个水平,采用看成每个因子的两个水平,采用二水平正交表安排试验,可以是全因子试验,也可以是二水平正交表安排试验,可以是全因子试验,也可以是其其1/21/2实施,实施,1/41/4实施等,称这种试验点为实施等,称这种试验点为正交点正交点。这样。这
展开阅读全文