1、第二军医大学卫生统计学教研室第二军医大学卫生统计学教研室 张罗漫张罗漫121n)XX)(XX(1n)YY)(XX(3组间变异组间变异总变异总变异组内变异组内变异4 三组战士行军后体温增加数三组战士行军后体温增加数()不饮水不饮水 定量饮水定量饮水 不限量饮水不限量饮水 1.9 1.4 0.9 1.8 1.2 0.7 1.6 1.1 0.9 1.7 1.4 1.1 1.5 1.1 0.9 1.6 1.3 0.9 1.3 1.1 0.8 1.4 1.0 1.0 1.6 1.2 0.9iX23.1X 总总Xij=+Ti+eij i=1,2,g j=1,2,n5组间离均差平方和组间离均差平方和(处理因
2、素处理因素+随机误差随机误差)组内离均差平方和组内离均差平方和(随机误差随机误差)总离均差平方和总离均差平方和 SS(sum of squares of deviations from mean)g1in1j2iji)XX(SS总总 g1i2ii)XX(nSS组组间间 g1in1j2iiji)XX(SS组组内内6gN 1g 1N SSSSSS 组组内内组组间间总总组组内内组组间间总总组组内内组组间间总总7组组内内组组内内组组内内组组间间组组间间组组间间 /SSMS/SSMSMS(mean square)组组内内组组间间组组内内变变异异组组间间变变异异MSMSF 8u如果处理因素无作用:如果处理
3、因素无作用:组间变异组内变异组间变异组内变异 F=如果处理因素有作用:如果处理因素有作用:组间变异组内变异组间变异组内变异 F uF界值表界值表 (附表附表3)0.05P FF21,05.0 组组内内组组间间 21 说明处理因素对实验结果有影响说明处理因素对实验结果有影响9102n 1 MSMS/SS/SSF 剩剩回回剩剩回回剩剩剩剩回回回回11YYX)YY()YY()YY(Y12)YY(YY(YY ))YY(YY(YY )222)YY)YY)YY (SS总总=SS回回+SS残残XXXYl/lb ,XbYa ,bXaY0)YY)(YY2 (222)YY()YY)(YY2YY()YY(()222
4、)YY()YY)(YY2YY()YY(()13n)Y(Yl)YY(SS22YY2 总总SS总总 Y的离均差平方和,说明未考虑的离均差平方和,说明未考虑X与与Y的回归关的回归关 系时系时Y的变异。的变异。XX2XYXY2l/lbl)YY(SS 回回SS回回 Y的总变异中可以用的总变异中可以用X解释的部分,解释的部分,SS回回越大,越大,说明回归效果越好。说明回归效果越好。SS残残 反映反映X对对Y线性影响之外的一切因素对线性影响之外的一切因素对Y变异的作变异的作 用,即在总平方和中无法用用,即在总平方和中无法用X解释的部分。解释的部分。2)YY(SS 残残residual sum of squa
5、re1415例例13-1 为研究为研究A、B、C三种饲料对猪的催肥效三种饲料对猪的催肥效果,用每种饲料喂养果,用每种饲料喂养8头猪一段时间,测头猪一段时间,测得每头猪的初始重量得每头猪的初始重量(X)与增重与增重(Y)。试分。试分析三种饲料对猪的催肥效果是否相同析三种饲料对猪的催肥效果是否相同?16jX协变量协变量17若不考虑猪的初始重量若不考虑猪的初始重量X对增重对增重Y的影响的影响H0:1=2=3H1:1、2、3不等或不全相等不等或不全相等 =0.05结论:三种不同饲料的催肥效果不同。结论:三种不同饲料的催肥效果不同。18T Te es st ts s o of f B Be et tw
6、we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:增重(kg)1317.583a2658.79211.172.000204057.0421204057.0423460.339.0001317.5832658.79211.172.0001238.3752158.970206613.000242555.95823SourceCorrected ModelIntercept饲料组ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareF
7、Sig.R Squared=.515(Adjusted R Squared=.469)a.D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs sDependent Variable:增重(kg)81.75008.34523898.00005.12696896.87508.99901892.208310.5417624饲料组A饲料B饲料C饲料TotalMeanStd.DeviationN1920p由于各组猪的初始重量差别较大,由于各组猪的初始重量差别较大,如果不如果不考虑猪的初始重量考虑猪的初始重量X对增重对增重Y的影响,
8、的影响,直接直接用方差分析比较各组猪的平均增重,以评价用方差分析比较各组猪的平均增重,以评价三种饲料对猪的催肥效果,这是不恰当的。三种饲料对猪的催肥效果,这是不恰当的。p如何在扣除或均衡这些不可控制因素的影如何在扣除或均衡这些不可控制因素的影响后比较多组均数间的差别,响后比较多组均数间的差别,应用协方差分应用协方差分析。析。p当有一个协变量时,称一元协方差分析;当有一个协变量时,称一元协方差分析;当有两个或两个以上协变量时,称多元协方当有两个或两个以上协变量时,称多元协方差分析。差分析。21p协方差分析是将协方差分析是将线性回归线性回归与与方差分析方差分析相结合相结合 的一种分析方法。的一种分
9、析方法。p把对把对反应变量反应变量Y有影响的因素有影响的因素X看作协变量看作协变量,建立建立Y对对X的线性回归,的线性回归,利用回归关系把利用回归关系把X值值 化为相等,再进行各组化为相等,再进行各组Y的修正均数间比较的修正均数间比较。p修正均数修正均数是假设各协变量取值固定在其总是假设各协变量取值固定在其总 均数时的反应变量均数时的反应变量Y的均数。的均数。2)YY(2)YY(2)YY(p其实质是从其实质是从Y的总离均差平方和的总离均差平方和 中中 扣除协变量扣除协变量X对对Y的回归平方和的回归平方和 ,对残差平方和对残差平方和 作进一步分解后再进作进一步分解后再进 行方差分析。行方差分析。
10、22YYX)YY()YY()YY(Y23FMSMS)YY()YY()YY()YY()YY(22222 组组内内修修正正均均数数间间组组内内组组内内修修正正均均数数间间修修正正均均数数间间组组内内修修正正均均数数间间总总组组内内修修正正均均数数间间总总残差平方和的分解残差平方和的分解24 饲料饲料1饲料饲料21X0X2X)YX(11,)YX(22,12YY )YX(20,)YX(10,12YY Y251.各组协变量各组协变量X与因变量与因变量Y的关系是线性的,的关系是线性的,即各样本回归系数即各样本回归系数b本身有统计学意义。本身有统计学意义。2.各样本回归系数各样本回归系数b间的差别无统计学意
11、义,间的差别无统计学意义,即各回归直线平行。即各回归直线平行。3.各组残差呈正态分布。各组残差呈正态分布。4.各协变量均数间的差别不能太大,否则有各协变量均数间的差别不能太大,否则有 的修正均数在回归直线的外推延长线上。的修正均数在回归直线的外推延长线上。2627jX281.H1.H0 0:各总体增重的修正均数相等各总体增重的修正均数相等 HH1 1:各总体增重的修正均数不全相等各总体增重的修正均数不全相等 =0.052.计算总的、组间与组内的计算总的、组间与组内的 lXX、lYY、lXY与与 自由度自由度1N N)Y)(X(XYl N)Y(Yl N)X(Xl XY2YY2XX 总总:291G
12、 N)Y)(X(n)Y)(X(l N)Y(n)Y(l N)X(n)X(l jjjXY2j2jYY2j2jXX 组间组间:30组组间间总总组组间间总总组组间间总总组组间间总总 lll lll lll )(XY)(XYXY)(YY)(YYYY)(XX)(XXXX组内组内:31XX2XYYY2lll)YY(组组内内总总修修正正均均数数222)YY()YY()YY(32 3.结论结论 F=31.07F0.01(2,20)=5.85 P0.05),但都高于,但都高于C饲料(饲料(P0.01),可以认为扣除可以认为扣除初始体重因素的影响后,初始体重因素的影响后,A饲料与饲料与B饲料喂养饲料喂养的平均增重均
13、比的平均增重均比C饲料的多。饲料的多。37SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 初始体重与饲料组无交互作用可认为初始体重与饲料组无交互作用可认为 各组回归直线平行,即初始体重对增各组回归直线平行,即初始体重对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验38数据输入原则:数据输入原则:一个变量占一列一个变量占一列一个观测对象占一行一个观测对象占一行3940SPSS软件计算软件计算1.建立数据文件建立数据文件
14、2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 初始体重与饲料组无交互作用可认为初始体重与饲料组无交互作用可认为 各组回归直线平行,即初始体重对增各组回归直线平行,即初始体重对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验41424344SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 初始体重与饲料组初始体重与饲料组无交互作用无交互作用可认为可认为 各
15、组回归直线平行,即初始体重对增各组回归直线平行,即初始体重对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验4546观测指标:增重观测指标:增重“处理因素处理因素”:饲料组:饲料组 初始体重初始体重47T Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:增重(kg)2376.382a5475.27647.640.000706.3851706.38570.805.0002
16、4.466212.2331.226.317830.4151830.41583.237.00048.038224.0192.408.118179.576189.976206613.000242555.95823SourceCorrected ModelIntercept饲料组初始重量(kg)饲料组*初始重量(kg)ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared=.930(Adjusted R Squared=.910)a.48SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建
17、立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 初始体重与饲料组无交互作用可认为初始体重与饲料组无交互作用可认为 各组回归直线平行,即初始体重对增各组回归直线平行,即初始体重对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验49前面已得出前面已得出三组斜率相三组斜率相同的结论,同的结论,故交互项不故交互项不需要再引入需要再引入到模型。到模型。50作图作图51E E s s t t i i m m a a t t e e s sDependent Variable:增重(kg)94.959
18、a1.84091.12098.79899.501a1.20396.991102.01182.165a1.96478.06886.263饲料组A饲料B饲料C饲料MeanStd.ErrorLower BoundUpper Bound95%Confidence IntervalCovariates appearing in the model are evaluated at thefollowing values:初始重量(kg)=19.2500.a.T Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef
19、 ff fe ec ct ts sDependent Variable:增重(kg)2328.344a3776.11568.196.000980.4481980.44886.150.000707.2192353.60931.071.0001010.76011010.76088.813.000227.6152011.381206613.000242555.95823SourceCorrected ModelIntercept饲料组初始重量(kg)ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared=.
20、911(Adjusted R Squared=.898)a.协变量假定均数协变量假定均数52P Pa ai ir rw wi is se e C Co om mp pa ar ri is so on ns sDependent Variable:增重(kg)-4.542*2.095.042-8.912-.17312.793*3.409.0015.68219.9044.542*2.095.042.1738.91217.336*2.409.00012.31022.361-12.793*3.409.001-19.904-5.682-17.336*2.409.000-22.361-12.310(J)饲
21、料组B饲料C饲料A饲料C饲料A饲料B饲料(I)饲料组A饲料B饲料C饲料MeanDifference(I-J)Std.ErrorSig.aLower Bound Upper Bound95%Confidence Interval forDifferenceaBased on estimated marginal meansThe mean difference is significant at the.05 level.*.Adjustment for multiple comparisons:Least Significant Difference(equivalent to noadjus
22、tments).a.535455例例13-2为研究为研究A、B、C三种饲料对增加大白鼠体三种饲料对增加大白鼠体重的影响,有人按随机区组设计将初始体重重的影响,有人按随机区组设计将初始体重相近的相近的36只大白鼠分成只大白鼠分成12个区组,再将每个个区组,再将每个区组的区组的3只大白鼠随机分入只大白鼠随机分入A、B、C三种饲三种饲料组,但在实验设计时未对大白鼠的进食量料组,但在实验设计时未对大白鼠的进食量加以限制。三组大白鼠的加以限制。三组大白鼠的进食量进食量(X)与所增与所增体重体重(Y)如下,问扣除进食量因素的影响后如下,问扣除进食量因素的影响后,三种饲料对增加大白鼠体重有无差别,三种饲料对
23、增加大白鼠体重有无差别?56jX57随机区组设计资料方差分析的变异分解随机区组设计资料方差分析的变异分解误误差差区区组组处处理理总总误误差差区区组组处处理理总总 SSSSSSSS总变异处理间变异总变异处理间变异+区组间变异区组间变异+误差误差随机区组设计资料协方差分析的变异随机区组设计资料协方差分析的变异分解与此相同分解与此相同58处理因素处理因素(饲料)(饲料)协变量协变量(进食量)(进食量)区组区组(大白鼠)(大白鼠)反应变量反应变量Y(增重增重)均数均数扣除协变量影响:扣除协变量影响:用线性回归残差平方和表示用线性回归残差平方和表示扣除区组的影响:扣除区组的影响:总变异区组变异处理变异误
24、差总变异区组变异处理变异误差591.H0:各总体增重的修正均数相等各总体增重的修正均数相等 H1:各总体增重的修正均数不全相等各总体增重的修正均数不全相等 =0.052.计算总的、饲料组间、大白鼠间、误差计算总的、饲料组间、大白鼠间、误差 项、饲料项、饲料+误差项的误差项的 lXX、lYY、lXY与与 自由度自由度60XX2XYYY2lll)YY(总变异白鼠间总变异白鼠间误误差差误误差差饲饲料料修修正正均均数数222)YY()YY()YY(61 3.结论结论:F=2.190.05 按按=0.05水准不拒绝水准不拒绝HH0 0,还不能认为扣,还不能认为扣 除进食量因素的影响后,三种饲料对增除进食
25、量因素的影响后,三种饲料对增 加大白鼠体重有差别。加大白鼠体重有差别。624.计算公共回归系数与修正均数计算公共回归系数与修正均数06.59)42.34640.492(4088.074.118Y C05.75)42.34662.274(4088.070.45Y B43.67)42.34623.272(4088.010.37Y A)XX(bYY4088.0246.36943873.15102llb*C*B*AjCj*jXXXYC 饲饲料料饲饲料料饲饲料料误误差差误误差差未修正前均数:未修正前均数:74.118Y 70.45Y 10.37YCBA 63SPSS软件计算软件计算1.建立数据文件建立数
26、据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 进食量与饲料组无交互作用可认为进食量与饲料组无交互作用可认为 各组回归直线平行,即进食量对增各组回归直线平行,即进食量对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验646566SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 进食量与饲料组无交互作用可认为进食量与饲料组无交互作用可认为 各组回归直线
27、平行,即进食量对增各组回归直线平行,即进食量对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验67686970SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回归直线平行性假定的检验 进食量与饲料组无交互作用进食量与饲料组无交互作用可认为可认为 各组回归直线平行,即进食量对增各组回归直线平行,即进食量对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验7172固定因素固定因素随机因素随机
28、因素交互作用交互作用73T Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:增重891.8241891.8247.752.0122265.66719.695115.038a104.929252.465.462.6372159.30019113.647b3769.56511342.6883.015.0172159.30019113.647b2827.53912827.53924.880.0002159.30019113.647b6
29、6.065233.032.291.7512159.30019113.647bSourceHypothesisErrorInterceptHypothesisErrorgroupHypothesisErrorblockHypothesisErrorXHypothesisErrorgroup*XType III Sumof SquaresdfMean SquareFSig.006 MS(block)+.994 MS(Error)a.MS(Error)b.74SPSS软件计算软件计算1.建立数据文件建立数据文件2.绘制散点图与建立直线回归方程绘制散点图与建立直线回归方程3.回归直线平行性假定的检验回
30、归直线平行性假定的检验 进食量与饲料组无交互作用可认为进食量与饲料组无交互作用可认为 各组回归直线平行,即进食量对增各组回归直线平行,即进食量对增 重的影响在各组间是相同的。重的影响在各组间是相同的。4.修正均数的计算与假设检验修正均数的计算与假设检验75前面已得出前面已得出三组斜率相三组斜率相同的结论,同的结论,故交互项不故交互项不需要再引入需要再引入到模型。到模型。76作图作图77E Es st ti im ma at te es sDependent Variable:增重67.428a4.96257.11077.74675.050a4.86064.94485.15759.063a8.3
31、6441.66976.457饲料分组A饲料B饲料C饲料MeanStd.ErrorLower Bound Upper Bound95%Confidence IntervalCovariates appearing in the model are evaluated at thefollowing values:进食量=346.419.a.协变量假定均数协变量假定均数7879T Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:增重
32、1691.40311691.40315.645.0012402.36722.221108.110a463.9482231.9742.189.1372225.36421105.970b3765.32611342.3023.230.0102225.36421105.970b6174.24816174.24858.264.0002225.36421105.970bSourceHypothesisErrorInterceptHypothesisErrorgroupHypothesisErrorblockHypothesisErrorXType III Sumof SquaresdfMean SquareFSig.009 MS(block)+.991 MS(Error)a.MS(Error)b.80YYX)YY()YY()YY(Y818283