1、1MANOVA and ANCOVA(Multivariate Analysis Of Variance and Analysis of Covariance)2ANOVA的复习CBTNo treatmentAnxiety AssessmentDrugs3课程目标n介绍 MANOVA 模型 ANOVA 加上更多的DVn介绍 ANCOVA模型-ANOVA加上协变量n介绍 MANCOVA 的前提4Multivariate Analysis of Variance(MANOVA)5ANOVA vs MANOVAn在所有的情况中,ANOVA 只有 1 个DV(ANOVA 也称为单变量检验(univar
2、iate tests)n当我们有多于1个相关的因变量时,我们就需要做MANOVAnMANOVA 可以是 one-way,two-way,between-groups,repeated measures 或 mixed6研究情境n一位研究者想比较奥运的志愿者和非志愿者大学生及献血与未献血的大学生有什么区别.n他想就以下方面进行比较:对志愿者的态度,对志愿者的情感,作志愿者的倾向性n这3个变量概念上是相关的.7如何寻找适宜的检验方法?n我们可以用分别用每一个因变量作3个ANOVA(或 independent t-test)n这意味着作3 次检验 n但是,每一次作检验我们都冒I类错误的风险8解决的方
3、法n作1次显著性检验评价各组在所有因变量上的差异n这就是 multivariate testnMANOVA则是考察类目型自变量在多个等距因变量的某种线性组合(centroid)的组均值差异,其组合原则是使组的差异或交互作用最大q第一个组合是使志愿者和非志愿者的差别最大q第二个组合是使献血与未献血者的差别最大q第三个组合是使志愿者组与献血组交互作用单元格的区分最大9例子n一位研究者想比较奥运的志愿者和非志愿者大学生有什么区别及献血与未献血的大学生有什么区别n他想就以下方面进行比较:对志愿者的态度,对志愿者的情感,作志愿者的倾向性n这3个变量概念上是相关的.10Two-Way Between-Gr
4、oups MANOVAPillais Trace=0.024;F(3,594)=4.801,p=.003M Mu ul lt ti iv va ar ri ia at te e T Te es st ts sb b.9463466.125a3.000594.000.000.0543466.125a3.000594.000.00017.5063466.125a3.000594.000.00017.5063466.125a3.000594.000.000.0244.801a3.000594.000.003.9764.801a3.000594.000.003.0244.801a3.000594.00
5、0.003.0244.801a3.000594.000.003.0061.227a3.000594.000.299.9941.227a3.000594.000.299.0061.227a3.000594.000.299.0061.227a3.000594.000.299.0081.497a3.000594.000.214.9921.497a3.000594.000.214.0081.497a3.000594.000.214.0081.497a3.000594.000.214Pillais TraceWilks LambdaHotellings TraceRoys Largest RootPil
6、lais TraceWilks LambdaHotellings TraceRoys Largest RootPillais TraceWilks LambdaHotellings TraceRoys Largest RootPillais TraceWilks LambdaHotellings TraceRoys Largest RootEffectInterceptvolunteerbloodvolunteer*bloodValueFHypothesis dfError dfSig.Exact statistica.Design:Intercept+volunteer+blood+volu
7、nteer*bloodb.12解释nMANOVA 结果显示奥运的志愿者和非志愿者大学生在以上3方面的因变量组合上有显著区别n献血与未献血的大学生没有显著差异n二者也没有交互作用n在哪些因变量上有差别?nUnivariate testsUnivariate TestsT Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts s344.662a3114.8875.267.001413.035b3137.6786.149.00065.299c321.7661.530.206146
8、233.3081146233.3086704.687.000171365.9971171365.9977654.118.000111357.6251111357.6257827.749.000193.4621193.4628.870.003291.1951291.19513.006.00044.391144.3913.120.07870.784170.7843.245.0727.89217.892.353.55317.383117.3831.222.26930.088130.0881.380.24167.987167.9873.037.082.0431.043.003.95612999.123
9、59621.81113343.68459622.3898478.70159614.226166081.000600192743.000600126144.00060013343.78559913756.7185998544.000599Dependent Variable对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历对作志愿者的态度对作志愿者的
10、情感以前作志愿者的经历对作志愿者的态度对作志愿者的情感以前作志愿者的经历SourceCorrected ModelInterceptvolunteersexvolunteer*sexErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared=.026(Adjusted R Squared=.021)a.R Squared=.030(Adjusted R Squared=.025)b.R Squared=.008(Adjusted R Squared=.003)c.14解释n在对志愿者的态度,对志愿者的情感
11、奥运的志愿者和非志愿者大学生有显著区别n但是,以前志愿者的倾向性对大学生作奥运志愿者无显著影响.n影响的性质如何?Plot16Post Hoc Testsn如果IV有2个以上水平,需要作事后检验n用 univariate ANOVA作事后检验17用哪一个统计量?Wilks(W);Hotellings(H);Pillais(P);Roys(R)转换成转换成 F statistic 当当 df=1 df=1 时时F F值都相同值都相同 当 df1 通常显著性相同通常显著性相同 W,H,R 比比P P通常更有效力通常更有效力 ,而而P P 更有耐受性更有耐受性(robust)18交互作用n一个自变量
12、在复合因变量上的变化依赖于另一个自变量吗?n例:给定3种治疗方法,是不是一种方法对男性有效而另一种方法对女性更有效?n如果每个单位格样本数相等,那么每一个交互作用与主效应独立,与其它交互作用也独立.19哪些 因变量是最重要的?n如果存在任何主效应或交互作用,自变量的不同水平造成哪些 因变量最大的变化或差别?n我们可以按照单变量检验中 F值的大小来确定一个因变量的重要性是最大,中等,最小,还是没有作用.20效应大小q2,可以大于1因为因变量之间是相关的qpartial 2,调整了高估的部分协方差同质性Boxs M方差同质性Levenes Test2122Mauchly test of spher
13、icity球形检验通过的条件为:23MANOVA的优越性n实验设计允许多个因变量指标实验设计允许多个因变量指标n防止防止I 类错误的膨胀类错误的膨胀n在某种特定条件下效力会增强。在某种特定条件下效力会增强。24MANOVA的局限性n很多情况下效力降低n有更多的统计前提需满足n有时解释困难25Repeated measures MANOVA26Repeated Measures MANOVA 的命令nGLMn aff_t1 aff_t2 aff_t3 att_t1 att_t2 att_t3n /WSFACTOR=time 3 Polynomialn /METHOD=SSTYPE(3)n /EM
14、MEANS=TABLES(time)COMPARE ADJ(BONFERRONI)n /PRINT=ETASQ OPOWERn /CRITERIA=ALPHA(.05)n /WSDESIGN=time.27282930GLM Repeated Measures 的基本结的基本结果输出果输出nWithin Subjects Factors nMauchleys Test of SphericitynTests of Within-Subjects EffectsnTests of Within-Subjects ContrastsnTests of Between-Subjects Effect
15、snMultivariate Tests31GLM Repeated Measures 的基本结果的基本结果输出:输出:Multivariate Tests32Mauchleys Test of SphericityMauchlys Test of SphericityMauchlys Test of Sphericityb b.9431.6382.441.9461.000.500.9052.7802.249.914.972.500MeasureMEASURE_1MEASURE_2Within Subjects EffecttimeMauchlys WApprox.Chi-SquaredfSi
16、g.Greenhouse-GeisserHuynh-FeldtLower-boundEpsilonaTests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportionalto an identity matrix.May be used to adjust the degrees of freedom for the averaged tests of significance.Corrected tests
17、 are displayed in theTests of Within-Subjects Effects table.a.Design:Intercept Within Subjects Design:timeb.33Tests of Within-Subjects EffectsUnivariate TestsUnivariate Tests2369.75621184.87823.932.000.45247.8641.0002369.7561.8921252.22323.932.000.45245.2901.0002369.7562.0001184.87823.932.000.45247.
18、8641.0002369.7561.0002369.75623.932.000.45223.932.99791.356245.6783.326.043.1036.651.60891.3561.82749.9963.326.048.1036.077.58091.3561.94446.9993.326.044.1036.464.59991.3561.00091.3563.326.079.1033.326.4222871.5785849.5102871.57854.88152.3242871.57858.00049.5102871.57829.00099.020796.6445813.735796.
19、64452.99115.034796.64456.37014.132796.64429.00027.470Sphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundMeasureMEASURE_
20、1MEASURE_2MEASURE_1MEASURE_2SourcetimeError(time)Type III Sumof SquaresdfMean SquareFSig.Partial EtaSquaredNoncent.ParameterObservedPoweraComputed using alpha=.05a.34Mauchly test of sphericityn如果该检验不显著如果该检验不显著,那麽将那麽将n 个单个自由度的个单个自由度的估计量加在一起来代表估计量加在一起来代表n 个自由度的总体估个自由度的总体估计就是恰当的计就是恰当的n如果该检验显著,即如果该检验显著,
21、即sphericity前提不能满足,前提不能满足,averaged F-tests 就过高估计了联系的强度。就过高估计了联系的强度。有两个办法:有两个办法:1.忽略忽略 averaged F-tests,只报告只报告 multivariate test of significance.2.用用 averaged F-tests 的校正公式的校正公式.如如 Huynh-Feldt Epsilon35多变量结果多变量结果(Multivariate ANOVA Results)n四种多变量参数:四种多变量参数:qPillais Trace:合并效应方差:合并效应方差qWilks Lambda:误差方
22、差的合并比率误差方差的合并比率/总方差总方差qHotelings Trace:有效方差的合并比率有效方差的合并比率/误差方差误差方差qRoys Largest Root:只用第一个维度,不考虑合并效应。只用第一个维度,不考虑合并效应。n如何选用?如何选用?q如果组的区别靠一个维度,如果组的区别靠一个维度,Wilks Lambda,Hotelings Trace更有效力更有效力q如果组的区别分布在几个维度如果组的区别分布在几个维度,Pillais Trace更有效力更有效力qPillais Trace 比较稳妥,适用于小样本,非均衡设计比较稳妥,适用于小样本,非均衡设计36解释显著的组内差异解释
23、显著的组内差异:事后检验事后检验n用比较主效应用比较主效应qEstimated Marginal Means Compare main effects。q注意所给出的比较是未校正过的注意所给出的比较是未校正过的nPost Hoc.对话框对检验组内差异不可用对话框对检验组内差异不可用3738Analysis of Covariance(ANCOVA)39协变量(covariate)n协变量是一个连续变量,在实验中没有操控,但却对因变量有着显著的影响.n协变量必须与因变量有显著相关 n选择协变量的标准:n使我们解释更多的组内方差,增加检验的效力q使我们去除混淆变量的影响造成的偏差40ANOVA是否
24、奥运志愿者志愿者倾向曾否献血41ANCOVA是否奥运志愿者志愿者倾向外向性曾否献血42ANOVA ResultT Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable:以前作志愿者的经历54.417a318.1391.272.283113706.2261 113706.226 7972.066.00038.454138.4542.696.10114.901114.9011.045.307.4401.440.031.8618686.21
25、660914.263129309.0006138740.633612SourceCorrected ModelInterceptvolunteerbloodvolunteer*bloodErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared=.006(Adjusted R Squared=.001)a.43ANCOVA ResultT Te es st ts s o of f B Be et tw we ee en n-S Su ub bj je ec ct ts s E Ef ff fe ec ct
26、 ts sDependent Variable:以前作志愿者的经历142.746a435.6872.524.04036115.198136115.198 2553.888.00088.329188.3296.246.01358.953158.9534.169.04215.127115.1271.070.3011.02611.026.073.7888597.88760814.141129309.0006138740.633612SourceCorrected ModelIntercepte_ivolunteerbloodvolunteer*bloodErrorTotalCorrected Tot
27、alType III Sumof SquaresdfMean SquareFSig.R Squared=.016(Adjusted R Squared=.010)a.44前后测设计n当随机化不能实现的时候,组间的基线可能是不等的n这些前测的差异可能成为混淆变量n解决:将前测分数当作协变量,这样就消除了基线的差异45MANOVA的前提条件46理论上的考量n漂亮的统计不能弥补设计的缺陷n因变量的选择要特别谨慎,高度相关的因变量会显著削弱分析的效力47被试数目和效力n每个单位格中的被试数目应大于因变量数目 n如果任何一个单位格中的被试数目小于因变量数目,单位格就成为奇单位(singular)而不可能
28、进行倒数运算.n如果被试数目/因变量数目比值很低,那么协方差同质的前提很有可能被拒绝.n如果被试数目/因变量数目比值很低,效力也会很低.48多元正态性n假设各个因变量在各单位格的均值及其所有线性组合都正态分布.n很难明确地表示出来.49多元正态性n在单变量检验中,当df20,且设计均衡时,对多元正态性的违反是可以耐受的.n如果在最小的单位格中,n20,而设计不均衡,对多元正态性的违反还是可以耐受的.n如果被试少,且设计不均衡,多元正态性的假定一般不能满足50没有 outliern需要在每一个单位格中识别univariate&multivariate outliers51线性关系nMANOVA
29、和 MANCOVA 假定所有因变量,所有 协变量和所有因变量/协变量对之间的线性关系.n线性关系的偏离降低统计的效力因为:q因变量线性组合不会使组间的差别最大化.q协变量不能最大限度地调整误差.52协方差矩阵的同质性(Homogeneity of Covariance Matrices)n假定设计中的每一个单位格都是从同一总体中抽取的以利于它们合理地合并在一起,形成误差项.n如果样本容量是均等的,MANOVA 对违反协方差矩阵的同质性具有耐受性,所以这种情形下Boxs M test 可以忽略.53协方差矩阵的同质性(Homogeneity of Covariance Matrices)n如果样
30、本容量不等,按照 alpha .001的标准进行 Boxs M 检验.如果Boxs M不显著,则同质性能满足.如果Boxs M仍显著,则问题比较复杂:.n这时查看数据:q如果具有较大样本容量的单位格有较大的方差,MANOVA 对违反协方差矩阵的同质性具有耐受性q如果具有较小样本容量的单位格有较大的方差,则只有虚无假设成立的结果会比较有把握,而否定虚无假设的结果则有问题.可使用更严格的标准(Pillais标准 instead of Wilks)54回归斜率的等质性(Homogeneity of Regression Slopes)nANCOVA的另一个前提n意思是协变量与因变量的关系在各组大致相
31、等n换言之,组与协变量应该没有交互作用55检验前提CoefficientsCoefficientsa a15.681.62125.250.000-.077.031-.102-2.499.013-.653.317-.084-2.058.04014.405.92915.512.000.083.092.110.905.366.268.591.034.453.651-.120.065-.237-1.845.066(Constant)外向性是否奥运志愿者(Constant)外向性是否奥运志愿者intModel12BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable:以前作志愿者的经历a.组与协变量交互作用不显著,前提满足