1、医学统计学医学统计学方差分析方差分析 (Analysis of Variance) 将所研究的对象分为多个处理组将所研究的对象分为多个处理组, ,施加不同施加不同的干预,施加的干预称为的干预,施加的干预称为处理因素(处理因素(factorfactor),处理因素至少有两个处理因素至少有两个水平水平(level)(level)。用这类资料用这类资料的样本信息来推断各处理组间多个总体均数是的样本信息来推断各处理组间多个总体均数是否存在差别,常采用的统计分析方法为否存在差别,常采用的统计分析方法为方差分方差分析析(analysis of variance, ANOVA)(analysis of va
2、riance, ANOVA)。 方差分析方差分析由英国统由英国统计学家计学家R.A.Fisher在在1923年提出,为年提出,为纪念纪念Fisher,以,以F命名,故方差分析命名,故方差分析又称又称 F 检验。检验。第一节第一节 完全随机设计的方差分析完全随机设计的方差分析第二节第二节 随机区组设计的方差分析随机区组设计的方差分析第三节第三节 多个样本均数的两两比较多个样本均数的两两比较 第四节第四节 方差齐性检验方差齐性检验 例例1 1 拟探讨枸杞多糖(拟探讨枸杞多糖(LBPLBP)对酒精性脂肪肝大鼠)对酒精性脂肪肝大鼠GSHGSH(mg/gprotmg/gprot)的影响,将)的影响,将3
3、636只大鼠随机分为甲、只大鼠随机分为甲、乙、丙三组,其中甲(正常对照组)乙、丙三组,其中甲(正常对照组)1212只,其余只,其余2424只只用乙醇灌胃用乙醇灌胃1010周造成大鼠慢性酒精性脂肪肝模型后,周造成大鼠慢性酒精性脂肪肝模型后,再随机分为再随机分为2 2组,乙(组,乙(LBPLBP治疗组)治疗组)1212只,丙(戒酒组)只,丙(戒酒组)1212只,只,8 8周后测量三组周后测量三组GSHGSH值。试问三种处理方式大鼠值。试问三种处理方式大鼠的的GSHGSH值是否相同?值是否相同? 第一节第一节 完全随机设计的方差分析完全随机设计的方差分析从这个表,可以看到三种变异:从这个表,可以看到
4、三种变异:全部数据间的变异全部数据间的变异 总变异总变异三组之间数据的变异三组之间数据的变异 组间变异组间变异组内数据的变异组内数据的变异 组内变异组内变异 总总变异(变异(SST) 全全部测量值大小不部测量值大小不同同,这,这种变异称为总变种变异称为总变异,以各测量值异,以各测量值X Xijij与与总均总均数数 间的差异度间的差异度量。量。kinjijTiXXSS112)(30405060708090100110甲乙丙XXijX组间变异(组间变异(SSTR) 组内均值与总均值之差的平方和组内均值与总均值之差的平方和 21)(XXnSSikiiTR反映了:处理因素各个反映了:处理因素各个水平组
5、间的差异,同时水平组间的差异,同时也包含了随机误差。也包含了随机误差。iXX30405060708090100110甲乙丙X甲X乙X丙X组内变异组内变异(SS(SSe e) ) 组内各个观测值组内各个观测值 与本与本组内均值组内均值 之差的平方之差的平方和。和。反映了反映了组内(同一组内(同一水平下)样本的随机波水平下)样本的随机波动。动。 211)(ikinjijeXXSSiijX30405060708090100110甲乙丙甲X乙X丙XiXijX总变异、组间变异、组内变异的关系总变异、组间变异、组内变异的关系eTRTSSSSSSeTRT对应自由度的关系对应自由度的关系均方均方(mean s
6、quare)(mean square) 离均差平方和大小离均差平方和大小 与变异程度大小有关与变异程度大小有关 与其自由度大小有关与其自由度大小有关 将各部分离均差平方和除以相应自由度,其比将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方值称为均方差,简称均方(MS)。) 1( kSSSSMSTRTRTRTR组间均方:)(knSSSSMSeeee组内均方:F F 值与值与F F分布分布 组间均方与组内均方的比值称为组间均方与组内均方的比值称为F F统计量,服从统计量,服从F F分布,即分布,即eTRMSMSF 如果如果H H0 0成立,即成立,即各处理组的样本来自相同总体,各处理
7、组的样本来自相同总体,处理因素没有作用处理因素没有作用,则组间变异同组内变异一,则组间变异同组内变异一样,只反映随机误差作用的大小。样,只反映随机误差作用的大小。F 界值表界值表附表附表4 4 F F界值表(方差分析用,单侧界值)界值表(方差分析用,单侧界值)上行:上行:P P=0.05 =0.05 下行:下行:P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 61 11611612002002162162252252302302342344052405249994999540354035625562557645764585
8、958592 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.3398.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.3325254.244.243.393.392.992.992.762.762.602.602.492.497.777.775.575.574.684.684.184.183.853.853.633.63将结果整理成方差分析表将结果整理成方差分析表方差分析的基本思想方差分析的基本思想 首先将首先将总变异总变异分解为分解为组间变异组间变异和和误差(
9、组内)变误差(组内)变异异,然后比较两者的均方,即计算,然后比较两者的均方,即计算F F值值,若,若F F值大于某个值大于某个临界值,表示处理组间的效应不同,若临界值,表示处理组间的效应不同,若F F值接近甚至小值接近甚至小于某个临界值,表示处理组间效应相同于某个临界值,表示处理组间效应相同( (差异仅仅由随差异仅仅由随机原因所致机原因所致) )。 对于不同设计的方差分析,其思想都一样,即均将对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于处理间平均变异与误差平均变异比较。不同之处在于变变异分解的项目异分解的项目因设计不同而异。因设计不同而异。方差分析
10、的应用条件方差分析的应用条件各样本是相互独立的随机样本;各样本是相互独立的随机样本;各样本来自正态总体;各样本来自正态总体;各处理组总体方差相等,即方差齐性各处理组总体方差相等,即方差齐性或齐同(或齐同(homogeneity of variancehomogeneity of variance)。)。 上述条件与两均数比较的上述条件与两均数比较的t t检验的应用条件检验的应用条件相同。相同。 当组数为当组数为2 2时,方差分析与两均数比较的时,方差分析与两均数比较的t t检验是等价的,对同一资料检验是等价的,对同一资料, ,有有 Ft 提出检验假设,确定检验水准。提出检验假设,确定检验水准。
11、 H H0 0: : 三个组三个组GSHGSH值的总体均数相同;值的总体均数相同; H H1 1: : 三个组三个组GSHGSH值的总体均数不全相同;值的总体均数不全相同;05. 0 根据公式计算根据公式计算SSSS、MSMS及及F F值,列于方差分析表内值,列于方差分析表内( (计算计算过程省略过程省略) ) 方差分析步骤方差分析步骤 分子自由度分子自由度=k-1=2=k-1=2,分母自由度,分母自由度=n-k=33=n-k=33,查,查F F界值界值表(方差分析用),因界值表中无分母自由度表(方差分析用),因界值表中无分母自由度3333,取取=32=32,得,得F F0.05(2,32)0
12、.05(2,32)=3.30=3.30。 F F=23.85=23.85,F F F F0.05(2,32), 0.05(2,32), ,P P0.050.05,差别有统计学,差别有统计学意义,按照意义,按照0.050.05的显著性水准,拒绝的显著性水准,拒绝H H0 0, 可认为三种处理方式大鼠的可认为三种处理方式大鼠的GSHGSH值不全相同。值不全相同。 确定确定P P值,作出判断值,作出判断第二节第二节 随机单位组设计的方差分析随机单位组设计的方差分析 随机单位组设计随机单位组设计(randomized block design) :又称随机区组设计、配伍组设计,也叫双因素方差分析(tw
13、o-wayANOVA)。是配对设计的扩展。具体做法:将受试对象按性质(如性别、年龄、病情等)相同或相近者组成b个单位组(配伍组),每个单位组中有k个受试对象,分别随机地分配到k个处理组。这样,各个处理组不仅样本含量相同,生物学特点也较均衡。比完全随机设计更容易察觉处比完全随机设计更容易察觉处理间的差别理间的差别 。随机区组设计资料数据结构随机区组设计资料数据结构随机区组设计方差分析的数据结构随机区组设计方差分析的数据结构 A: :处理因素处理因素 B: :区组因素区组因素 水平水平 1 1 水平水平 2 2 水平水平 k 区组区组 1 1 11X 21X 1kX 区组区组 2 2 12X 22
14、X 2kX 区组区组m mX1 mX2 kmX 变异分解变异分解总变异总变异SSSST T可分解为可分解为: 处理因素处理因素的的变异变异SSSSA A SS SSA A 反映了各个水平组间的差异反映了各个水平组间的差异( (包含随机误差包含随机误差) ) 区组因素区组因素的的变异变异SSSSB B SS SSB B 反映了各个区组间的差异反映了各个区组间的差异( (包含随机误差包含随机误差) ) 随机误差随机误差SSSSe e SSe SSe 反映了样本的随机波动反映了样本的随机波动eBATSSSSSSSS 三者的关系如下:方差分析表方差分析表 例例2 2 为探讨为探讨RglRgl对镉诱导大
15、鼠睾丸损伤的保护作用,对镉诱导大鼠睾丸损伤的保护作用,某研究者将同一窝别的某研究者将同一窝别的3 3只大鼠随机地分到只大鼠随机地分到T1T1、T2T2、T3T3三组,进行不同处理三组,进行不同处理, , 共观察了共观察了1010个窝别大鼠的睾个窝别大鼠的睾丸丸MTMT含量(含量(g/gg/g)。试问不同处理对大鼠)。试问不同处理对大鼠MTMT含量有含量有无影响?无影响? 提出检验假设,确定检验水准提出检验假设,确定检验水准 随机区组设计方差分析步骤随机区组设计方差分析步骤 确定确定P P值,做出推断结论值,做出推断结论第三节第三节 多个均数的两两比较多个均数的两两比较 当方差分析的结果拒绝当方
16、差分析的结果拒绝H H0 0,接受,接受H H1 1 时,只说明时,只说明k k个总体均数不全相等。若想个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多进行多个样本均数间的两两比较或称多重比较(重比较(multiple comparisonmultiple comparison)。也叫)。也叫post hocpost hoc检验检验 若用上一章的若用上一章的两样本均数比较的两样本均数比较的t检验检验进行进行多重比较,将会加大犯多重比较,将会加大犯类错误(把本无差别类错误(把本无差别的两个总体均数判为有差别)的概率。的
17、两个总体均数判为有差别)的概率。 例如,有例如,有4个样本均数,两两组合数为个样本均数,两两组合数为 ,若用,若用t检验做检验做6次比较,且每次比较的检验水准次比较,且每次比较的检验水准选为选为 ,则每次比较不犯,则每次比较不犯类错误的概率类错误的概率为(为(10.05),),6次均不犯次均不犯类错误的概率为类错误的概率为 . 这时,总的检验水准变为这时,总的检验水准变为为什么一般为什么一般t t检验作多重比较是错误的?检验作多重比较是错误的?26. 0)05. 01(16 624 0.056)05. 01( SNK( (Student-Newman-Keuls) )法法 最常用方法之一,其检
18、验统计量为最常用方法之一,其检验统计量为q q,故又称为故又称为q检验 )11(2BAEBAnnMSXXq为误差均方EMS例例1 1 三组间两两比较三组间两两比较 将各组的平均值按由大到小的顺序排列将各组的平均值按由大到小的顺序排列 组别组别 甲甲 乙乙 丙丙 均数均数 83.15 75.63 52.27 例数例数 12 12 12 秩次秩次 1 2 3 根据前面方差分析有:根据前面方差分析有:MSe=130.5068MSe=130.5068331128.2)121121(25068.13063.7515.83)11(2q,12n ,12=n,75.63=X,83.15=X ,130.9809
19、=MS212-1BABAEaRRannMSXXBABAEBA对比,则,如其中,余类推。组比较组与第例如,第 第第1 1组与第组与第2 2组比较:组比较:P P0.05,0.05,不拒绝不拒绝H H0 0, ,差别无差别无统计学意义统计学意义, , 尚不能认为甲尚不能认为甲组与乙组大鼠组与乙组大鼠GSHGSH值总体均数值总体均数不相同不相同; 第第1 1组与第组与第3 3组比较:组比较:P P0.05,0.05,拒绝拒绝H H0 0, ,差别有差别有统计学意义统计学意义, , 可可认为认为甲组与丙组大鼠甲组与丙组大鼠GSHGSH值总体均数值总体均数不相同不相同; 第第2 2组与第组与第3 3组比
20、较:组比较: P P0.05,0.05,拒绝拒绝H H0 0, ,差别有差别有统计学意义统计学意义, , 可可认为认为乙组与丙组大鼠乙组与丙组大鼠GSHGSH值总体均数值总体均数不相同。不相同。 做出推断结论做出推断结论方差分析的应用条件方差分析的应用条件 各处理组样本来自各处理组样本来自随机、独立的正态总随机、独立的正态总体体- D- D法、法、W W法、卡方检验推断法、卡方检验推断 各处理组样本的各处理组样本的总体方差相等总体方差相等 - - BartlettBartlett检验法检验法 、LeveneLevene检验法检验法 第第四四节节 方差齐性检验方差齐性检验 (Homogeneit
21、y of Variance Test) BartlettBartlett检验法:正态分布资料检验法:正态分布资料 LeveneLevene检验法:非正态分布资料检验法:非正态分布资料BartlettBartlett检验法检验法212QQ1 kkiiciSSnQ1221)ln() 1(kiiknnkQ12111) 1(311对例对例1 1中三组资料作方差齐性检验。中三组资料作方差齐性检验。小小 结结 方差分析的基本原理方差分析的基本原理 完全随机设计的方差分析完全随机设计的方差分析 区组设计的方差分析区组设计的方差分析 多个样本均数间的两两比较多个样本均数间的两两比较-SNK法法 方差齐性检验方差齐性检验