生物统计学课件方差分析一-PPT精选文档.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计学课件方差分析一-PPT精选文档.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 课件 方差分析 PPT 精选 文档
- 资源描述:
-
1、第五章第五章 方差分析(一)方差分析(一)n第一节第一节 方差分析原理方差分析原理n (一个性质、两个分布、三个假定)(一个性质、两个分布、三个假定)n第二节第二节 单向分组数据单向分组数据n (各组观察值个数有相同和不相同之分)(各组观察值个数有相同和不相同之分)n第三节第三节 多向分组数据多向分组数据 n (含两向分组、三向分组实例)(含两向分组、三向分组实例)n第四节第四节 三个假定与数据转换三个假定与数据转换*n (正态性、可加性、同质性)(正态性、可加性、同质性)第五章要点提示第五章要点提示 方差分析是本课程的重点,它与试验研究联系最为密切。学习时要方差分析是本课程的重点,它与试验研
2、究联系最为密切。学习时要从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,深刻理解方差分析原理的全部内涵,即一个性质、两个分布和深刻理解方差分析原理的全部内涵,即一个性质、两个分布和 三个假定三个假定(某些情况下作数据转换的必要性);(某些情况下作数据转换的必要性); 区分区分LSR法多重比较与法多重比较与t-test的异的异同点;同点; 重点掌握单因素随机区组和拉丁方试验结果的方差分析法,能熟重点掌握单因素随机区组和拉丁方试验结果的方差分析法,能熟练地运用字母法标记多重比较结果。练地运用字母法标记多重比较结果。 涉
3、及教材内容:第六章第一、二、五节,第十二章第五、六、七节。涉及教材内容:第六章第一、二、五节,第十二章第五、六、七节。 作业布置:作业布置:教材教材第六章第四节内容自习第六章第四节内容自习;教材教材P131P131135 135 T1、 T3、 T4、 T11、 T12、T13、 T20 、T21 、 T22 ,教材教材P268P268269 269 T7、 T8、 T13。第一节第一节 方差分析原理方差分析原理 方差分析方差分析(analysis of variance),缩,缩写词原为写词原为ANOVA, 现在也用现在也用AOV。 它是对多个样本平均数进行假设测它是对多个样本平均数进行假设
4、测验的方法验的方法, 因为对三个以上的平均数差因为对三个以上的平均数差异进行比较时异进行比较时, 采用只能就一个或两个采用只能就一个或两个样本平均数差异进行显著性测验的方法样本平均数差异进行显著性测验的方法已不敷应用,例如:已不敷应用,例如: 例例5.1 某水产研究所为了比较某水产研究所为了比较 k=4种种不同配合饲料对鱼的饲喂效果,选取了不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼条件基本相同的鱼20尾,随机分成尾,随机分成4组组 ,投喂不同饲料,一个月后每个处理各得投喂不同饲料,一个月后每个处理各得n= 5个增重观察值,且个增重观察值,且T=550.8, =27.54, 试予分析。试
5、予分析。解解 本例本例需要分析两个方面的问题需要分析两个方面的问题:鱼经不同饲料投喂后增重是否鱼经不同饲料投喂后增重是否 有显著差异(即存在本质差别)?有显著差异(即存在本质差别)?若有显著差异的话若有显著差异的话, 在哪些饲料之间在哪些饲料之间? 如果按第三章的方法如果按第三章的方法, 直接进行显著直接进行显著性检验性检验, 就要就要孤立地对以下孤立地对以下6个两两差个两两差数做数做t-test,即:即:顺序顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74 第一
6、节第一节 方差分析原理方差分析原理 把一份完整的原始数据部分地撇开,把一份完整的原始数据部分地撇开, 孤立地对两两差数进行孤立地对两两差数进行t-test,其消极后其消极后果佛克伦这样描述过:果佛克伦这样描述过: 从同一总体中抽样从同一总体中抽样, 每次抽两个样本每次抽两个样本得得1和和2后求算后求算 t 值值, 若指定它超过某若指定它超过某值的概率为值的概率为5%的话的话, 该值就是两尾表中该值就是两尾表中查得的临界值查得的临界值 t0.05 再以相同的样本容再以相同的样本容量每次抽三个样本量每次抽三个样本, 用用最大的样本和最大的样本和最小的样本求算最小的样本求算 t 值值, 此时它超过此
7、时它超过“t0.05 ”的概率上升到的概率上升到14.3% ( 即即“t0.05 ” = t0.143)继续以相同的容量每次抽继续以相同的容量每次抽四个样本四个样本,仍以仍以最大的和最大的和最小的求算最小的求算t 值值, 则则上升到上升到26.5%( 即即 “t0.05 ”= t0.265 )以此以此类推类推5个样本个样本40%以上。以上。 比如本例针对药剂比如本例针对药剂A1与药剂与药剂A3的两两差的两两差数数6.44 (最大最大 最小最小) 进行的进行的t-test: F= S大大2 / S小小2 =41.67/415.97/4 F0.05 Se2 = (SS1 + SS2) / (1+2
8、) = 57.64/8 S 1-2 =Se2 ( 1/n1 + 1/n2 ) = 1.70 t =( 1- 2 ) (1-2) S1- 2 = 6.44 1.70 = 3.8 “t0.05”=2.306 由于撇开由于撇开A、B孤立地进行,否定孤立地进行,否定HO的把握不到的把握不到80%。第一节第一节 方差分析原理方差分析原理一、数据整理一、数据整理 根据方差分析的先决条件,在根据方差分析的先决条件,在“三个三个假定假定”成立的前提下,对右表继续整理:成立的前提下,对右表继续整理: C= T 2/nk = 550.8 2/20 = 15169.03SST =(Y ) 2 = Y 2 C =31
9、.92 +28.52 15169 = 199.67dfT = nk 1= 5 4 1 = 19二、平方和、自由度的分解二、平方和、自由度的分解Y = (Yt) + ( t ) 两边同时平方,得两边同时平方,得: (Y )2 = (Y t) 2 + ( t ) 2 +2 (Y t) ( t )由同一处理重复观察值的由同一处理重复观察值的累加:累加: (Y)2=(Yt) 2 + (t ) 2 +2 ( t ) (Y t) = 0(Y )2=(Y t) 2 + n ( t ) 2再把全部处理观察值的再把全部处理观察值的累加,得:累加,得:(Y )2=(Yt) 2 + n ( t ) 2即:即: SS
10、T = (组内组内) SSe + (组间组间) SSt 其中其中 SSt = n ( t ) 2 = Tt 2 /n C = (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 15169.03 = 114.27于是于是SSe = SST SSt = 199.67 114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33 dft = k 1= 3 dfe= dfT dft =193 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16第一节第一节 方差分析原理方差分析原理
11、三、列三、列ANOVA表,进行表,进行F-test 变异来源变异来源 DF SS MS F F 0.01 处理处理 3 114.27 38.09 7.13 * 5.29 误差误差 16 85.4 5.34 总总 19 199.67 ( F值右上角标一个值右上角标一个 * 达到达到0.05, 标两个标两个 * 达到达到0.01 ) 这里进行的这里进行的F-test与第三章与第三章(Ho:大大2 小小2 )的相同之处是都做右尾测验的相同之处是都做右尾测验, 查的是同一张查的是同一张F临界值表;不同之处是固定用误差方差临界值表;不同之处是固定用误差方差Se 2作作分母分母(Ho:t2 e2 ), 而
12、不论其相对大小。而不论其相对大小。 显然显然, F值越大值越大, 说明处理效应引起的数据说明处理效应引起的数据变变异不仅在量的方面所占比重较大异不仅在量的方面所占比重较大, 而且相对于而且相对于误差引起的变异来讲显得越重要、越突出误差引起的变异来讲显得越重要、越突出; 本本例例F-test结果显示极显著结果显示极显著, 表明原始数据的总变表明原始数据的总变异主要由不同的饲料种类引起异主要由不同的饲料种类引起, 各处理之间至各处理之间至少有两个存在着少有两个存在着(极极)显著差异。显著差异。 以上一、二、三就是以上一、二、三就是R.A.Fisher创建的方差创建的方差分析法,其原理归纳如下分析法
13、,其原理归纳如下:平方和与自由度的可加性;平方和与自由度的可加性; SST 综合了全部观察值的变异量综合了全部观察值的变异量, 它汇总了它汇总了各变异来源各变异来源 (SOV) 导致原始数据和全试验平均导致原始数据和全试验平均数数 ( ) 出现差异的分量出现差异的分量, 包括包括可控因素分量和可控因素分量和误差分量两类误差分量两类; “可加性可加性” 证实前者就是观察证实前者就是观察值按可控因素分组后算得的组间平方和值按可控因素分组后算得的组间平方和 ( 可控可控因素可以是试验因素因素可以是试验因素, 也可以是象单位组那样也可以是象单位组那样的其它系统因素的其它系统因素 ) 。 试验设计有几个
14、可控因素试验设计有几个可控因素, 数据就会有几种数据就会有几种可能的分组方式可能的分组方式, 也就可以算出几个组间也就可以算出几个组间SS, 而而本属于组内本属于组内SS的误差分量在平方和分解时总是的误差分量在平方和分解时总是由由SST 减去所有可控因素减去所有可控因素SS得到得到, 因此它又被称因此它又被称为为“剩余平方和剩余平方和”。 自由度的剖分与平方和的剖分一一对应自由度的剖分与平方和的剖分一一对应。依据依据F分布进行整体测验;分布进行整体测验; 只确定可控因素分量和误差分量的相对只确定可控因素分量和误差分量的相对重要程度是否达到显著水平。重要程度是否达到显著水平。第一节第一节 方差分
15、析原理方差分析原理四、多重比较四、多重比较 R.A.Fisher 创建的方差分析法并没有明确创建的方差分析法并没有明确(极极)显著差异究竟存在于哪些显著差异究竟存在于哪些 “组平均数组平均数”之间之间, F值值(极极)显著所包含的信息只有通过显著所包含的信息只有通过对对C2n= k(k-1)/2个两两差数进行多次连续性个两两差数进行多次连续性测验才能完全揭露出来,这就是多重比较。测验才能完全揭露出来,这就是多重比较。 多重比较不论用哪一种方法多重比较不论用哪一种方法, 区别于多区别于多 次孤立的次孤立的 t-test 或者说体现其或者说体现其“连续性连续性” 特征特征之处有两个之处有两个, 一
16、是必须使用同一个共用的标一是必须使用同一个共用的标准误准误, 记为记为“SE”), 本例本例SEMSe / n 5.345 =1.033 (10g); 二是所依据的抽样分二是所依据的抽样分布由计算布由计算MSe即即Se2的自由度的自由度dfe决定决定, 并根据并根据两两差数秩次距两两差数秩次距“k”的不同而有所修正。如的不同而有所修正。如本例本例k = 2、3、4,测验时依据,测验时依据dfe=16的的 t 分分布并在布并在k = 3和和4时修正为时修正为SSR分布如右。分布如右。顺序顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.
17、96 3.22 1.68 A2 26.28 1.54 A3 24.74 -3.9-3.9-2.9-2.9-1.9-1.9-0.9-0.90.10.11.11.12.12.13.13.1=16,k =2 SSR= t2=16,k =3=16,k =4 3.23 3.15 3.00 第一节第一节 方差分析原理方差分析原理 附表附表6 列出了各自由度对应的列出了各自由度对应的t 分布曲线分布曲线再按再按9 种秩次距修正出来的种秩次距修正出来的SSR分布当两尾分布当两尾概率取概率取0.05和和0.01时临界值,记为时临界值,记为SSR0.05和和SSR0.01,其中,其中k =2的那一条因为实际就是的
18、那一条因为实际就是 t分布曲线压缩横坐标刻度所得分布曲线压缩横坐标刻度所得, 所以表中列所以表中列出的出的SSR0.05和和SSR0.01就分别等于附表就分别等于附表3所列所列t0.05 和和t0.01的的2 倍倍; 其它其它k3的的SSR分布随分布随着着P的递增的递增, 对对 t 分布的修正幅度加大分布的修正幅度加大, 因此因此表中列出的表中列出的SSR0.05和和SSR0.01也就随之递增。也就随之递增。 多重比较测验两两差数的显著性时不是多重比较测验两两差数的显著性时不是将它除以将它除以SE转换成转换成SSR(也是标准化变量也是标准化变量!)后再与后再与SSR0.05 和和SSR0.01
19、 比大小比大小, 而是先将而是先将SSR0.05和和SSR0.01乘以乘以SE算出算出“显著尺显著尺”LSR,再将它们直接和相应秩次距的两两差数比再将它们直接和相应秩次距的两两差数比大小大小, 超过超过LSR0.05标标*, 超过超过LSR0.01 标标*。顺序顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74 -3.9-3.9-2.9-2.9-1.9-1.9-0.9-0.90.10.11.11.12.12.13.13.1=16,k =
20、2 SSR= t2=16,k =3=16,k =4 3.23 3.15 3.00 第一节第一节 方差分析原理方差分析原理 按照两两差数在三角梯形表中的排列规按照两两差数在三角梯形表中的排列规律,本例多重比较过程列表如下:律,本例多重比较过程列表如下: LSR0.05= SE SSR0.05 LSR0.01= SE SSR0.01 顺序顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74 SE = 1.033 综合包括多重比较在内的方差分析
21、综合包括多重比较在内的方差分析全过程,其原理可归纳为:全过程,其原理可归纳为: 一个性质一个性质(SS、DF的可加性的可加性) 两个分布两个分布(F分布和分布和SSR分布分布) 本例根据本例根据SSR分布进行的多重比较分布进行的多重比较叫叫新复极差测验新复极差测验, 简称简称SSR-test 。因为因为不能缺少不能缺少 F-test 显著的前提,属于显著的前提,属于Fishers protected multipe comparisons.此前产生的此前产生的复极差测验复极差测验 (简称简称q-test、又又称称SNK测验测验) 却可以不经过却可以不经过F-test, 原因原因是是q-test
22、算算LSR时要改查时要改查q 值表值表(附表附表5), 所依据的所依据的q分布是按极差抽样分布原理分布是按极差抽样分布原理要保证各比较都是同一显著水平要保证各比较都是同一显著水平, 因因而对而对 t 分布修正幅度随秩次距分布修正幅度随秩次距k的递增的递增而加大的速度要比而加大的速度要比SSR分布快分布快, 所以秩所以秩次距次距k3 时时q0.05和和q0.01 比相应的比相应的SSR0.05和和SSR0.01大。大。 第二节第二节 单向分组数据单向分组数据 单向分组数据指观察值仅按一个方单向分组数据指观察值仅按一个方向分组的数据。如例向分组的数据。如例5.1中将全部供试单中将全部供试单位位(试
23、验材料试验材料)随机地分成若干组,然后随机地分成若干组,然后各组给以不同处理,即同组供试单位受各组给以不同处理,即同组供试单位受相同处理,不同组受不同处理,这样所相同处理,不同组受不同处理,这样所得的全部观察值在设计上称为得的全部观察值在设计上称为完全随机完全随机试验数据试验数据,而实际研究中下例,而实际研究中下例5.2那样的那样的调查结果也属此类。调查结果也属此类。一、各组观察值个数相等一、各组观察值个数相等 例例5.2 抽测抽测 5个不同品种个不同品种(k = 5)各各5头母猪头母猪(n = 5)的窝产仔数,结果如右表的窝产仔数,结果如右表所示,所示,T = 265,试检验不同品种的母猪,
24、试检验不同品种的母猪平均窝产仔数差异是否显著。平均窝产仔数差异是否显著。 1、数据整理、数据整理 C = T 2/nk = 265 2/25 = 2809SST =(Y ) 2 = Y 2 C =82 +132 +132 2809 = 136dfT = nk 1= 5 5 1 = 24第二节第二节 单向分组数据单向分组数据2、平方和、自由度的分解、平方和、自由度的分解SSt = n ( t ) 2 = Tt 2 /n C = 73.2 = (51 2 +41 2 +60 2 +48 2 +65 2 )/ 5 2809于是于是 SSe = SST SSt = 13673.2 =62.8 dft
25、= k 1= 4 dfe= dfT dft =244= 203、列、列ANOVA表,进行表,进行F-test 假设是假设是Ho:t2 e2 而不是而不是Ho:t2 =e2 (和(和 Ho:1= 2= 3= 4= 5效果一样)效果一样) SOV DF SS MS F F 0.01 品种品种 4 73.2 18.3 5.83* 4.43 误差误差 20 62.8 3.14 总总 24 1364、多重比较、多重比较 SE=MSe / n =3.145 = 0.793 再根据附表再根据附表6的的SSR进而算得显著尺:进而算得显著尺:K SSR0.05 SSR0.01 LSR0.05 LSR0.012.
展开阅读全文