生物统计学-单因素方差分析课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计学-单因素方差分析课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 因素 方差分析 课件
- 资源描述:
-
1、 用6种培养液培养红苜蓿,每一种培养液做5次重复,测定5盆苜蓿的含氮量,结果如下表(单位:mg)。问用6种不同培养液培养的红苜蓿含氮量差异是否显著?盆号培养方法1234519.432.627.032.133.017.724.827.925.224.317.019.49.111.915.820.721.020.518.818.614.314.411.811.614.217.319.419.116.920.8方差分析方差分析 analysis of varianceANOVA 由英国统计学家R.A.Fisher于1923年提出。 方差分析是一种特殊的假设检验,是用来判断多组数据之间平均数差异显著性
2、的。它不同于t检验之处在于:它把所有数据放在一起,一次比较就对所有各组间是否有差异做出判断,如果没有显著性差异,则认为各组平均数相同;如果发现有差异,再进一步比较是哪组数据与其它数据不同。方差分析中常用基本概念方差分析中常用基本概念(一)试验指标(一)试验指标 experimental index 为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状测定的性状或观测的项目观测的项目。(二)试验因素(二)试验因素 experimental factor 试验中所研究的影响试验指标影响试验指标的因素叫试验因素,常用大写字母A、B、C、等表示。 单因素试验与两因素或多因素试验单因素试验与两因
3、素或多因素试验。 固定因素与随机因素:固定因素与随机因素:是否可控制。(三)因素水平(三)因素水平 level of factor试验因素所处的某些特定状态或数量等级等级称为因素水平因素水平,简称水平水平。比如:不同的温度;溶液不同浓度等。(四)重复(四)重复 repeat 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;某一处理实施的试验单位数称为该处理的重复数。本章主要内容第一节第一节 单因素方差分析的基本原理单因素方差分析的基本原理第二节单因素方差分析的基本步骤第二节单因素方差分析的基本步骤 教学重点:教学重点:单因素方差分析的方法教学要求:教学要求:1. 掌握方差
4、分析的概念、作用、基本原理与步骤2. 掌握单因素试验资料的方差分析方法一、线性模型二、固定线性模型三、随机线性模型四、多重比较五、基本假定 (一)线性模型(一)线性模型 linear statistical model 假设某单因素试验有a个处理,每个处理有n次重复,共有na个观测值。这类试验资料的数据模式如表9-1所示。表9-1 单因素方差分析的典型数据模式合计X1 X2 X3 Xi Xa 1 11 21 31 i1 a12 12 22 32 i2 a23 13 23 33 i3 a3 j 1j 2j 3j ij ajn 1n 2n 3n in an合计平均数总体均数x1x2x3ixaxxx
5、1x2x3ixaxx123ia1a2a3aiaaa符号文字表述 a n 因素水平数每一水平的重复数第i水平的第j次观察值第i水平所有观察值的和第i水平均值全部观察值的和总平均值第i水平上的子样方差ijxnjijixx1.1iixnx ainjijxx11.1.xanx aiiijixxnS12.2.)(11各处理总和、平均数、大总和、总平均数是计算的一级一级数据数据,在本章我们采用了黑黑点符号体系法点符号体系法表示,要注意熟悉和掌握。 可以分解为 表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将 再进行分解, 其中表示全试验观测值的总体平均数总体平均数(overall mean)
6、, 是第i个处理的效应处理的效应(treatment effect),表示处理i对试验结果产生的影响。是试验误差试验误差,相互独立,且服从正态分布N(0,2)。ijxijiij+=xiiijiijiia1=ii+a+=x则=aa1=令iaij该式称为单因素试验的线性统计模型或数学模型。(二)方差分析的基本思路(二)方差分析的基本思路将a个处理的观测值作为一个整体看待, 把观察值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源的总体方差估计值;通过计算这些估计值的适当比值,就能检验各样本所属总体均值是否相等。 方差分析实质上是关于观测值变异原因的数量分析。二固
7、定模型二固定模型fixed modelfixed model因素固定、效应也固定,反应到线性模型中即 为常数可要求 。1. 1. 假设假设固定模型的零假设为:的零假设为: 备择假设为:备择假设为:iaa1=ii0=0=:Ha2100:HiA 故an个观察值的总变异可分解为处理间的变异和处理内的变异两部分。 全部观察值的总变异可以用总均方来度量,处理间变异和处理内变异分别用处理间均方和处理内均方来度量。 2. 2. 平方和与自由度的剖分平方和与自由度的剖分所以其中ainjaiainjiijiijaiiainjiijnjiijaiaiiiiijiijiainjiiijainjiainjijTxxx
8、xnxxxxxxxxxxxxnxxxxxxxxxxxxxxSS1111122212.11211122.112.2.11.211.)(.).(.)(0)(.)(.)(.).(2.).()()(2.)()(.)(.)( ainjiijeaiiAxxSSxxnSS112.12.)-(;)-(eATSSSSSS+=差的大小各处理内的变异,即误反映了方和的和,为各处理内离均差平次的处理间变异;映了重复反的乘积,均差平方和与重复数离的与总平均数,为各处理平均数ainjiijeiaiiAxxSSnnxxxxnSS112.12.)-()-(三种平方和的简便计算公式三种平方和的简便计算公式如下:等重复时:ATe
9、a1=i2. ia1=in1j=2. iAa1=in1j=2ija1=i2ijT2.SSSS=SSCxn1=.)xx(=SSC;=.)x(xn=SS)(correcti校正 项(an=Cxx on不等重复时:ATea1=ii2. iAa1=in1j=2ijT2SSSS=SS;C-nx=SSC;=SS;N=Cx.x 在计算总平方和时,资料中的各个观察值要受 这一条件约束,总自由度等于资料中观察值的总个数减一,即an-1。 总自由度记为dfT,则 dfT = an-1 。v 在计算处理间平方和时,各处理均数要受 这一条件的约束,故处理间自由度为处理数减1,即a-1。 处理间自由度记为dft ,则d
10、ft= a-1。 0)(11ainjijxx0)(12aiixx在计算处理内平方和时,要受a个条件的约束,即 ,i=1,2,.a。故处理内自由度为资料中观察值的总个数减a ,即an- a 。 处理内自由度记为dfe,则dfe= an-a= a(n-1)。 因为 na -1=(a-1)+(na-a)=(a -1)+ a(n-1) 所以 dfT= dfA+ dfe 综合以上各式得:0)(1njiijxxATeATdfdfdfadfandf11 总均方的拆分是通过将总均方的分子称为总离均差平方和,简称为总平方和(SST) ,剖分成处理间平方和(SSA)与处理内平方和(SSe)两部分;将总均方的分母称
11、为总自由度 ,剖分成处理间自由度 与处理内自由度 两部分来实现的。 处理间均方(处理均方,MSA )处理内均方(误差均方,MSe )TdfAdfedfAAAdfSSMS =eeedfSSMS = 各部分平方和除以各自的自由度便得到总均总均方、处理间均方和处理内均方方、处理间均方和处理内均方,分别记为: MST(或ST2 )、 MSA(或SA2 )和MSe(或Se2 ),即 MST= ST2 =SST/dfT; MSt= St2 =SSt /dft; MSe= Se2 =Sse /dfe 注意: 在方差分析中不涉及总均方的数值,所以一般不必计算; v总均方一般不等于处理间均方加处理内均方。3.
12、3. 期望均方期望均方 expected mean squares EMS若A A是B B的无偏估计,则称B B是A A的数学期望数学期望。处理内均方MSMSe e是误差方差 2 2的无偏估计值,即 2 2称为称为MSMSe e 的数学期望的数学期望。异是代表了各处理间的差也就是说,AMS外,还,还有效应除了代表随机 误了MS即)(1an+=a1an+=)E(MS量;是随机 误随机误差的一MS 说的方差,是随机 误是的期望是MS,即=)E(MS2A2a1=ii2a1=i2i2Ae2e2e4 4. . 统计量统计量 当零假设成立时,处理效应的方差为零为零,亦即各处理观察值总体均数i (i=1,2
13、,a) 相等时,处理间均方MSA与处理内均方一样,也是误差方差 2 2的估计值。 方差分析就是通过方差分析就是通过MSMSA A 与与MSMSe e的比较来推断各的比较来推断各处理平均数处理平均数 间差异的大小间差异的大小 F= MSA2/ MSe2F具有两个自由度:df1=dfA=a-1; df2=dfe=a(n-1)。0=:Ha210i查附表7: 若F ,即P0.05,不能否定H0,可认为各处理间差异不显著; 若 F ,即0.01P0.05,否定H0,接受HA,认为各处理间差异显著,标记“*” ; 若F ,即P0.01,否定H0,接受HA, 认为各处理间差异极显著,标记“*”。),(05.
14、 021dfdfF),(05. 021dfdfF),(01. 021dfdfF),(01. 021dfdfF),(05. 021dfdfF),(01. 021dfdfF【例例9.1】 某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为两个不同的用中药组,A4、A5为两个不同的西药组。各组小白鼠的存活天数如表72所示。表92 用不同药物治疗腹水癌小白鼠的结果药物药物各小鼠存活天数(各小鼠存活天数(xij) 合计合计xi.平均平均A115 16 15 17 18816561 =1319A245 42 50 38 392144
15、5796 =9254A330 35 29 31 3516025600 =5152A431 28 20 25 3013417956 =3670A540 35 31 32 3016828224 =5710合计合计x.=757124137251052ix2ijx21jx22jx23jx24jx25jx这是一个单因素试验,处理数a =5,重复数n=5。第一步:计算一级数据(见表);第二步:计算SS e、SSA、 dfe 、 dfA 矫正项 C=x2./an/(55)=22921.96 总平方和 处理间平方和 =248274-2291.96=1905.44 处理内平方和 SS e=SST -SSA=21
16、83.041905.44 =277.60=2004.218396.22921-251052CxSSijT96.2292125757.22anxCxnSSiA12总自由度 dfT =an-1=25-1=24=5 5-1=24 处理间自由度 dfA=a-1=5-1=4=4处理内自由度 dfe =dfT- dfA=24-4=20 =处理间均方 MSA=SSt /dfA = 1905.44 /4=476.36 处理内均方 MSe=SSe /dfe = 277.60 /20=13.88 第三步:提出假设第三步:提出假设= 24零假设为:零假设为: H0:各处理组小鼠存活天数差异不显著 备择假设为:备择假
17、设为: HA:各处理组小鼠存活天数差异显著第四步:计算统计量第四步:计算统计量 F=MSA/MSe=476.36/13.88=34.32*第五步:查表根据df1=dft=4,df2=dfe=20 查附表7,得F0.01(4,20)=4.43第六步:做出推断及生物学解释:FF0.01(4,20)=4.43,P0.01。说明五个处理小白鼠存活天数差异极显著,用不同药物治疗小白鼠腹水癌的疗效是不同的。在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表方差分析表,见表93。表93 表92资料的方差分析表变异来源变异来源平方和平方和自由度自由度均均 方方F 值值处理间处理间SS
18、A 1905.44dfA 4MSA 476.3634.22*处理内处理内SSe 277.60dfe 20MSe 13.88总变异总变异SST 2183.04 dfT 24F值应与相应的被检验因素齐行;在表的左下方注出显著水平。三、随机模型三、随机模型Random model 因素随机、效应不固定是试验误差,相互独立且服从正态分布不再为常数,且服从正态分布1. 1. 假设假设随机模型的零假设为: 备择假设为:0=:H2a00:H2aAijia)(0,NID2a)(0,NID22. 总平方和与总自由度的剖分:同固定模型3. 数学期望:4. 统计量F:注意:在做生物学解释时,固定模型中的结论只适用于
19、检查的那几个因素水平;随机模型中的结论可推广到这一因素的各个水平。2a2A2en+=)E(MS;=)E(MSeATeATdfdfdf;SSSSSS+=+=eAeAdfdf,dfdf,MSMSF=21四、多重比较四、多重比较 (multiple comparisons) 统计上把多个平均数两两间的相互比较称为多多重比较重比较。 (一)为什么要进行多重比较?(一)为什么要进行多重比较? F值显著或极显著值显著或极显著,否定了无效假Ho,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。但并不意味着但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些
展开阅读全文