生物统计学-方差分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计学-方差分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 方差分析 课件
- 资源描述:
-
1、第六章 方差分析应用统计学应用统计学 重庆大学生物工程学院重庆大学生物工程学院基本概念基本概念 方差分析:方差分析是对两个或两个以上样本平均数差异显著性检验的方法。例:为研究某种生物材料的生物学性能,将材料分成三组,分别与成骨细胞共培养1,7,11天后测试细胞活性。为避免误差,每组测试5个样品,试判断材料的生物学性能。基本概念基本概念两个样本数据平均数比较两个样本数据平均数比较1、当总体方差、当总体方差 和和 已知,或总体方差已知,或总体方差 和和 未未知,但两样本均为大样本知,但两样本均为大样本21212222u 检验检验2、当总体方差、当总体方差 和和 未知,且两样本均为小样本未知,且两样
2、本均为小样本2122t 检验检验检验,然后再检验,考察成组数据:首先检验成对数据:直接tFt2121or例:例:生产某种纺织品,要求棉花纤维长度平均在生产某种纺织品,要求棉花纤维长度平均在30mm30mm以上。以上。现有一棉花品种,以现有一棉花品种,以n n400400进行抽样,测得纤维平均长度为进行抽样,测得纤维平均长度为30.2mm,30.2mm,标准差为标准差为2.5mm2.5mm,问该棉花品种的纤维长度是否合格?,问该棉花品种的纤维长度是否合格?分析:分析:1 1)已知已知 ,u检验检验 2 2)由于只能大于由于只能大于30mm30mm才能合格,故才能合格,故单尾单尾检验检验400,5
3、.2;2.30;0.30;0nmmsmmxmm解:解:(1 1)假设)假设 ,即该棉花品种纤维长度不能达到,即该棉花品种纤维长度不能达到纺织品生产要求含量。对纺织品生产要求含量。对30:00H0:AH (2 2)选取显著水平)选取显著水平05.0(3 3)检验计算)检验计算125.04005.2nssx(4 4)推断)推断 u0.05,显著水平上接受显著水平上接受H H0 0,拒绝,拒绝H HA A。即认为该棉花品种纤维长度不符合纺织品种生产要即认为该棉花品种纤维长度不符合纺织品种生产要求求6.1125.00.302.30 xsxu 例例 为了探讨不同窝的动物的出生重是否存在为了探讨不同窝的动
4、物的出生重是否存在差异,随机选取差异,随机选取4窝动物,每窝中均有窝动物,每窝中均有4只幼只幼仔,结果如下:仔,结果如下:表表 4窝动物的出生重(克)窝动物的出生重(克)动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。出生重是否存在差异。方差分析的意义方差分析的意义k个样本均数的比较:
5、个样本均数的比较:如果仍用如果仍用t检验或检验或u检验,需比较次数为:检验,需比较次数为:次)!2(!2!2kkCk 例如例如4 4个样本均数需比较次数为个样本均数需比较次数为6 6次。次。假设每次比较所确定的检验水准为假设每次比较所确定的检验水准为0.050.05,则每次检验拒绝则每次检验拒绝H H0 0不犯第一类错误的概率为不犯第一类错误的概率为1-0.05=0.951-0.05=0.95;那么那么6 6次检验都不犯第一类错误的概率为次检验都不犯第一类错误的概率为(1-0.05)6=0.7351(1-0.05)6=0.7351,而犯第一类错误的概率为而犯第一类错误的概率为0.26490.2
6、649方差分析的意义方差分析的意义k个样本均数的比较:个样本均数的比较:如果仍用如果仍用t检验或检验或u检验,有以下问题:检验,有以下问题:1 1、检验过程繁琐、检验过程繁琐 2 2、无统一的试验误差,误差估计的精确性和检、无统一的试验误差,误差估计的精确性和检 验的灵敏性低验的灵敏性低 3 3、推断的可靠性降低,犯第、推断的可靠性降低,犯第1 1类错误的概率增加类错误的概率增加方差分析方差分析:是一类特定情况下的统计假设检验,是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。或者说是平均数差异显著性检验的一种引伸。u 检验和检验和t 检验可以判断两组数据平均数的差检验可
7、以判断两组数据平均数的差异的显著性,异的显著性,而方差分析则可以同时判断多而方差分析则可以同时判断多组数据平均数之间的差异的显著性。当然,组数据平均数之间的差异的显著性。当然,在多组数据的平均数之间做比较时,可以在在多组数据的平均数之间做比较时,可以在平均数的所有对之间做平均数的所有对之间做 t 检验。但这样做会检验。但这样做会提高犯提高犯型错误的概率,因而是不可取的。型错误的概率,因而是不可取的。方差分析方差分析由英国由英国统计学家统计学家R.A.FisherR.A.Fisher首首创,为纪念创,为纪念FisherFisher,以,以F F命名,故方差分析又命名,故方差分析又称称 F F 检
8、验检验 (F F-test-test)。)。用于推断用于推断多个总体均多个总体均数数有无差异有无差异 方差分析的定义方差分析的定义 方差分析方差分析是对两个或多个样本平均数差异显著性是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量来源分解为处理效应和试验误差,并做出其数量估计。估计。它将所有处理的观测值作为一个整体,一次比较就对它将所有处理的观测值作为一个整体,一次比较就对多有各组间样本平均数是否有差异做出判断。如果差多有各组间样本平均数是否有差异做出判断。如果差异不显著,则认为它们
9、都是相同的;如果差异显著,异不显著,则认为它们都是相同的;如果差异显著,再进一步比较是哪组数据与其它数据不同。再进一步比较是哪组数据与其它数据不同。方差分析的意义方差分析的意义方差分析基本思想:方差分析基本思想:1 1、把、把k k个总体当作一个整体看待个总体当作一个整体看待2 2、把观察值的总变异的平方和及自由度分、把观察值的总变异的平方和及自由度分 解为不同来源的平方和及自由度解为不同来源的平方和及自由度3 3、计算不同方差估计值的比值、计算不同方差估计值的比值4 4、检验各样本所属的平均数是否相等、检验各样本所属的平均数是否相等 实际上是观察值变异原因的数量分析实际上是观察值变异原因的数
10、量分析 方差分析的应用条件和用途方差分析的应用条件和用途方差分析应用条件:方差分析应用条件:1 1、各样本须是相互独立的随机样本、各样本须是相互独立的随机样本 2 2、各样本来自正态分布总体、各样本来自正态分布总体 3 3、各总体方差相等,即方差齐、各总体方差相等,即方差齐 方差分析基本用途:方差分析基本用途:1 1、多个样本平均数的比较、多个样本平均数的比较 2 2、多个因素间的交互作用、多个因素间的交互作用 3 3、回归方程的假设检验、回归方程的假设检验 4 4、方差的同质性检验、方差的同质性检验第一节 方差分析的基本原理 试验指标试验指标(Experimental index)(Expe
11、rimental index):试验测定的项目或:试验测定的项目或者性状。者性状。日增重、产仔数、瘦肉率日增重、产仔数、瘦肉率 试验因素试验因素(Experimental factor)(Experimental factor):影响试验指标的因:影响试验指标的因素,也称:素,也称:处理因素处理因素,简称,简称因素因素或或因子因子。1 1、可控因素(固定因素):人为可控、可控因素(固定因素):人为可控 2 2、非控因素(随机因素):不能人为控制、非控因素(随机因素):不能人为控制试验因素的表示:试验因素的表示:大写字母大写字母A A,B B,C C,等来表示等来表示一、相关术语一、相关术语 因
12、素水平因素水平(Level of factor)(Level of factor):试验因素所处的特定状态:试验因素所处的特定状态或者数量等级。简称或者数量等级。简称水平水平水平的表示方法:水平的表示方法:用代表该因素的字母添加下标表示,如用代表该因素的字母添加下标表示,如A A1 1,A A2 2,B B1 1,B B2 2 试验处理试验处理(Treatment)(Treatment):实施在试验单位上的具体项目:实施在试验单位上的具体项目,简称简称处理处理。单因素:试验因素的一个水平单因素:试验因素的一个水平多因素:试验因素的一个水平组合多因素:试验因素的一个水平组合一、相关术语一、相关术
13、语 试验单位试验单位(Experimental unit)(Experimental unit):试验载体,即根据研:试验载体,即根据研究目的而确定的观测总体究目的而确定的观测总体 重复重复(Repetition)(Repetition):一个处理实施在两个或者两个:一个处理实施在两个或者两个以上的试验单位上,称为处理有重复。以上的试验单位上,称为处理有重复。试验单位数称为处理的重复数试验单位数称为处理的重复数一、相关术语一、相关术语 方差分析方差分析是关于是关于k k(k k3)3)个样本平均数的假设测个样本平均数的假设测验方法,是将验方法,是将总变异总变异按照来源分为按照来源分为处理效应处
14、理效应和和试验试验误差误差,并做出其数量估计。,并做出其数量估计。发现各变异原因在总变异中相对重要程度的一发现各变异原因在总变异中相对重要程度的一种统计分析方法。种统计分析方法。二、方差分析的基本原理二、方差分析的基本原理 总变异总变异分解为分解为组间变异组间变异和和组内变异组内变异。组内变异组内变异是个体差异所致,是抽样误差。是个体差异所致,是抽样误差。组间变异组间变异可能由两种原因所致,可能由两种原因所致,一是一是抽样误差抽样误差;二是二是处理不同处理不同。在抽样研究中抽样误差是不可避免的,故在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因导致组间变异的第一
15、种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断是否存在,需通过假设检验作出推断二、方差分析的基本原理二、方差分析的基本原理三、数学模型三、数学模型处理A1 A2 Ai Ak 重复x11 x21 xi1 xk1x12 x22 xi2 xk2 x1j x2j xij xkj x1n x2n xin xkn总和Ti.T1.T2.Ti.Tk.平均 每组具有每组具有n个观测值的个观测值的k组样本数据资料组样本数据资料 ix 1x 2x ix kxxijxT 例例 2.1调查了调查了5个不同小麦品系的株高,个不同小麦品系的株高,结果列于表结果列于表21。在这个例子中,只出现在这个例子中,只出现
16、“品系品系”这样一个这样一个因素因素(factor),故称单因素。共有故称单因素。共有5 个不同的品个不同的品系,我们称品系这一因素共有系,我们称品系这一因素共有5个水平个水平(level)。5个品系可以认为是个品系可以认为是5个总体,表个总体,表 21的数据是的数据是从从5个总体中抽出的个总体中抽出的5个样本,通过比较这个样本,通过比较这5个样个样本,判断这本,判断这5个总体是否存在差异。个总体是否存在差异。表表 21 5个小麦品系株高调查结果个小麦品系株高调查结果 株号株号株株 高高 1 2 3 4 5 和和 64.665.364.866.065.8326.5 64.565.364.663
17、.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平均数平均数65.364.467.370.868.6 例例 2.2 为了探讨不同窝的动物的出生为了探讨不同窝的动物的出生重是否存在差异,随机选取重是否存在差异,随机选取4窝动物,每窝窝动物,每窝中均有中均有4只幼仔,结果如下:只幼仔,结果如下:表表22 4窝动物的出生重(克)窝动物的出生重(克)动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.
18、123.327.826.7104.932.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物出生重是否存在通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。差异。以上两个例子的共同点是:每个实验都以上两个例子的共同点是:每个实验都只有一个因素,该因素有只有一个因素,该因素有a个水平或称为有个水平或称为有a个处理个处理(treatment),这样的实验称为单因素这样的实验称为单因素实验。实验。从单因素实验的每一处理所得到的结从单因素实验的每一处理所得到的结果都是一随机变量果都是一随机变量X i。对于对
19、于a个处理,各重个处理,各重复复n次(或者说做次(或者说做n次观察)的单因素方差分次观察)的单因素方差分析的一般化表示方法见表析的一般化表示方法见表23。表表 23单因素方差分析的典型数据单因素方差分析的典型数据 X1X2X3 X i X a 123 :j nx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3:x3j xij xaj:x3n xin xan平均数平均数x1 x2 x3 xi xa 每一个观察值可以通过如下常用的所谓每一个观察值可以通过如下常用的所谓线性统线性统计模型计模型(linear st
20、atistical model)描述:描述:)12(,2,1,2,1njaixijiij其中:其中:xij 是在第是在第 i 水平(处理)下的第水平(处理)下的第 j 次观次观察值。察值。是对所有观察值的一个参量,称为是对所有观察值的一个参量,称为总总平均数平均数(overall mean)。i是仅限于对第是仅限于对第 i 次次处 理 的 一 个 参 量,称 为 第处 理 的 一 个 参 量,称 为 第 i 次次 处 理 效 应处 理 效 应(treatment effect)。方差分析的目的,就是要方差分析的目的,就是要检验处理效应的大小或有无。检验处理效应的大小或有无。ij是随机误差成是随
21、机误差成份。份。上述模型中,包括两类不同的处理效应。上述模型中,包括两类不同的处理效应。第一类处理效应称为第一类处理效应称为固定效应固定效应(fixed effect),它是由它是由固定因素固定因素(fixed factor)所引起的效应。所引起的效应。若因素的若因素的a个水平是经过特意选择的,则该个水平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。治疗方案和治疗效果等。
22、在这些情况中,因素的水平是特意选择在这些情况中,因素的水平是特意选择的,所检验的是关于的,所检验的是关于ai 的假设,得到的结论的假设,得到的结论只适合与方差分析中所考虑的那几个水平,只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、水平上。所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所品种等,称为固定因素。处理这样的因素所用的模型称为用的模型称为固定效应模型固定效应模型(fixed effect model)。)。例例2.1中的中的5个小麦品系是特意选择个小麦品系是
23、特意选择的,目的是从这的,目的是从这5 个品系中,选出最优者,个品系中,选出最优者,因而因而“品系品系”这个因素属于固定因素,所用这个因素属于固定因素,所用的模型是固定效应模型。的模型是固定效应模型。第二类处理效应称为第二类处理效应称为随机效应随机效应(ran-dom effect),它是由它是由随机因素随机因素(random factor)所引起的效应。若因素的所引起的效应。若因素的a 个水平,个水平,是从该因素全部水平的总体中随机抽出的样是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的本,则该因素称为随机因素。从随机因素的a 个水平所得到的结论,可以推广到这个因
24、个水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型素的所有水平上。处理随机因素所用的模型称为称为随机效应模型随机效应模型(random effect mo-del)。)。例例2.2 的动物窝别,是从动物所有可的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而查在窝别之间,出生重是否存在差异,因而“窝别窝别”是随机因素。是随机因素。有时固定因素和随机因素很难区分,除有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。上述所讲的原则外,还可以从另一角度鉴别。固定因
25、素固定因素是指因素水平,可以严格地人为控是指因素水平,可以严格地人为控制制。在水平固定之后,它的效应值也是固定。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实确地控制在一个固定值上,所以在重复该实验时,水解产物的产量也是固定的。简单地验时,水解产物的产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应说,在水平(不同温度)固定以后,
展开阅读全文