第8章-方差分析课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第8章-方差分析课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 课件
- 资源描述:
-
1、第 8 章 方差分析8.1 方差分析方差分析的基本原理的基本原理8.2 单因素方差分析单因素方差分析8.3 双因素方差分析双因素方差分析8.1.1 8.1.1 什么是方差分析?什么是方差分析? 8.1.2 8.1.2 误差分解误差分解 8.1.3 8.1.3 方差分析的基本假定方差分析的基本假定什么是方差分析(ANOVA)?(analysis of variance) 1. 检验多个总体均值是否相等;通过分析观测数据的误差来判断各总体均值是否相等;用方差来衡量误差的大小。2. 研究分类型自变量对数值型因变量的影响; 一个或多个分类自变量u2个或多个 (k 个) 处理水平或分类一个数值型因变量3
2、. 有单因素方差分析和双因素方差分析;单因素方差分析:一个分类自变量双因素方差分析:两个分类自变量yyyy-M-d什么是方差分析? (例题分析)yyyy-M-d什么是方差分析? (例题分析)1.分析“超市位置”和“竞争者数量”对销售额的影响;2.如果只分析超市位置或只分析竞争者数量一个因素对销售额的影响,则称为单因素方差分析单因素方差分析(one-way analysis of variance);3.如果只分析超市位置和竞争者数量两个因素对销售额的单独影响,但不考虑它们对销售额的交互效应交互效应(interaction),则称为只考虑主效应的双因素方差分析;4.如果除了考虑超市位置和竞争者数
3、量两个因素对销售额的单独影响外,还考虑二者对销售额的交互效应,则称为考虑交互效应的双因素方差分析。8.1.2 误差分解8.1 方差分析的基本原理方差分析的基本原理yyyy-M-d方差分析的基本原理(误差分解)1.总误差总误差(total error):反映全部观测数据的误差;所抽取的全部36家超市的销售额之间差异;2.组间组间误差误差(between-group error)处理处理误差误差(treatment error) :由于不同处理造成的误差,它反映了处理(超市位置)对观测数据(销售额)的影响,也叫做系统误差系统误差;3.组内误差组内误差(within-group error) 随机误
4、差随机误差(random error) :由于随机因素造成的误差,也简称为误差误差(error) ;yyyy-M-d方差分析的基本原理(误差分解)1.数据的误差可以用平方和平方和(sum of squares)来表示,常简记为SS; 总平方和总平方和,记为,记为SST;反映全部数据总误差大小的平方和;抽取的全部36家超市销售额之间的误差平方和 组间平方和,记为组间平方和,记为SSA;反映系统误差(处理误差) 大小的平方和;也称为处理平方和(treatment sum of squares)组内平方和,记为组内平方和,记为SSE;反映随机误差大小的平方和;也称为误差平方和(sum of squa
5、res of error)yyyy-M-d方差分析的基本原理(误差分解)总误差总误差总平方和总平方和(SST)系统误差系统误差随机误差随机误差组间平方和组间平方和(SSA)组内平方和组内平方和(SSE)yyyy-M-d方差分析的基本原理(误差分析)1. 方差分析的基本原理,就是要分析数据的总误差中有没有系统误差。 如果超市的不同位置对销售额没有显著影响,意味着没有系统误差。 这时,每种处理所对应的总体均值(i)应该相等。2. 如果存在系统误差,每种处理所对应的总体均值(i)至少有一对不相等;3. 就例8-1而言,在只考虑超市位置一个因素的情况下,方差分析也就是要检验下面的假设:H0 : 1 2
6、 3 H1 : 1 , 2 , 3 不全相等不全相等方差分析的基本原理(方差比较)1.若不同位置对销售额没有影响,则组间方差中只包含随机误差,没有系统误差。这时,组间方差与组内方差经过平均后的数值就应该很接近,它们的比值就会接近1;2.若不同位置对销售额有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差平均后的数值就会大于组内方差平均后的数值,它们之间的比值就会大于1;当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响;yyyy-M-d方差分析的基本假定1.正态性(normality)。每个总体都应服从正态分布,即对于因素的每一个水平
7、,其观测值是来自正态分布总体的简单随机样本;在例8-1中,要求每个位置超市的销售额必须服从正态分布;检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图等 ;2.方差齐性(homogeneity variance)。各个总体的方差必须相同,对于分类变量的每个水平,有12=22=k2;在例8-1中,要求不同位置超市的销售额的方差都相同;3.独立性(independence)。每个样本数据是来自因素各水平的独立样本(该假定不满足对结果影响较大);在例8-1中,3个样本数据是来自不同位置超市的3个独立样本;单因素方差分析的数学模型l设因素A有k种处理(比如超市位置
8、有“居民区”、“商业区”、“写字楼”3种),单因素方差分析可用下面的线性模型来表示 :l设总均值为,第i个处理的效应可以用第i个处理的均值与总均值的差表示,记为i,即i=i-;这样,第i个处理均值被分解成i=i+,方差分析模型可以改写为 :ijiijyijiijy8.2 8.2 单因素方差分析单因素方差分析8.2.1数据结构8.2.2分析步骤8.2.3关系强度的测量8.2.4方差分析中的多重比较单因素方差分析的数据结构(one-way analysis of variance) 观测值观测值 ( j )因素因素(A) i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1
9、 x12 x22 xk2 : : : : : : : : x1n x2n xkn提出假设1. 一般提法:H0: 1 = 2 = k 自变量对因变量没有显著影响; H1: 1 ,2 , ,k不全相等自变量对因变量有显著影响; 2. 要注意的是: 若拒绝原假设,只是表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。 构造检验的统计量构造统计量需要计算:各个水平的均值;全部观测值的总均值;各个离差平方和;各个均方(MS,即方差) 。构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观测值总和除以观测值的个数;2.计
10、算公式为 构造检验的统计量(计算全部观测值的总均值)1.全部观测值的总和除以观测值的总个数;2.计算公式为 构造检验的统计量(计算总离差平方和 SST)1.全部观测值 与总平均值 的离差平方和;2.反映全部观测值的离散状况;3.其计算公式为:构造检验的统计量(计算组间平方和 SSA)1.各组平均值 与总平均值 的离差平方和;2.反映各总体的样本均值之间的差异程度,又称水平项平方和;3.该平方和既包括随机误差,也包括系统误差;4.计算公式为 :构造检验的统计量(计算组内平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和;2.反映每个样本各观测值的离散状况,又称误差项平方和(或残
11、差平方和);3.该平方和反映的是随机误差的大小;4.计算公式为 :构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系:构造检验的统计量(计算均方MS)1.各误差平方和的大小与观测值的多少有关,为消除观测值多少对误差平方和大小的影响,需要将其平均,这就是均方,均方,即方差;2.计算方法是用误差平方和除以相应的自由度;3.三个平方和对应的自由度分别是:SST 的自由度为n-1,其中n为全部观测值的个数;SSA的自由度为k-1,其中k为因素水平的个数;SSE 的自由度为n-k;构造检验的统计量(计算均方 MS)1. 组间方
12、差:组间方差:SSA的均方,记为MSA,计算公式为:组内方差组内方差SSEMSE构造检验的统计量(计算检验统计量 F )1.将MSA和MSE进行对比,即得到所需要的检验统计量F;2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 :构造检验的统计量(F分布与拒绝域)单因素方差分析结果(基本结构)yyyy-M-d单因素方差分析(例题分析)拒绝拒绝H0Spss方差分析预处理 分析之前需要将原始数据进行调整; 将超市位置作为一个单独的变量,作为spss是一列; 并对其取值居民区、商业区、写字楼分别进行赋值编码; 保证超市位置的变量类型为数值,度量尺度为名义。y
13、yyy-M-d用SPSS进行方差分析选择【分析-比较均值】,并选择【单因素方差分析ANOVA】;将因变量选入因变量列表框,将影响因素选入因子列表框;点确定;另,使用教材介绍的GLM分析方法;A AN NO OV VA A销售额174008.0287004.00013.357.000214958.0336513.879388966.035Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.yyyy-M-d用SPSS进行方差分析(均值图)关系强度的测量 1.拒绝原假设表明因素(自变量)与观测值之间有关系;2.组间平方和(SS
展开阅读全文