方差分析和回归分析课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《方差分析和回归分析课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 回归 分析 课件
- 资源描述:
-
1、经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学掌握单因素方差分析F检验的内容并理解多重比较的基本原理了解双因素方差分析的基本概念与原理掌握相关关系的概念、皮尔逊相关系数的估计和检验了解斯皮尔曼秩相关和肯德尔相关的原理经济经济 管理类管理类 基础课程基础课程统计学统计学掌握一元线性回归模型的基本概念、回归系数的最小二乘估计理解因变量与自变量之间线性关系的检验和回归系数的检验了解多元线性回归分析和逻辑斯蒂回归分析经济经济 管理类管理类 基础课程基础课程统计学统计学第第五五章章方方差差分分析析与与回回归归分分析析单因素方差分析单因素方差分析方
2、差分析的方差分析的F F检验检验方差分析的多重比较方差分析的多重比较多因素方差分析多因素方差分析无交互作用的双因素方差分析无交互作用的双因素方差分析有交互作用的双因素方差分析有交互作用的双因素方差分析相关分析相关分析皮尔逊相关系数皮尔逊相关系数斯皮尔曼秩相关系数斯皮尔曼秩相关系数肯德尔肯德尔相关系数相关系数回归分析回归分析一元线性相关分析一元线性相关分析多元线性相关分析多元线性相关分析逻辑斯蒂回归逻辑斯蒂回归经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学方差分析(Analysis of Variance;ANOVA)是费希尔(R.A.F
3、isher)在分析生物和农业实验数据时提出来的,通过检验多个总体均值是否相等,来判断一个或多个分类型变量对某一关心的数值型变量是否有影响。数值型变量被称为因变量,分类型自变量被称为“因素”或“因子”,因素的不同状态被称为水平或处理经济经济 管理类管理类 基础课程基础课程统计学统计学进行方差分析需要满足三个基本假定:(1)每个因素水平组合下的观测或实验数据服从正态分布(2)正态分布的方差是相等的(3)观测或实验数据相互独立,即这些观测或实验时是互不干扰、独立进行的经济经济 管理类管理类 基础课程基础课程统计学统计学按照所研究的因素个数的不同:方差分析单因素方差分析多因素方差分析经济经济 管理类管
4、理类 基础课程基础课程统计学统计学记因素为A,它有k个水平:在每个水平 下有数据 这里 ,并且不要求每个水平下的数据量 相等,总样本量记为 在数据满足三个基本假定的前提下,所谓的“因素没有影响”就意味着每个水平下的总体均值是相等的,“因素有影响”就意味着这些均值必然不全相等。经济经济 管理类管理类 基础课程基础课程统计学统计学因此,方差分析实际上就是要对如下的原假设与备择假设进行假设检验:经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-1 5-1 单因素方差分析的数据结构单因素方差分析的数据结构经济经济 管理类管理类 基础课程基础课程统计学统计学基于表5-1的数据,可有如下定义:总
5、离差平方和组间离差平方和211inkijijSSTxx22111inkkiiiijiSSAxxnxx经济经济 管理类管理类 基础课程基础课程统计学统计学组内离差平方和其中 为第i 个水平下的样本平均数,为总样本平均数。211inkijiijSSExx11iniijjixxn111inkijijxxn经济经济 管理类管理类 基础课程基础课程统计学统计学可以证明:其中:SST反映了因变量全部观测值的总变动 SSA反映了样本均值不同水平之间的差异程度,它一般有两个方面的来源,一是由于因素取不同水平所导致的因变量取不同值的影响,即系统因素,二是随机误差的影响 SSE反映的是每一因素水平下样本内各个观测
6、值的变动程度,它源于随机误差的影响。SSTSSASSE经济经济 管理类管理类 基础课程基础课程统计学统计学定义 它近似反映了在因变量的总变动中可以由因素解释的部分所占的比例,是一种对因素与因变量之间的关系强度的测量2=SSARSST经济经济 管理类管理类 基础课程基础课程统计学统计学可以证明,在原假设成立的条件下,下面的统计量服从自由度为 的 分布,即上式中k-1,n-k分别是组间离差平方和与组内离差平方和的自由度(1,)knkF1(1,)SSA kMSAFF knkSSE nkMSE:经济经济 管理类管理类 基础课程基础课程统计学统计学在原假设成立的情况下,由于因素的不同水平对于因变量的取值
7、没有影响,那么组间离差平方和中就只包含随机误差的影响而没有系统误差的影响,这时组间均方误差MSA(组间离差平方和除以它的自由度k-1)与组内均方误差MSE(组内离差平方和除以它的自由度n-k)就应该很接近,它们的比值就会接近1经济经济 管理类管理类 基础课程基础课程统计学统计学如果原假设不成立,即因素的不同水平对于因变量的取值有显著影响,那么组间离差平方和中除了包含随机误差的影响外,还会受到系统误差的影响,这时组间均方误差MSA就会大于组内均方误差MSE,它们的比值就会大于1。当这个比值大到某种程度时,根据小概率事件原理,就认为因素的不同水平对因变量的取值有显著影响,即自变量对因变量有显著影响
8、。经济经济 管理类管理类 基础课程基础课程统计学统计学做统计判断时,可以利用样本数据计算检验统计量的具体值,然后计算该具体值所对应的p值,用p值与给定的显著性水平 的大小进行比较来决策,若 时,就拒绝原假设,否则不拒绝。或者根据所给定的显著性水平 计算相应的临界值 ,然后比较其与检验统计量的具体值F的大小进行判断,若 时,就拒绝原假设,否则不拒绝。pFFF经济经济 管理类管理类 基础课程基础课程统计学统计学多重比较方法是通过对各水平下总体均值之间的配对比较来进一步检验到底是哪些水平之间存在差异。多重比较的方法很多,常用的有最小显著差异法(Least Significant Difference
9、;LSD)、Bonferroni法、Scheffe法、Tukey法、Duncan多重区域检验法等,这里仅介绍LSD经济经济 管理类管理类 基础课程基础课程统计学统计学第一步:提出原假设与备择假设 第二步:计算具体的 的值;01:ijijHHijxx经济经济 管理类管理类 基础课程基础课程统计学统计学第三步:计算LSD,其公式为 是自由度为 的t分布的临界值 是给定的显著性水平第四步:进行决策,如果 则拒绝 ;否则不拒绝 211ijL S DtM S EnnnkijxxLSD0H2t0H经济经济 管理类管理类 基础课程基础课程统计学统计学一家管理咨询公司为不同的客户举办人力资源讲座。每次讲座的内
10、容基本上是一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是初级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度可能存在差异。听完讲座后随机抽取不同层次的管理者的满意度评分如表5-2所示(评分标准为1-10,10代表非常满意):经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-25-2 不同层次管理者的满意度不同层次管理者的满意度高级管理者中级管理者初级管理者77879898109108565748经济经济 管理类管理类 基础课程基础课程统计学统计学(1)建立原假设与备择假设(2)计算有关的均值及离差平方和01231123:,HH 不全相等试据此检验管理者的层次不
11、同是否会导致评分的显著差异,如果是,究竟存在于哪些层次之间(取显著性水平 )0.05经济经济 管理类管理类 基础课程基础课程统计学统计学123222222222222778797.6,8.857,5.833,7.5577.577.5+87.548.50077.677.6+97.688.85798.857+88.85755.83365.833+85.83318.890 xxxxSSTSSE22257.6 7.578.857 7.565.833 7.529.610SSA 经济经济 管理类管理类 基础课程基础课程统计学统计学(3)列出方差分析表表表5-35-3 方差分析表方差分析表方差来源离差平方和
12、S自由度df均方MSF组间29.610214.80511.756组内18.890151.259总计48.50017经济经济 管理类管理类 基础课程基础课程统计学统计学(4)统计决策对显著性水平 ,能够得到 由于检验统计量 所以拒绝原假设,即有95%的把握认为不同层次的管理者对讲座的满意度是不同的。当然也可以通过比较p值与显著性水平 的大小来决策,在这里可以计算出p值为0.001,它远远小于0.05,因此决策结果同样是拒绝原假设。=0.050.05(2,15)3.682F11.7563.682F 经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较拒绝了原假设,说明管理者层次对讲座
13、的满意度得分确实存在显著性差异,但具体是哪些水平之间存在差异,还需要进行多重比较才能判断。由题意及计算可知:1231235,7,6,7.6,8.857,5.833nnnxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第一步:提出假设第二步:计算检验统计量的值0121120231230131131:HHHHHH假设假设2假设31223137.68.8571.2578.8575.8333.0247.65.8331.767xxxxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第三步:计算LSD由表5-3可知,MSE=1.259,又知道 ,得到下面LSD
14、值0.025(15)2.131t123112.1311.2591.40057112.1311.2591.33076112.1311.2591.44856LSDLSDLSD经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第四步:进行决策由以上计算可知,显示中级管理者与初级管理者之间以及高级管理者与初级管理者之间的差异显著,但高级管理者与中级管理者之间的差异在统计上不显著。121232133,x xLSD xxLSD x xLSD经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)比较均值(M)单因素(ANOVA)”,于是出现图5-1所
15、示的主对话框;(2)选择“满意度得分”到“因变量列表(E)“框,选择“所属管理层次”到“因子(F)”框;经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-1 5-1 单因素方差分析主对话框单因素方差分析主对话框经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(3)单击“两两比较(H)”按钮,打开两级对话框如图5-2所示,勾中复选框“LSD(L)”,然后点击按钮“继续”回到原窗口。经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-2 5-2 两两比较对话框两两比较对话框经济经济 管理类管理类 基础课程基础课程统计学统计学(4)单击“确定”按钮,SPSS的
16、输出结果如表5-4和表5-5所示。表表5-4 5-4 满意度得分的方差分析表满意度得分的方差分析表平方和自由度df均方F显著性组间29.610214.80511.756.001组内18.890151.259总数48.50017经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-5 5-5 满意度得分的多重比较满意度得分的多重比较(I)所属管理层次(J)所属管理层次均值差(I-J)标准误显著性95%置信区间下限上限高级中级-1.257.657.075-2.66.14初级1.767*.680.020.323.22中级高级1.257.657.075-.142.66初级3.024*.624.0
17、001.694.35初级高级-1.767*.680.020-3.22-.32中级-3.024*.624.000-4.35-1.69*意味着结果显著 经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学单因素方差分析只考虑一个因素对因变量的影响,它可以进一步拓展为多因素方差分析。双因素方差分析是多因素方差分析最简单的一种情形,它旨在判断两个因素中某一个或两个因素对因变量是否有显著影响,以及两个因素的不同搭配是否有新效应。经济经济 管理类管理类 基础课程基础课程统计学统计学记某一因素为A,它有r
18、个水平记另一个因素为B,它有s个水平因变量记为X研究的目的:要分析因素A和因素B对因变量X取值的影响12,rA AA12,sB BB经济经济 管理类管理类 基础课程基础课程统计学统计学如果因素A和因素B对因变量X取值的影响是相互独立的,这时只需分别判断这两个因素的影响,这被称为无交互作用的双因素方差分析如果这两个因素的影响不是相互独立的,也就是说两个因素互相搭配的效果会对因变量X的取值产生一种新的影响,也就是说两个因素有交互效应,就称之为有交互作用的双因素方差分析经济经济 管理类管理类 基础课程基础课程统计学统计学在A的r个水平和B的s个水平的每一种组合下做一次观测或试验,可以得到无交互作用的
19、双因素方差分析的数据结构,如表5-6所示。如果在每一组合下做两次以上的观测或试验,就能进一步考察交互作用了。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-6 5-6 无交互作用双因素方差分析的数据结构无交互作用双因素方差分析的数据结构经济经济 管理类管理类 基础课程基础课程统计学统计学在表5-6中:111,2,siijjxxirsgK各行均值111,2,rjijixxjsrgK各列均值111rsijijxxrs总均值经济经济 管理类管理类 基础课程基础课程统计学统计学对于无交互作用的双因素方差分析,其分析原理与单因素方差分析相同。判断因素A的影响是否显著等价于检验原假设:判断因素
20、B的影响是否显著等价于检验原假设:其中 表示A的第i个水平构成的总体的均值;表示B的第j个水平构成的总体的均值。0112:rHgggL0212:sHgggLij经济经济 管理类管理类 基础课程基础课程统计学统计学为了检验这些假设,同样需要对总离差平方和SST进行分解,可以证明其中SSTSSASSE211rsijijSSTxx22111rsriiijiSSAxxsxxgg经济经济 管理类管理类 基础课程基础课程统计学统计学22111rssjjijjSSBxxrxxgg211rsijijijSSExxxxgg经济经济 管理类管理类 基础课程基础课程统计学统计学SSA主要反映了因素A的不同水平引起的
21、因变量的变动,如果因素A各水平之间没有差异,SSA仅仅反映了随机误差的纯效应SSB主要反映了因素B的不同水平引起的变动,如果因素B各水平之间没有差异,SSB也仅仅反映了随机误差的纯效应;SSE中只有数据随机误差效应的影响。经济经济 管理类管理类 基础课程基础课程统计学统计学在一定条件下,可以证明在原假设 成立的条件下0112:rHgggL1,(1)(1)AAESSA fFF rrsSSE f:经济经济 管理类管理类 基础课程基础课程统计学统计学在原假设 成立的条件下0212:sHgggL1,(1)(1)BBESSB fFF srsSSE f:上列式子中,和 分别是SSA、SSB和SSE的自由度
22、,可以利用上面两个表达式作为检验统计量。,ABffEf经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-7 5-7 无交互作用的双因素方差分析表无交互作用的双因素方差分析表方差来源平方和S自由度df均方MSF值因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSB/(s-1)MSB/MSE随机误差SSE(r-1)(s-1)MSE=SSE/(r-1)(s-1)总计SSTrs-1经济经济 管理类管理类 基础课程基础课程统计学统计学为研究食品的包装方法和销售部门对其销量是否有影响,在三个销售部门用三种不同包装进行销售,获得的销量数据如下,取显著性水平为0
23、.05,检验不同的销售部门和不同的包装方法对该食品的销量是否有显著影响。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-7 5-7 无交互作用的双因素方差分析表无交互作用的双因素方差分析表销售部门(A)包装方法(B)盒装袋装散装一部二部三部420480530228245270347369412经济经济 管理类管理类 基础课程基础课程统计学统计学(1)建立原假设(2)计算相应的离差平方和0112302123:HH和3321188189.56ijijSSTxx经济经济 管理类管理类 基础课程基础课程统计学统计学32137868.22iiSSAxx321379044.22jjSSBxx3
24、32111277.11ijijijSSExxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(3)列出方差分析表方差来源平方和SS自由度df均方MSF值因素A7868.2223934.1112.32因素B79044.22239522.11123.79随机误差1277.114319.28总计88189.568表表5-9 5-9 方差分析表方差分析表经济经济 管理类管理类 基础课程基础课程统计学统计学(4)统计判断对于显著性水平0.05,能够查表或用软件得到临界值 因为由此可以判断,销售部门和包装方法对于销售量的影响均是显著的。0.05(2,4)6.94F。010212.326.94123
25、.796.94,ABFHFH,拒绝拒绝经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)一般线性模型(G)单变量(U)”,就会出现如图5-3所示的窗口。选择“销售量”到“因变量(D)”框,选择“销售部门”和“包装方法”到“固定因子(F)”框。经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-3 5-3 双因素方差分析主对话框双因素方差分析主对话框经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(2)点击“模型(M)”按钮,打开如图5-4所示的对话框,“指定模型”选择“设定(C)”,然后设定模型结构:把“因子与协变量(
展开阅读全文