统计学实验方差回归分析授课用-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学实验方差回归分析授课用-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验 方差 回归 分析 授课 课件
- 资源描述:
-
1、统计学实验方差回归分析方差分析方差分析(Analysis of Variance,ANOVA)1928年由英国统计学家年由英国统计学家R.A.Fisher 首先提首先提出,为纪念出,为纪念Fisher,以,以F 命名,故方差分析命名,故方差分析又称为又称为 F检验检验。方差分析方差分析(ANOVA)检验多个总体均值是否相等检验多个总体均值是否相等研究研究一个或多个一个或多个分类型自变量分类型自变量对对一个一个数值型因变量数值型因变量的影响的影响 有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量 双因素方差
2、分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量无交互作用的双因素方差分析;无交互作用的双因素方差分析;有交互作用的双因素方差分析;有交互作用的双因素方差分析;方差分析检验假定方差分析检验假定 总体是服从正态分布的;总体是服从正态分布的;总体方差是相等的;总体方差是相等的;随机样本是独立的。随机样本是独立的。建立的假设组为:建立的假设组为:提出假设提出假设H0:1 2 k 自变量对因变量没有显著影响,没有系统误差自变量对因变量没有显著影响,没有系统误差 H1:1,2,,k 不全相等不全相等自变量对因变量有显著影响自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均
3、值注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等不相等,并不意味着所有的均值都不相等 某企业需要一种零件,现有三个不同的地区的企业生产的某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出每个地区的企业抽出6 6件产品进行强度测试,其值如表所件产品进行强度测试,其值如表所示。假设每个企业零件的强度值服从正态分布,试检验这示。假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。三个地区企业的零件强度是否存在显著
4、差异。地地区区强强度度样样本本123111611089298103853100118994115106735831079761051161021、单击、单击分析分析(Analyze)比较均值(比较均值(Compare Means)单因素(单因素(One-Way ANOVA),打开对话框。,打开对话框。步骤:步骤:2、从左框中选择、从左框中选择因变量因变量”零件强零件强度度”进入进入因变量因变量框内,选择框内,选择“地地区区”进入进入因子因子框框内。内。点击确定。点击确定。可以得到方差分析表可以得到方差分析表 u 由于由于F统计量值的统计量值的P值明显小于显著性水平,故拒绝假设值明显小于显著性水
5、平,故拒绝假设H0,认为这三个,认为这三个地区的零件强度有显著差异。地区的零件强度有显著差异。u 如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽纽选项选项Option选项,选项,contrast对比对比,Post Hoc两两比较两两比较去实现。去实现。3、单击、单击选项选项Option按纽,打开对话框如图所示,选按纽,打开对话框如图所示,选择输出项。主要有不同水平下样本方差的齐性检验,择输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。缺失值的处理方式及均值的图形。本例中选择本例中选择描述性
6、(描述性(Descriptive)进进行基本统计描述,以及行基本统计描述,以及方差同质检验方差同质检验(Homogeneity of variance test)进行进行不同水平间方差齐性的检验。不同水平间方差齐性的检验。在在缺失值(缺失值(Missing Value)栏中选择栏中选择系统默认项。系统默认项。完成所有选择后返回主对话框,然后单击完成所有选择后返回主对话框,然后单击OK,就,就可以得到三个地区零件强度分析表。可以得到三个地区零件强度分析表。基本统计描述基本统计描述 方差齐性检验方差齐性检验 P值大于值大于0.05,所以,所以因素变量的各水平因素变量的各水平间的方差是没有显间的方差
7、是没有显著差异的。著差异的。Levene检验是一种非参数检验检验是一种非参数检验方法,与方法,与F检验类似,但不依赖检验类似,但不依赖与正态性假设,比与正态性假设,比F检验更稳健。检验更稳健。4、如果需要将水平间两两比较,可以单击、如果需要将水平间两两比较,可以单击两两比较两两比较Post Hoc 按纽,打开多重比较对话框。如图所示:按纽,打开多重比较对话框。如图所示:如果满足在水平间方差相等的条件,常用如果满足在水平间方差相等的条件,常用LSD(最小显著性差异法),(最小显著性差异法),用用 t 检验完成各组均值间的配对比较。检验完成各组均值间的配对比较。当方差不等的情况下,可以选择当方差不
8、等的情况下,可以选择Tamhane s T2,用用t检验进行各组均值间检验进行各组均值间的配对比较。的配对比较。选择多重比较方式后,点击选择多重比较方式后,点击OK,得到输出结果。,得到输出结果。从表中可以看出,地区从表中可以看出,地区2与地区与地区3之间的差异是非常显著的,之间的差异是非常显著的,它们均值差的检验的尾概率为它们均值差的检验的尾概率为0.005,明显小于显著性水平,明显小于显著性水平0.05。例例2 。单因素方差分析的输出结果单因素方差分析的输出结果下表是某商品下表是某商品S在不同地区和不同时期的销售量(千在不同地区和不同时期的销售量(千件)表。已知数据服从正态分布,则要检验地
9、区因件)表。已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。(素及时间因素对销售量的影响是否显著。(SY-23)地地区区时时期期1234516.514.213.42.46.221.87.19.41.54.833.610.87.21.74.943.78.98.62.34.657.612.67.52.85.2由于销售量受地区和时间两个因素的影响,这是一个双因由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题。素方差分析的问题。1、单击、单击分析分析(Analyze)一般线性模型(一般线性模型(General linear Model)单变量(单变量(Univ
10、ariate),打开主对话框。,打开主对话框。步骤:步骤:2、从左框中选择、从左框中选择因变量因变量“销售量销售量”进入进入因变量因变量框内,框内,选择选择“地区地区”和和“时期时期”进入进入固固定因子定因子框内。框内。点击确定。点击确定。3、单击、单击模型(模型(Model)按纽选择分析模型,得到对话框如图。按纽选择分析模型,得到对话框如图。全因子全因子选项为系统默选项为系统默认项,建立全模型,全认项,建立全模型,全模型中包括因素之间的模型中包括因素之间的交互作用。交互作用。如果选择分析两个因如果选择分析两个因素的交互作用,则必须素的交互作用,则必须在每种水平组合下,取在每种水平组合下,取得
11、两个以上的实验数据,得两个以上的实验数据,才能实现两个因素的交才能实现两个因素的交互作用的分析结果。互作用的分析结果。如果不考虑因素间的如果不考虑因素间的交互作用时,应当选择交互作用时,应当选择设定设定模型。模型。先从左边框中选择因先从左边框中选择因素变量进入素变量进入模型模型框中,框中,然后选择类型。然后选择类型。一般不考虑交互作用一般不考虑交互作用时,选择时,选择主效应主效应,考虑,考虑交互作用时,选择交互作用时,选择交互交互。本例中选择主效应。本例中选择主效应。平方和一般选取默认平方和一般选取默认项项类型类型。单击单击继续继续,返回主对,返回主对话框,点击话框,点击确定确定就可以就可以得
12、到相应的双因素方差得到相应的双因素方差分析表分析表.从表中数据可以看出,从表中数据可以看出,F值对应概率值对应概率P值都小于显著性水平值都小于显著性水平0.05,这说明地区和时期对销售量的影响都是显著的。这说明地区和时期对销售量的影响都是显著的。实验实验4:相关与回归分析:相关与回归分析相关分析相关分析回归分析回归分析 两个变量之间的相关关系称简单相关关系。有两两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系:种方法可以反映简单相关关系:通过散点图直观地显示变量之间关系;通过散点图直观地显示变量之间关系;1.通过相关系数准确地反映两变量的关系程度。通过相关系数准确地反映两变
13、量的关系程度。首先打开数据首先打开数据SY-31;然后单击然后单击图形图形Graphs 散点散点Scatter,打开打开散点图散点图Scatter plot对话框,选择需要的散点图,图中的对话框,选择需要的散点图,图中的5个选项如下:个选项如下:3.如果只考虑两个变量,可选择如果只考虑两个变量,可选择简单的散点图简单的散点图Simple,然,然后点击后点击定义定义Define,打开,打开简单散点图简单散点图Simple Scatterplot对对话框话框,如左图所示。如左图所示。4.选择变量分别进入选择变量分别进入X轴和轴和Y轴,点击轴,点击OK后就可以得到右后就可以得到右边的散点图边的散点图
14、。具体操作如下:具体操作如下:1.打开数据库打开数据库SY-31后,单击后,单击分析分析Analyze 相关相关Correlate双双变量变量 Bivariate;如;如图所示。图所示。2、从左边的变量框中选择需要考察的两个变量进入、从左边的变量框中选择需要考察的两个变量进入 变量框内变量框内,选择相关系,选择相关系数的种类,选择检验方式,单击数的种类,选择检验方式,单击选项选项Options按纽。按纽。3.选择输出项和缺失值的处理方式。本例中选择输出基本统计选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。描述。4.单击单击OK,可以得到相关分析的结果。见图所示。,可以得到相关分析的
15、结果。见图所示。从表中可以看到两个变量相关性分析的结果:相关系数是从表中可以看到两个变量相关性分析的结果:相关系数是0.996,相关程,相关程度非常高,且假设检验的度非常高,且假设检验的P值远远地小于值远远地小于0.05,可以认为人均国内生产总,可以认为人均国内生产总值与城镇居民消费额存在线性正相关关系。值与城镇居民消费额存在线性正相关关系。简单相关关系只反映两个变量之间的关系,但简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关一自变量之间的简单相关关系显然受到其它相关因素的影
16、响,不能真实地反映二者之间的关系,因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。的相关程度,即偏相关分析。年份年份火柴销售量火柴销售量(万件)(万件)煤气户数煤气户数(万户)(万户)卷烟销量卷烟销量(百箱)(百箱)蚊香销量蚊香销量(十万盒)(十万盒)打火石销量打火石销量(百万粒)(百万粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.7872
17、18.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17求解火柴销售量与煤气户数的
18、偏相关系数具体操作如下:求解火柴销售量与煤气户数的偏相关系数具体操作如下:1、首先打开数据文件、首先打开数据文件SY-32,单击分析,单击分析Analyze 相关相关 Correlate偏相关偏相关 Partial,打开对话框,见图所示。,打开对话框,见图所示。2、从左边框内选择要、从左边框内选择要考察的两个变量进入变考察的两个变量进入变量框内,其它变量进入量框内,其它变量进入控制框内,如本例中考控制框内,如本例中考察煤气户数与火柴销量察煤气户数与火柴销量的偏相关系数进入变量的偏相关系数进入变量框内,其它(除年份外)框内,其它(除年份外)进入控制框内。进入控制框内。本例中选择简单相关系数。本例
19、中选择简单相关系数。从表中可以看出,火柴销量与煤气户数的简单相关系数为从表中可以看出,火柴销量与煤气户数的简单相关系数为0.826,自由度为自由度为13,检验的,检验的P值为;而偏相关系数为,自由度为值为;而偏相关系数为,自由度为10,检验,检验的的P值为,表示煤气户数对火柴销量的真实影响是显著的。值为,表示煤气户数对火柴销量的真实影响是显著的。表中的上半部分是简单相关系数表中的上半部分是简单相关系数,下半部分是偏相关系数。下半部分是偏相关系数。线性回归是统计分析方法中最常用的方法之一。如果所线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合研究
20、的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象影响是线性的,则可以使用线性回归的方法建立现象(因(因变量)与影响因素(自变量)之间的线性函数关系式。由变量)与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。析软件实现。介绍介绍SPSS软件的线性回归分析的操作方法,包括求回归软件的线性回归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,系数,给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容。对输出
展开阅读全文