回归分析SPSS操作课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《回归分析SPSS操作课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 SPSS 操作 课件
- 资源描述:
-
1、回归分析回归分析 回归分析基本概念回归分析基本概念1 一元线性回归分析一元线性回归分析2多元线性回归分析多元线性回归分析3回归分析基本概念回归分析基本概念1 回归分析主要解决以下几方面的问题:回归分析主要解决以下几方面的问题:q 通过分析大量的样本数据,确定变量之间的数学关系式。通过分析大量的样本数据,确定变量之间的数学关系式。q 对所确定的数学关系式的可信程度进行各种统计检验,并对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的区分出对某一特定变量影响较为显著的变量和影响不显著的变量。变量。q 利用所确定的数学关系式,根据一个或几个变量的值
2、来预利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。精确度。 2.1 2.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:一元线性回归分析是分析某一个因素定义:一元线性回归分析是分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实生活所进行的分析是比较理想化的。其实,在现实生活中,任何一个事物(因变量)总是受到其他多种事中,任何一个事物(因变量)总是受到其他多种事物(多个自变量
3、)的影响。物(多个自变量)的影响。一元线性回归分析一元线性回归分析2 研究问题研究问题 合成纤维的强度与其拉伸倍数有关,测得试验合成纤维的强度与其拉伸倍数有关,测得试验数据如表数据如表9-19-1所示。求合成纤维的强度与拉伸倍数之所示。求合成纤维的强度与拉伸倍数之间是否存在显著的线性相关关系。间是否存在显著的线性相关关系。2.2 SPSS2.2 SPSS中实现过程中实现过程序序 号号拉拉 伸伸 倍倍 数数强度(强度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210
4、.08.1 实现步骤实现步骤q对应对应x x值值的残差图的残差图yyx0良好模式yyx0方差不齐yyx0不满足线性回归假设均数的置信区间均数的置信区间个体的容许区间个体的容许区间222, 2)(1xnxxxnstYievi222, 2)(11xnxxxnstYievi (1 1)输出的结果文件中的第一部分:)输出的结果文件中的第一部分:X与与Y的简单相关系数的简单相关系数2.3 2.3 结果和讨论结果和讨论2)(222nyyneSiiie估计标准误q1 1)决定系数)决定系数R R2 2 它表示在因变量它表示在因变量y y的总变异中可由回归方程所解释部分的总变异中可由回归方程所解释部分的比例。
5、的比例。 0R0R2 21, 1, 越接近于越接近于1, 1, 说明回归方程效果越好。说明回归方程效果越好。SSTSSESSTSSRR12q2 2)校正的决定系数)校正的决定系数A Adj dj R R2 2 0A 0AdjdjR R2 21, 1, 越接近于越接近于1, 1, 说明回归方程效果越好。说明回归方程效果越好。q即使自变量对即使自变量对Y Y无显著意义,无显著意义,R R2 2也随方程中的变量也随方程中的变量个数增加而增加。个数增加而增加。Adj R R2 2可以惩罚复杂模型。可以惩罚复杂模型。MSTMSERAdj12F=t2截距截距回归系数回归系数标准化回归系数结果显示:回归方程
6、显著,即合成纤维的强度受拉伸倍数的显著影响结果显示:回归方程显著,即合成纤维的强度受拉伸倍数的显著影响XYssrb 1xYrzzxYzz(2 2)第二部分)第二部分 异常值分析异常值分析iistandardizedyyresidswhere sstd devof residualsq 如果标准化残差超过如果标准化残差超过2/-22/-2,称为异常值,称为异常值outliersoutliers。q 当样本量比较小,异常值又会影响回归系数的估计时,应当样本量比较小,异常值又会影响回归系数的估计时,应该关注异常值的影响。该关注异常值的影响。212nyysniiiq 异常值 a 不影响 异常值 b 影
7、响q第i个观察值的学生化残差)()(1(122xxxxnsyySyyresidiiiiyyiidstudentizeii212nyysniiiq 考虑了用来计算残差的考虑了用来计算残差的 值有不同的方值有不同的方差。这种调整能够使残差分析更加敏感地发现方差不齐。差。这种调整能够使残差分析更加敏感地发现方差不齐。q学生化残差超过学生化残差超过2 2和和-2-2的点可认为是异常值的点可认为是异常值iiyySiy (3 3)第三部分)第三部分 数据窗口的存储数据窗口的存储 未标准化残差 标准化残差 学生化残差均数的置信区间均数的置信区间个体的容许区间个体的容许区间1.7 利用回归方程进行估计和预测q
8、均数的置信区间:均数的置信区间: 均数均数 界值界值标准误标准误 q个体的容许区间个体的容许区间( (参考值范围参考值范围):): 均数均数 界值界值标准差标准差 22, 2)(+1)-(-xxxxnstYievi22, 2)(+1+1)-(-xxxxnstYievi22可编辑可信区间与预测区间示意图3.1 3.1 统计学上的定义统计学上的定义 定义:在上一节中讨论的回归问题只涉及了一定义:在上一节中讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受自身价格的影往有多个。例如,商品的需求除了受自身价格
9、的影响外,还要受到消费者收入、其他商品的价格、消响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;影响水果产量的外界因素费者偏好等因素的影响;影响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。有平均气温、平均日照时数、平均湿度等。多元线性回归分析多元线性回归分析3q研究者往往是根据自己的经验或借鉴他人的研究研究者往往是根据自己的经验或借鉴他人的研究结果选定若干个自变量,这些自变量对因变量的结果选定若干个自变量,这些自变量对因变量的影响作用是否都有统计学意义还有待于考察。影响作用是否都有统计学意义还有待于考察。q在建立回归方程的过程中有必要考虑对自变量进在建立回归方程的
10、过程中有必要考虑对自变量进行筛选,挑选出若干个与因变量作用较大的变量行筛选,挑选出若干个与因变量作用较大的变量建立回归方程。剔除那些对因变量没有影响的变建立回归方程。剔除那些对因变量没有影响的变量,从而建立一个较理想和稳定的回归方程。量,从而建立一个较理想和稳定的回归方程。3.2 3.2 逐步回归逐步回归逐步回归的思想:q1. 1. 开始方程中没有自变量,然后按自变量对开始方程中没有自变量,然后按自变量对y y的的贡献大小由大到小依次挑选进入方程,每选入一贡献大小由大到小依次挑选进入方程,每选入一个变量,都要对进行检验,决定个变量,都要对进行检验,决定变量的取或舍变量的取或舍。q 2. 2.
展开阅读全文