多重线性回归分析-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多重线性回归分析-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性 回归 分析 课件
- 资源描述:
-
1、多重线性回归分析多重线性回归分析军事医学科学院军事医学科学院统计学教研室统计学教研室高高 辉辉2内内 容容 基本原理基本原理 方法简介方法简介 分析步骤分析步骤 几点补充几点补充3一、方法简介一、方法简介 1.1 分析目的与方法选择分析目的与方法选择 研究一个因变量与一个自变量间的线性关系时研究一个因变量与一个自变量间的线性关系时 简单线性回归分析简单线性回归分析 研究一个因变量与多个自变量间的线性关系时研究一个因变量与多个自变量间的线性关系时 多重线性回归分析多重线性回归分析 研究多个因变量与多个自变量间的线性关系时研究多个因变量与多个自变量间的线性关系时 多元多重线性回归分析多元多重线性回
2、归分析4一、方法简介一、方法简介 1.2 概念概念 用回归方程用回归方程定量地刻画一个因变量与多个自定量地刻画一个因变量与多个自变量之间的线性依存关系变量之间的线性依存关系,称为多重线性回归分,称为多重线性回归分析(析(multiple linear regression analysis)。)。自变量是相互独立的连续型变量或分类变量。自变量是相互独立的连续型变量或分类变量。一、方法简介一、方法简介 1.3 数据结构数据结构 表表1 进行多重线性回归分析资料的数据结构进行多重线性回归分析资料的数据结构5编号编号X1X2XkY1X11X12X1kY12X21X22X2kY2:nXn1Xn2Xnk
3、Yn6二、基本原理二、基本原理 2.1 原理简介原理简介 多重线性回归模型:多重线性回归模型:Y=b b0+b b1X1+b b2X2+b bkXk+e e=b bX+e e 其中,其中,b bj(j=0,1,2 ,k)为未知参数,为未知参数,e e为随机为随机误差项。误差项。7二、基本原理二、基本原理 2.1 原理简介原理简介 多重线性回归模型中包含多个自变量,它们多重线性回归模型中包含多个自变量,它们同时对因变量同时对因变量Y 发生作用。发生作用。若要考察一个自变量对若要考察一个自变量对Y 的影响,就必须假的影响,就必须假设其他自变量保持不变。设其他自变量保持不变。8二、基本原理二、基本原
4、理 2.1 原理简介原理简介 因此,多重线性回归模型中的回归系数为因此,多重线性回归模型中的回归系数为偏偏回归系数回归系数。它反映的是当模型中的它反映的是当模型中的其他自变量不变时其他自变量不变时,其中其中一个自变量对因变量一个自变量对因变量Y 的均值的影响的均值的影响。9二、基本原理二、基本原理 2.2 前提条件前提条件 多重线性回归分析要求资料满足线性多重线性回归分析要求资料满足线性(Linear)、独立性、独立性(Independence)、正态性、正态性(Normality)和方差齐性和方差齐性(Equal variance),即,即LINE条件条件。除此之外,还要求多个自变量之间相关
5、性不除此之外,还要求多个自变量之间相关性不要太强。要太强。10二、基本原理二、基本原理 2.2 前提条件前提条件线性线性指自变量与因变量之间的关系是线性的指自变量与因变量之间的关系是线性的独立性独立性指各观测值之间是相互独立的指各观测值之间是相互独立的正态性正态性指自变量取不同值时,因变量服从正指自变量取不同值时,因变量服从正 态分布态分布方差齐性方差齐性指自变量取不同值时,因变量的方指自变量取不同值时,因变量的方 差相等差相等 11三、分析步骤三、分析步骤 1.基本任务基本任务 求出模型中参数的估计值,对模型和参数进求出模型中参数的估计值,对模型和参数进行假设检验;行假设检验;对自变量进行共
6、线性诊断,对观测值进行异对自变量进行共线性诊断,对观测值进行异常值诊断;常值诊断;结合统计学知识和专业知识,对回归方程进结合统计学知识和专业知识,对回归方程进行合理的解释,并加以应用。行合理的解释,并加以应用。12三、分析步骤三、分析步骤 2.具体步骤具体步骤 2.1 回归参数估计回归参数估计 多重线性回归分析的参数估计,常采用最小多重线性回归分析的参数估计,常采用最小二乘法二乘法(OLS)进行。进行。参数估计值为:参数估计值为:-1X XX Yb=13三、分析步骤三、分析步骤 2.具体步骤具体步骤 2.2 模型检验模型检验 根据方差分析的思想,将总的离均差平方和根据方差分析的思想,将总的离均
7、差平方和SS总总分解为回归平方和分解为回归平方和SS回回和残差平方和和残差平方和SS残残两部两部分。分。SS总总的自由度为的自由度为n-1,SS回回的自由度为的自由度为k,SS残残的自由度为的自由度为n-k-1。14三、分析步骤三、分析步骤 2.具体步骤具体步骤 2.2 模型检验模型检验 222SSyySSyySSyy=总回残15三、分析步骤三、分析步骤 2.具体步骤具体步骤 2.2 模型检验模型检验 模型的显著性检验步骤为:模型的显著性检验步骤为:第一步,建立检验假设。第一步,建立检验假设。H0:b b1=b b2=b bk=0H1:b b1,b b2,b bk不同时为不同时为016三、分析
8、步骤三、分析步骤 2.具体步骤具体步骤 2.2 模型检验模型检验 模型的显著性检验步骤为:模型的显著性检验步骤为:第二步,计算统计量第二步,计算统计量F的值。的值。,1/1k n kSSkFFSSnk=回残17三、分析步骤三、分析步骤 2.具体步骤具体步骤 2.2 模型检验模型检验 模型的显著性检验步骤为:模型的显著性检验步骤为:第三步,确定第三步,确定P值,下统计学结论。值,下统计学结论。根据检验统计量根据检验统计量F的值和自由度,确定其对的值和自由度,确定其对应的应的P值。若值。若Pa a,则接受,则接受H0,认为回归模型的系,认为回归模型的系数全部为数全部为0;若;若P ta a/2(n
9、-k-1)或或t-ta a/2(n-k-1),则,则P FModel 61985.79167330.9652854.99|t|Intercept1-83.1803616.97446-4.90l l2 l lk。63三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.1 条件数条件数 最大特征根与其余每个特征根比值的平方根,最大特征根与其余每个特征根比值的平方根,称为条件指数称为条件指数(conditional number),公式为:,公式为:1=2,3,iiCNikll=64三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.1 条件数条件数 而最大条件指数,简称为条件数
10、,其值为最而最大条件指数,简称为条件数,其值为最大特征根与最小特征根之比值的平方根。即:大特征根与最小特征根之比值的平方根。即:1=kkCNll65三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.1 条件数条件数 条件数越大,说明设计矩阵条件数越大,说明设计矩阵X具有越强的共具有越强的共线性。线性。经验上,若经验上,若0CNk30,则认,则认为自变量间存在严重的多重共线性。为自变量间存在严重的多重共线性。66三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.2 方差分量方差分量 SAS软件在给出条件数的同时,还会给出每软件在给出条件数的同时,还会给出每个主成分变量分得
11、的方差,即方差分量,个主成分变量分得的方差,即方差分量,SAS输输出结果时的标志是出结果时的标志是“Var Prop”。67三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.2 方差分量方差分量 若条件数若条件数(即最大条件指数即最大条件指数)大于大于10,且所在,且所在行同时有两个以上的变量方差分量超过行同时有两个以上的变量方差分量超过0.5,就意,就意味着这些变量间存在一定程度的相关。味着这些变量间存在一定程度的相关。68三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.3 共线性的解决方法共线性的解决方法(1)变量筛选变量筛选 采用自变量筛选的方法一般可选出对因变
12、量采用自变量筛选的方法一般可选出对因变量有统计学影响且相互之间独立或相关性较低的一有统计学影响且相互之间独立或相关性较低的一组自变量。组自变量。69三、分析步骤三、分析步骤 2.6 共线性诊断共线性诊断2.6.3 共线性的解决方法共线性的解决方法(2)有偏估计有偏估计 自变量间存在多重共线性且专业上认为需要自变量间存在多重共线性且专业上认为需要保留在模型中时,不宜使用最小二乘法估计模型。保留在模型中时,不宜使用最小二乘法估计模型。此时,可采用有偏估计。此时,可采用有偏估计。此类方法包括岭回归分析、主成分回归分析此类方法包括岭回归分析、主成分回归分析等。等。70三、分析步骤三、分析步骤 2.6
13、共线性诊断共线性诊断2.6.3 共线性的解决方法共线性的解决方法(3)增大样本含量增大样本含量 通过增加样本含量,减少估计量的方差,提通过增加样本含量,减少估计量的方差,提高估计精度,可在一定程度上克服多重共线性。高估计精度,可在一定程度上克服多重共线性。71三、分析步骤三、分析步骤 2.7 异常点诊断异常点诊断 2.7.1 异常点异常点 对因变量的预测值影响特别大,甚至容易导对因变量的预测值影响特别大,甚至容易导致相反结论的观测点,称为异常点。致相反结论的观测点,称为异常点。异常点的诊断,可采用学生化残差统计量、异常点的诊断,可采用学生化残差统计量、Cooks D统计量。统计量。72三、分析
展开阅读全文