多重共线性的发现和检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多重共线性的发现和检验课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性 发现 检验 课件
- 资源描述:
-
1、1 第八章第八章 多重共线性多重共线性2第一节 多重共线性及其影响第二节 多重共线性的发现和检验第三节 多重共线性的克服和处理本章结构3第一节第一节 多重共线形及其影响多重共线形及其影响一、多重共线形及其分类二、严格多重共线形及其危害三、近似多重共线形的原因及其影响4一、多重共线性及其分类n多元线性回归模型要求解释变量之间不存在线性关系,包括严格的线性关系和高度的近似线性关系。n但事实上由于模型设定和数据等各方面的问题,模型的解释变量之间很可能存在某种程度的线性关系。这时候称多元线性回归模型存在多重共线性问题。5n多重共线性可以分为两类。n如果多元线性回归模型中,存在两个或多个解释变量之间存在
2、严格的线性关系,则称为“完全多重共线性”,也称为“严格的多重共线性”。n而解释变量之间存在近似的而不是严格的线性关系,这种情况被称为“近似多重共线性”。6二、严格多重共线形及其危害n完全多重共线性不可能由于数据问题引起,通常是由于模型设定问题,把有严格联系的变量引进同一个模型,或者虚拟变量设置不当引起的。n设两个解释变量的线性回归模型为:回归方程为:22110XXY22110XbXbbY7n求参数最小二乘估计量的正规方程组为:其中 、和 分别是 、和 的离差。n设 和 两个变量之间有严格的线性关系 ,这个模型当然就存在完全的多重共线性。iiiiiiyxxbxxbyxxxbxb222221112
3、122111x2xy1X2XY1X2X122XX 8n此时 也成立。把该关系式代入上述正规方程组中的第二式可得:n得到:n很显然,这个方程与上述正规方程组的第一个方程是完全相同的。122xx iiixyxxbxxb)2()2()2(1122111iiiyxxxbxb11222119n这意味着我们得到了包含两个未知参数估计量的两个相同的方程,这时该方程组有无穷组解而不是有唯一一组解。n这实际上意味着被解释变量究竟受哪些变量的影响变得很不清楚,变量关系是无法识别的。n有完全多重共线性的多元线性回归模型都无法顺利进行参数估计,会使多元线性回归模型参数估计失败,回归分析无法进行。10n完全多重共线性虽
4、然破坏性很大,却不是最需要担心的问题。n因为完全多重共线性是由于模型设定问题,把有严格联系的变量引进同一个模型,或者虚拟变量设置不当引起的,因此只要在建模时适当注意就可以避免。n即使由于模型设定的疏忽使得模型存在完全多重共线性问题,也比较容易发现。因为参数估计失效马上会提示我们这方面的问题。11n完全多重共线性问题的处理也比较简单,只需要针对性地修改模型,放弃、调整相互之间形成线性关系,导致完全多重共线性的部分解释变量。n注意一般不需要也不应该放弃存在线性关系的全部变量,否则容易使模型失去意义。12三、近似多重共线形的原因及其影响n近似多重共线性既与变量选择有关,也与数据有关。n虽然解释变量的
5、选择不当,把内在相关性较强的变量引进同一个模型,是导致近似多重共线性的重要原因,但近似多重共线性更经常的原因是经济数据的共同趋势。13n近似多重共线性不会导致参数估计失效,最小二乘参数估计能够得到唯一解。n在模型存在近似多重共线性的情况下,参数的最小二乘估计不仅仍然是唯一存在的,而且仍然是最小方差线性无偏估计。n但问题是当存在比较严重的近似多重共线性问题时,参数估计方差的绝对水平可能并不小,而且会随着多重共线性程度的提高急剧上升。14n如果 用记变量 的离差平方和,记变量 对其余 个解释变量的回归平方和,表示原模型第k 个解释变量对 其余 个解释变量回归的决定系数,那么 的方差可以写成:kSS
6、TkXkSSRkX1K2kR1Kkb22211)(kkkkkkRSSTSSTSSRSSTbVar15n如果第k个解释变量与其余 个解释变量完全没有相关性,那么 ,。n当第k 个解释变量与其他解释变量之间有相关性时,。n当第k 个解释变量与其他解释变量之间有很强的相关性,也就是模型存在很强的近似多重共线性时,接近1,此时 的方差 会变得非常大。1K02kRkkSSTbVar2)(102kR2kRkb)(kbVar16n参数估计量方差的增大,必然导致参数估计的不稳定性提高,容易出现参数符号和数值大小的异常情况,从而使最小二乘估计的有效性受到很大影响。n多重共线性正是通过这样的机制,对多元线性回归模
7、型的最小二乘估计产生不利影响,其后果常表现为参数估计不稳定,数据的很小变化会引起参数估计值的较大变化,而且参数估计的异常值增多,包括显著性水平不符合实际,或反映解释变量作用方向的符号相反等。17n近似多重共线性表现形式和原因的多样性,数据问题导致多重共线性的隐蔽性,使得近似多重共线性的发现、判断和处理也比较困难。n正是因为这些原因,近似多重共线性是我们重点关心的问题,在多数情况下多重共线性指的就是近似多重共线性。18第二节第二节 多重共线性的发现和检验多重共线性的发现和检验n多重共线性的根源是解释变量之间的相关性,因此分析解释变量之间的相关性,进行单相关或多元相关性的分析检验,是发现和判断多重
8、共线性问题的基本方法。n当然,解释变量之间总是有不同程度相关性的,因此要认定模型确实存在较严重、必须处理的共线性问题,必须结合参数估计的符号、大小和显著性等是否异常,或者参数估计是否表现出很大不稳定性(可通过改变少量数据检验)等进行判断。19n因为多重共线性是通过对参数估计方差的放大作用对多元线性回归产生不利影响的,而解释变量的共线性程度与参数估计量方差的大小有一致性,因此可以根据参数估计方差被“放大”的程度,判断模型是否存在多重共线性问题,以及是由哪些变量引起的共线性问题。n以参数估计 为例。的方差为:kbkbkkkkSSTRSSTbVar22211)(20n而 中的因子 ,正是第k个解释变
展开阅读全文