《多重共线性2》课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《多重共线性2》课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重共线性2 多重 线性 课件
- 资源描述:
-
1、 一、多重共线性的概念一、多重共线性的概念 对于模型:对于模型:Y Yi i=0 0+1 1X X1i1i+2 2X X2i2i+k kX Xkiki+i i i=1,2,ni=1,2,n 其基本假设之一是解释变量之间是互不相关的。其基本假设之一是解释变量之间是互不相关的。如果存在不全为如果存在不全为0 0的数的数c c1 1、c c2 2、c ck k,使,使 c c1 1X X1i1i+c c2 2X X2i2i+c ck kX Xkiki=0=0 i i=1,2,=1,2,n n 即:某个解释变量完全可以由其它解释变量的线性组合来表示即:某个解释变量完全可以由其它解释变量的线性组合来表示
2、 则称为解释变量间存在则称为解释变量间存在完全共线性完全共线性(perfect multicollinearityperfect multicollinearity)。)。完全共线性与近似共线性完全共线性与近似共线性如果存在不全为如果存在不全为0 0的数的数c c1 1、c c2 2、c ck k,使,使 c c1 1X X1i1i+c c2 2X X2i2i+c ck kX Xkiki+v vi i=0=0 i i=1,2,=1,2,n n 即:某个解释变量近似地可以由其它解释变量的线性组合来表示即:某个解释变量近似地可以由其它解释变量的线性组合来表示 则称为解释变量间存在则称为解释变量间存
3、在近似共线性近似共线性(approximate multicollinearityapproximate multicollinearity)。共线性示例共线性示例X1X2X31050521575751890972412012930150152 X2=5X1 X2=5X1 完全共线性完全共线性 X3=5X1+V X3=5X1+V 近似共线性近似共线性knnnkkXXXXXXXXXX212221212111111 完全共线性下,完全共线性下,X X中至少有一列向量可由其他列向量(不包括第一列)中至少有一列向量可由其他列向量(不包括第一列)线性表出,线性表出,这意味着:这意味着:秩秩(X)(X)X
4、 X非列满秩非列满秩 (XX)(XX)不满秩不满秩 (XX)(XX)-1-1 不存在不存在 无法得到参数的估计量。无法得到参数的估计量。XY的OLS估计量为:YXXX1)(例:例:对对离差形式离差形式的二元回归模型的二元回归模型如果两个解释变量完全相关,如如果两个解释变量完全相关,如x x2 2=x x1 1,则,则这时,只能确定综合参数这时,只能确定综合参数 1 1+2 2的估计值:的估计值:这一后果的实际意义是:这一后果的实际意义是:无法得到回归系数的唯一解无法得到回归系数的唯一解,但可以得到这些,但可以得到这些系数的线性组合的唯一解系数的线性组合的唯一解Y=0+1X1+2X2+Y=0+(
5、1+2)X1+2 2、近似共线性下解释变量的单独作用无法区分、近似共线性下解释变量的单独作用无法区分实际问题中的直接表现是:模型的回归系数经常表现出实际问题中的直接表现是:模型的回归系数经常表现出反常的现象!反常的现象!例如例如 1 1本来应该是正的,结果却是负的。本来应该是正的,结果却是负的。经验表明,经验表明,如果存在这种反常情形,应该首先怀疑多重共线性。如果存在这种反常情形,应该首先怀疑多重共线性。经典假设下,回归系数经典假设下,回归系数jj表达了在其它解释变量不变的情形下,表达了在其它解释变量不变的情形下,XjXj对对Y Y的的单独作用(净影响)单独作用(净影响)如果模型中两个解释变量
6、具有线性相关性,例如如果模型中两个解释变量具有线性相关性,例如X X2 2=X X1 1 ,这时,这时,X X1 1和和X X2 2前的参数前的参数 1 1、2 2并不反映各自与被解释变量之间的结构关系,而是并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的反映它们对被解释变量的共同影响共同影响 从而解释变量的单独作用无法无区分,从而解释变量的单独作用无法无区分,1 1、2 2失去了应有的经济含义失去了应有的经济含义3 3、近似共线性下、近似共线性下OLSOLS估计量的方差变大估计量的方差变大近似共线性下,可以得到近似共线性下,可以得到OLSOLS参数估计量,并且可以证明,此时
7、参数参数估计量,并且可以证明,此时参数估计量依然满足线性、无偏和有效性,即估计量依然满足线性、无偏和有效性,即OLSOLS依然是依然是BLUEBLUE但是,此时但是,此时参数估计量的方差会增大参数估计量的方差会增大。参数估计量。参数估计量方差方差的表达式为的表达式为由于由于|XX|XX|0 0,引起,引起(XX)(XX)-1-1主对角线元素较大,使参数估计值的方主对角线元素较大,使参数估计值的方差增大差增大12)()(XXCov这意味着:这意味着:(1 1)无法精确的估计参数(以较高的精度估计参数)无法精确的估计参数(以较高的精度估计参数)(2 2)基于参数估计量的标准差的变量显著性检验失效)
8、基于参数估计量的标准差的变量显著性检验失效以二元线性模型以二元线性模型 Y=Y=0 0+1 1X X1 1+2 2X X2 2+为例为例:2221221212221222122211121)(1/)()()var(iiiiiiiiiixxxxxxxxxxXX2221221)(iiiixxxx恰为恰为X X1 1与与X X2 2的线性相关系数的平方的线性相关系数的平方r r2 2由于由于 0 0 r r2 2 1 1,故,故 1/(1-r1/(1-r2 2)1 1212211var()1ixr 方差膨胀因子方差膨胀因子 (Variance Inflation Factor,(Variance I
9、nflation Factor,VIFVIF)显然:多重共线性的存在使得参数估计值的方差增大,其增加的倍数可以显然:多重共线性的存在使得参数估计值的方差增大,其增加的倍数可以采用采用1/(1-r1/(1-r2 2)衡量衡量当当完全不共线完全不共线时时,r r2 2 =0=0 2121/)var(ix当当近似共线近似共线时时,00 r r2 2 10.80.8,比较严重,比较严重 0.90.9,非常严重,非常严重 若在若在OLSOLS法下法下,出现以下现象,则可能意味着共线性的存,出现以下现象,则可能意味着共线性的存在:在:a a、系数估计值的符号不合常理;系数估计值的符号不合常理;b b、R
10、R2 2与与F F值较大,方程具有显著性,但各参数估计值的值较大,方程具有显著性,但各参数估计值的t t检检验值均较小,多个解释变量并不显著验值均较小,多个解释变量并不显著 说明各解释变量对说明各解释变量对Y Y的联合线性作用显著,但各解释变的联合线性作用显著,但各解释变量间存在共线性而使得它们对量间存在共线性而使得它们对Y Y的独立作用不能分辨,故的独立作用不能分辨,故t t检检验不显著。验不显著。2 2、经验判断法、经验判断法 将每个解释变量将每个解释变量X Xi i对其它解释变量对其它解释变量X Xj j进行回归,进行回归,观察其拟合优度观察其拟合优度R R2 2和和F F检验值,如果某
11、个检验值,如果某个R Ri i2 2接近接近1 1,F Fi i显著超出临界值,则表明该显著超出临界值,则表明该X Xi i与其它解释变量存在与其它解释变量存在多重共线性。多重共线性。3 3、辅助回归检验法、辅助回归检验法 计算每个回归系数的计算每个回归系数的VIFVIF或或TOLTOL 方差膨胀因子越大(或容忍度越小),表明模型的多重方差膨胀因子越大(或容忍度越小),表明模型的多重共线性越强。共线性越强。当当VIF5VIF5或或VIF10VIF10时,认为存在较严重的多重共线性。时,认为存在较严重的多重共线性。4 4、方差膨胀因子和容忍度(、方差膨胀因子和容忍度(VIF&TOLVIF&TOL
12、)211jjVIFR 21jjTOLR模型存在较严重的多重共线性时,模型存在较严重的多重共线性时,|XX|0|XX|0,由线性代数,若,由线性代数,若 1 1,k k1 1为矩阵为矩阵XXXX的特征值,则:的特征值,则:|XX|=|XX|=1 1 k k1 1 00表明,特征值中至少有一个接近于表明,特征值中至少有一个接近于0 0。因此可利用矩阵。因此可利用矩阵XXXX的特征值检的特征值检验多重共线性。验多重共线性。条件指数(病态数)条件指数(病态数)CN(ConditionalCN(Conditional Number)Number)CN=CN=最大特征值最大特征值/最小特征值最小特征值 m
13、axmax/minmin 病态指数病态指数CICI(Conditional IndexConditional Index):):CI=SQRT(CN)CI=SQRT(CN)CN CN和和CICI均反映了特征值的离散程度,数值越大表明多重共线性越严重均反映了特征值的离散程度,数值越大表明多重共线性越严重 5 5、特征值检验法、特征值检验法 在模型中排除某一个解释变量在模型中排除某一个解释变量X Xj j,估计模型,估计模型;如果拟合优度与包含如果拟合优度与包含X Xj j时十分接近,则说明时十分接近,则说明X Xj j与其它解释与其它解释变量之间存在共线性。变量之间存在共线性。6 6、剔除检验法
14、、剔除检验法 以以Y Y为被解释变量,逐个引入解释变量,构成回归模型,为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计,根据拟合优度的变化决定新引入的变量是否进行模型估计,根据拟合优度的变化决定新引入的变量是否独立。独立。如果拟合优度变化显著如果拟合优度变化显著,则说明新引入的变量是一个独立,则说明新引入的变量是一个独立解释变量;解释变量;如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的变量与其它,则说明新引入的变量与其它变量之间存在共线性关系。变量之间存在共线性关系。7 7、引入检验法、引入检验法找出引起多重共线性的解释变量,将它排除出去。找出引起多重共线性的解释变
15、量,将它排除出去。以以逐步回归法逐步回归法得到最广泛的应用。得到最广泛的应用。注意:注意:这时,剩余解释变量参数的经济含义和数值都发生了变化这时,剩余解释变量参数的经济含义和数值都发生了变化如果模型被检验证明存在多重共线性,则需要发展新的如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。方法估计模型,最常用的方法有三类。四、克服多重共线性的方法四、克服多重共线性的方法 1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 2 2、第二类方法:差分法、第二类方法:差分法时间序列数据、线性模型:将原模型变换为差分模型时间序列数据、线性模型:将原
展开阅读全文