书签 分享 收藏 举报 版权申诉 / 40
上传文档赚钱

类型多重共线性问题分析课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2297152
  • 上传时间:2022-03-31
  • 格式:PPT
  • 页数:40
  • 大小:320.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《多重共线性问题分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    多重 线性 问题 分析 课件
    资源描述:

    1、问题一:多重共线性问题一:多重共线性 Multi-CollinearityMulti-Collinearity一、多重共线性的概念一、多重共线性的概念二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例*七、分部回归与多重共线性七、分部回归与多重共线性一、多重共线性的概念一、多重共线性的概念 对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相如果某两个

    2、或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Multicollinearity)。 如果存在如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中其中: ci不全为不全为0,则称为解释变量间存在,则称为解释变量间存在完全共线完全共线性性(perfect multicollinearity)。 如果存在如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中其中ci不全为不全为0,vi为随机误差项,则称为为随机误差项,则称为 近似共线近似共线性性(approximate multicollinearity)或或交互相关交互相关(in

    3、tercorrelated)。 注意:注意: 完全共线性的情况并不多见,一般出现完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线的是在一定程度上的共线性,即近似共线性。性。 二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下一般地,产生多重共线性的主要原因有以下三个方面:三个方面: (1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:时间序列样本:经济经济繁荣时期繁荣时期,各基本经济,各基本经济变量(收入、消费、投资、价格)都趋于增长;变量(收入、消费、投资、价格)都趋于增长;衰退时期衰退时期,又同时趋

    4、于下降。,又同时趋于下降。 横截面数据:横截面数据:生产函数中生产函数中,资本投入与劳动资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,力投入往往出现高度相关情况,大企业二者都大,小企业都小。小企业都小。 (2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。后经济变量来反映真实的经济关系。 例如例如,消费,消费=f(当期收入当期收入, 前期收入)前期收入) 显然,两期收入间有较强的线性相关显然,两期收入间有较强的线性相关性。性。 (3 3)样本资料的限制)样本资料的限制 由于完全符合理论模型所要求的

    5、样本数据较由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线难收集,特定样本可能存在某种程度的多重共线性。性。 一般经验一般经验: 时间序列数据时间序列数据样本:简单线性模型,往往存在样本:简单线性模型,往往存在多重共线性。多重共线性。 截面数据截面数据样本:问题不那么严重,但多重共线样本:问题不那么严重,但多重共线性仍然是存在的。性仍然是存在的。 二、多重共线性的后果二、多重共线性的后果 1 1、完全共线性情况下的后果、完全共线性情况下的后果 (1) (1) 完全共线性下参数估计量不存在完全共线性下参数估计量不存在 (2) (2) 参数估计量的方差无限大参数估计

    6、量的方差无限大 2 2、不完全多重共线性产生的后果、不完全多重共线性产生的后果 如果模型中存在不完全的多重共线性,可以得到如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量分析可能会产生一系参数的估计值,但是对计量分析可能会产生一系列的影响。列的影响。 (1)参数估计值的方差增大)参数估计值的方差增大(2)对参数区间估计时)对参数区间估计时, 置信区间趋于变大置信区间趋于变大(3)严重多重共线时)严重多重共线时,假设检验容易做出错误的假设检验容易做出错误的判断判断(4)当多重共线性严重时)当多重共线性严重时,可能造成可决系数可能造成可决系数R2较高经较高经F检验的参数联合显著性

    7、也很高,但对各检验的参数联合显著性也很高,但对各个参数单独的个参数单独的t检验却可能不显著,甚至可能使检验却可能不显著,甚至可能使估计的回归系数相反,得出完全错误的结论估计的回归系数相反,得出完全错误的结论 。变量的显著性检验失去意义变量的显著性检验失去意义存在多重共线性时存在多重共线性时参数估计值的方差与标准差变大参数估计值的方差与标准差变大容易使通过样本计算的容易使通过样本计算的t值小于临界值,值小于临界值, 误导作出参数为误导作出参数为0的推断的推断可能将重要的解释变量排除在模型之外可能将重要的解释变量排除在模型之外注意:注意: 除非是完全共线性,多重共线性并不意味着除非是完全共线性,多

    8、重共线性并不意味着任何基本假设的违背;任何基本假设的违背; 因此,即使出现较高程度的多重共线性,因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。估计量仍具有线性性等良好的统计性质。 问题在于问题在于,即使,即使OLS法仍是最好的估计方法,法仍是最好的估计方法,它却不是它却不是“完美的完美的”,尤其是在统计推断上无,尤其是在统计推断上无法给出真正有用的信息。法给出真正有用的信息。 多重共线性检验的任务多重共线性检验的任务是: (1)检验多重共线性是否存在;)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之)估计多重共线性的范围,即判断哪些变量之

    9、间存在共线性。间存在共线性。 多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法用于多重共线性的检验方法主要是统计方法:如判定系数检验法判定系数检验法、逐步回归检验法逐步回归检验法等。 三、多重共线性的检验三、多重共线性的检验 1 1、检验多重共线性是否存在、检验多重共线性是否存在 (1)(1)对两个解释变量的模型,采用对两个解释变量的模型,采用简单相关系数法简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 (2) (2)对多个解释变量的模型,对多个解释变量的模型,采用综合统计检验法采用综合统计检验法 若 在在

    10、OLS法下:法下:R2与与F值较大,但值较大,但t检验值较小检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。 2 2、判明存在多重共线性的范围、判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟由哪些变量引起。 (1) 判定系数检验法判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归 Xji=1X1i+2X2i+LXLi的判定系数判定系数较大,说明Xj与其他X间存在共线性共线性。具体可进一步对上述回归方程作具体可进一步对上述回归方程作F检验:检

    11、验: 式中:Rj2为第j个解释变量对其他解释变量的回归方程的决定系数, 若存在较强的共线性,则Rj2较大且接近于1,这时(1- Rj2 )较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。 构造如下F统计量) 1, 2() 1/()1 ()2/(2.2.knkFknRkRFjjj 在模型中排除某一个解释变量在模型中排除某一个解释变量Xj,估,估计模型计模型; 如果拟合优度与包含如果拟合优度与包含Xj时十分接近,时十分接近,则说明则说明Xj与其它解释变量之间存在共线性。与其它解释变量之间存在共线性。 另一等价的检验另一等价的检验是是: (2)逐

    12、步回归法逐步回归法 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。(3)方差扩大(膨胀)因子法)方差扩大(膨胀)因子法 统计上可以证明,解释变量统计上可以证明,解释变量的参数估计式的参数估计式的方差可表示为的方差可表示为 其中的其中的是变量是变量(Variance Inflation Factor),即,即的方差扩大因子的方差扩大因子其中其中 是多个解

    13、释变量辅助回归的可决系数是多个解释变量辅助回归的可决系数 21VIF =1-jjR222221Var() =VIF1-jjjjjxRxVIFjjXjXj2jR经验规则经验规则方差膨胀因子越大,表明解释变量之间的多重共方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。多重共线性越弱。经验表明,方差膨胀因子经验表明,方差膨胀因子10时,说明解释变量时,说明解释变量与其余解释变量之间有严重的多重共线性,且这与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。种多重共线性可能会过度地

    14、影响最小二乘估计。(4)直观判断法)直观判断法当增加或剔除一个解释变量,或者改变一当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线变化,回归方程可能存在严重的多重共线性。性。从定性分析认为,一些重要的解释变量的从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能没有通过显著性检验时,可初步判断可能存在严重的多重共线性。存在严重的多重共线性。有些解释变量的回归系数所带正负号与定性分有些解释变量的回归系数所带正负

    15、号与定性分析结果违背时,很可能存在多重共线性。析结果违背时,很可能存在多重共线性。解释变量的相关矩阵中,自变量之间的相关系解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。数较大时,可能会存在多重共线性问题。 找出引起多重共线性的解释变量,将它排除出去。 以逐步回归法逐步回归法(stepwise)得到最广泛的应用。 注意:注意: 这时,剩余解释变量参数的经济含义和数值都这时,剩余解释变量参数的经济含义和数值都发生了变化。发生了变化。 如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。四、克服多重共线性的方法四、克服多重共线性的方法 1

    16、1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 2 2、第二类方法:差分法、第二类方法:差分法 时间序列数据、线性模型:将原模型变换为时间序列数据、线性模型:将原模型变换为差分模型差分模型: Yi= 1 X1i+ 2 X2i+ k Xki+ i可以有效地消除原模型中的多重共线性。可以有效地消除原模型中的多重共线性。 一般而言,差分后变量之间的相关性要比一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计低出现共线性的可能性,此时可直接估计差分方程。差分方程。问题:问题:差分会丢失

    17、一些信息,差分模型的误差差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。归模型的相关假设,在具体运用时要慎重。 例例如如:表表 4.3.2 中国中国 GDP 与居民消费与居民消费 C 的总量与增量数据的总量与增量数据(亿元)(亿元)年份CYC/YCYC/Y19781759.13605.60.48819792005.44074.00.492246.3468.40.52619802317.14551.30.509311.7477.30.65319812604.14901.40.531287.03

    18、50.10.82019822867.95489.20.522263.8587.80.44919833182.56076.30.524314.6587.10.53619843674.57164.40.513492.01088.10.45219854589.08792.10.522914.51627.70.56219865175.010132.80.511586.01340.70.43719875961.211784.70.506786.21651.90.47619887633.114704.00.5191671.92919.30.57319898523.516466.00.518890.4176

    19、2.00.50519909113.218319.50.497589.71853.50.318199110315.921280.40.4851202.72960.90.406199212459.825863.70.4822143.94583.30.468199315682.434500.70.4553222.68637.00.373199420809.846690.70.4465127.412190.00.421199526944.558510.50.4616134.711819.80.519199632152.368330.40.4715207.89819.90.530199734854.67

    20、4894.20.4652702.36563.80.412199836921.179003.30.4672066.54109.10.503199939334.482673.10.4762413.33669.80.658200042911.989112.50.4823577.56439.40.556 由表中的比值可以直观地看到,增量的增量的线性关系弱于总量之间的线性关系线性关系弱于总量之间的线性关系。 进一步分析:进一步分析: Y与C(-1)之间的判定系数为0.9988, Y与C(-1)之间的判定系数为0.9567 3、第三类方法:减小参数估计量的方差、第三类方法:减小参数估计量的方差 多重共线性

    21、多重共线性的主要后果后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如: 增加样本容量增加样本容量,可使参数估计量的方可使参数估计量的方差减小差减小。 横截面数据与时序数据并用横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整时序数据估计出另外的部分参数,最后得到整个方程参数的估计。个方程参数的估计。 注意:注意:这里包含着假设,即参数的横截面估计和这里包含着假设,即参数的横截面

    22、估计和从纯粹时间序列分析中得到的估计是一样的。从纯粹时间序列分析中得到的估计是一样的。 变量变换变量变换变量变换的主要方法:变量变换的主要方法:(1)计算相对指标计算相对指标 (2)将名义数据转换为实际数据将名义数据转换为实际数据 (3)将小类指标合并成大类指标将小类指标合并成大类指标 变量数据的变换有时可得到较好的结果,但无变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。法保证一定可以得到很好的结果。 *岭回归法岭回归法(Ridge Regression) 70年代发展的岭回归法,以引入偏误为代价减小以引入偏误为代价减小参数估计量的方差参数估计量的方差,受到人们的重视。

    23、 具体方法是:引入矩阵D,使参数估计量为 其中矩阵D一般选择为主对角阵,即 D=aI a为大于0的常数。YXDXX1)((*) 显然,与未含显然,与未含D的参数的参数B的估计量相比,的估计量相比,(*)式的估式的估计量有较小的方差。计量有较小的方差。 六、案例六、案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食生产函数: Y= 0+ 1 X1 + 2 X2 + 3 X3 + 4 X4 + 4 X5 +

    24、 表表 4.3.3 中国粮食生产与相关投入资料中国粮食生产与相关投入资料年份粮食产量Y(万吨)农业化肥施用量1X(万公斤)粮食播种面积2X(千公顷)受灾面积3X(公顷)农业机械总动力4X(万千瓦)农业劳动力5X(万人)1983387281659.811404716209.31802231645.11984407311739.811288415264.01949731685.01985379111775.810884522705.32091330351.51986391511930.611093323656.02295030467.01987402081999.311126820392.7248

    25、3630870.01988394082141.511012323944.72657531455.71989407552357.111220524448.72806732440.51990446242590.311346617819.32870833330.41991435292806.111231427814.02938934186.31992442642930.211056025894.73030834037.01993456493151.911050923133.03181733258.21994445103317.910954431383.03380232690.319954666235

    26、93.711006022267.03611832334.51996504543827.911254821233.03854732260.41997494173980.711291230309.04201632434.91998512304083.711378725181.04520832626.41999508394124.311316126731.04899632911.82000462184146.410846334374.05257432797.5 1 1、用、用OLS法估计上述模型法估计上述模型: R2接近于1; 给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4

    27、 15.19,故认上述粮食生产的总体线性关系显著成立。 但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。54321028. 0098. 0166. 0421. 0213. 644.12816XXXXXY (-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14) 2 2、检验简单相关系数、检验简单相关系数 发现:发现: X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:X1X2X3X4X5X11.000.010.640.960.55X20.011.00-0.45-0.040.

    28、18X30.64-0.451.000.690.36X40.96-0.040.691.000.45X50.550.180.360.451.00 3 3、找出最简单的回归形式、找出最简单的回归形式 可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:1576. 464.30867XY (25.58) (11.49) R2=0.8919 F=132.1 DW=1.562699. 018.33821XY (-0.49) (1.14) R2=0.075 F=1.30 DW=0.124380. 00 .31919XY (17.45) (6

    29、.68) R2=0.7527 F=48.7 DW=1.115240. 219.28259XY (-1.04) (2.66)R2=0.3064 F=7.07 DW=0.36 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。CX1X2X3X4X52RDWY=f(X1)308684.230.88521.56 t 值25.5811.49Y=f(X1,X2)-438714.650.670.95582.01t 值-3.0218.475.16Y=f(X1,X2,X3)-119785.260.41-0.190.97521.53t 值0.8519.63.35-3.57Y=f(X1,X2,X3,X4)-130566.170.42-0.17-0.090.97751.80t 值-0.979.613.57-3.09-1.55Y=f(X1,X3,X4,X5)-126905.220.40-0.200.070.97981.55t 值-0.8717.853.02-3.470.37 回归方程以回归方程以Y=f(Y=f(X1,X2,X3) )为最优:为最优: 5 5、结论、结论32119. 041. 026. 511978XXXY结结 束束 了!了!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:多重共线性问题分析课件.ppt
    链接地址:https://www.163wenku.com/p-2297152.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库