工具变量回归教材课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《工具变量回归教材课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工具 变量 回归 教材 课件
- 资源描述:
-
1、工具变量回归工具变量回归第1页,共55页。OLS OLS经典假设经典假设 所有的解释变量所有的解释变量X Xi i与随机误差与随机误差项彼此之间不相关。项彼此之间不相关。(,)0iiCov u X若解释变量若解释变量Xi和和ui相关,则相关,则OLS估计量是非一致估计量是非一致的,也就是即使当样本容量很大时,的,也就是即使当样本容量很大时,OLS估计量估计量也不会接近回归系数的真值。也不会接近回归系数的真值。当解释变量和随机误差项相关时,模型存在着当解释变量和随机误差项相关时,模型存在着内生内生性性问题。问题。第2页,共55页。在计量经济学中,把所有与扰动项相关的在计量经济学中,把所有与扰动项
2、相关的解释变量都称为解释变量都称为“内生变量内生变量”。这与一般。这与一般经济学理论中的定义有所不同。经济学理论中的定义有所不同。1。与误差项相关的变量称为。与误差项相关的变量称为内生变量内生变量(endogenous variable)。2。与误差项不相关的变量称为。与误差项不相关的变量称为外生变量外生变量(exogenous variable)。第3页,共55页。造成误差项与回归变量相关(内生性)的原造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:因很多,但我们主要考虑如下几个方面:遗漏变量偏差遗漏变量偏差变量有测量误差变量有测量误差双向因果关系双向因果关系。第4
3、页,共55页。遗漏变量偏差遗漏变量偏差第5页,共55页。第6页,共55页。变量有测量误差变量有测量误差测量数据正确时:假设方程为:测量数据正确时:假设方程为:01iiiYXu当存在测量误差时:方程为:当存在测量误差时:方程为:01iiiYXv01011()iiiiiiiYXvXXXu所以我们有:所以我们有:第7页,共55页。1()iiiivXXu可知,误差项中包含可知,误差项中包含iiXX所以可以得到:如果所以可以得到:如果(,)0iiiCov XX X则回归结果有偏,非一致则回归结果有偏,非一致我们假设我们假设iiiXXw则有则有21122xpxw 第8页,共55页。结论:结论:1。由于。由
4、于 2221xxw2。回归的性质决定于。回归的性质决定于w的标准差的标准差 2211220 xppwxw 2211122xppwxw 第9页,共55页。双向因果关系双向因果关系之前我们假定因果关系是从回归变量到因之前我们假定因果关系是从回归变量到因变量的变量的(X导致了导致了Y)。但如果因果关系同时。但如果因果关系同时也是从因变量到一个或多个回归变量也是从因变量到一个或多个回归变量(Y导导致了致了X)的呢?如果是这样的话,因果关系的呢?如果是这样的话,因果关系是向前的也是是向前的也是“向后向后”的,即存在双向因的,即存在双向因果关系,如果存在双向因果关系,则果关系,如果存在双向因果关系,则OL
5、S回回归中同时包含了这两个效应,因此归中同时包含了这两个效应,因此OLS估计估计量是有偏的、非一致的。量是有偏的、非一致的。第10页,共55页。2111(,)/(1)iiuCov X urr可以推导出:可以推导出:第11页,共55页。遗漏变量偏差遗漏变量偏差可采用在多元回归中加入遗漏变可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。变量数据时上述方法才可行。双向因果关系偏差双向因果关系偏差是指如果有时因果关系是从是指如果有时因果关系是从X到到Y又从又从Y到到X时,此时仅用多元回归无法消时,此时仅用多元回归无法
6、消除这一偏差。同样,除这一偏差。同样,变量有测量误差变量有测量误差也无法用我们前面学过的方法也无法用我们前面学过的方法解决。解决。因此我们就必须寻找一种新的方法。因此我们就必须寻找一种新的方法。第12页,共55页。工具变量工具变量(instrumental variable,IV)回回归是当回归变量归是当回归变量X与误差项与误差项u相关时获得总体相关时获得总体回归方程未知系数一致估计量的一般方法。回归方程未知系数一致估计量的一般方法。我们经常称其为我们经常称其为IV估计估计。其其基本思想基本思想是:假设方程是:是:假设方程是:我们假设我们假设ui与与Xi相关,则相关,则OLS估计量一定是估计量
7、一定是有有偏偏的和的和非一致非一致的。的。工具变量估计工具变量估计是利用另一个是利用另一个“工具工具”变量变量Z将将Xi分离成与分离成与ui相关和不相关的相关和不相关的两部分。两部分。第13页,共55页。我们的工作就是要寻找相应的我们的工作就是要寻找相应的工具变量工具变量将解将解释变量分解成内生变量和外生变量,然后利释变量分解成内生变量和外生变量,然后利用用两阶段最小二乘法两阶段最小二乘法(TSLS)进行估计。进行估计。第14页,共55页。工具变量的选取工具变量的选取 一个有效的工具变量必须满足称为一个有效的工具变量必须满足称为工具变量相关工具变量相关性性和和工具变量外生性工具变量外生性两个条
8、件两个条件:即即 (1)工具变量相关性工具变量相关性:工具变量与所替代的随机:工具变量与所替代的随机解释变量高度相关;解释变量高度相关;(2)工具变量外生性:工具变量外生性:工具变量与随机误差项不工具变量与随机误差项不相关;相关;(,)0iCov Zi X(,)0iiCov u Z 第15页,共55页。两阶段最小二乘估计量两阶段最小二乘估计量若工具变量若工具变量Z满足工具变量相关性和外生性的满足工具变量相关性和外生性的条件,则可用称为条件,则可用称为两阶段最小二乘两阶段最小二乘(TSLS)的的IV估计量估计系数估计量估计系数 1 1。两阶段最小二乘估计量分两阶段计算:两阶段最小二乘估计量分两阶
9、段计算:第一阶段第一阶段把把X分解成两部分:即与回归误差项分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。相关的一部分以及与误差项无关的一部分。第二阶段第二阶段是利用与误差项无关的那部分进行估是利用与误差项无关的那部分进行估计。计。第16页,共55页。一般一般IV回归模型回归模型因变量因变量 Yi。外生解释变量外生解释变量 W1i、W2i、Wri。内生解释变量内生解释变量 X1i、X2i、Xki。我们引入工具变量我们引入工具变量Z1i、Z2i、Zmi。第17页,共55页。第一阶段回归:第一阶段回归:利用利用OLS建立每个内生变量(建立每个内生变量(X1i、X2i、Xki)关于
10、工具变量)关于工具变量(Z1i、Z2i、Zmi)和)和外生变量(外生变量(W1i、W2i、Wri)的回归,并得到所)的回归,并得到所有回归结果的拟合值有回归结果的拟合值Xi_hat。第二阶段回归:第二阶段回归:用用Xi_hat取代原有的取代原有的Xi,与原有的外,与原有的外生变量生变量Wi一起进行第二次回归,得到一起进行第二次回归,得到TSLS统计量统计量TSLS。注意:注意:工具变量出现在第一阶段回归,但不出现在工具变量出现在第一阶段回归,但不出现在第二阶段回归。第二阶段回归。第18页,共55页。引入工具变量的个数引入工具变量的个数假设我们有假设我们有n个内生解释变量,引入了个内生解释变量,
11、引入了m个工个工具变量,具变量,n和和m的关系是什么?的关系是什么?n=m 恰好识别恰好识别 nm 不可识别不可识别 只有恰好识别和过度识别才能用只有恰好识别和过度识别才能用IV方法估计。方法估计。第19页,共55页。两阶段最小二乘法的两阶段最小二乘法的stata命令:命令:ivregress 2sls depvar varlist1(varlist2=instlist),r,first其中,其中,“depvar”为被解释变量,为被解释变量,varlist1为外生解释变量,为外生解释变量,varlist2为所有的内生解为所有的内生解释变量集合,释变量集合,instlist为工具变量集合。为工具
12、变量集合。选择项选择项r表示使用异方差稳健的标准误,选表示使用异方差稳健的标准误,选择项择项“first”表示显示第一阶段的回归。表示显示第一阶段的回归。第20页,共55页。工具变量有效性的检验工具变量有效性的检验工具变量相关性工具变量相关性工具变量相关性越强,也就是工具变量能解释越多工具变量相关性越强,也就是工具变量能解释越多的的X变动,则变动,则IV回归中能用的信息就越多,因此利用回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。相关性更强的工具变量得到的估计量也更精确。弱工具变量:弱工具变量:如果虽然如果虽然 但是但是弱工具变量弱工具变量几乎不能解释几乎不能解释X
13、的变动。的变动。(,)0iCov Zi X(,)0iCov Zi X第21页,共55页。弱工具变量检验准则弱工具变量检验准则1.偏偏R2(Sheas partial R2)含义:在第一阶段回归中,在控制外生变量含义:在第一阶段回归中,在控制外生变量 影响的前提下,看其它变量对某内生变量的影响的前提下,看其它变量对某内生变量的解释力,或者说,在第一阶段回归中,剔除解释力,或者说,在第一阶段回归中,剔除掉外生变量的影响。掉外生变量的影响。2.最小特征值统计量最小特征值统计量F:经验上:经验上F应该大于应该大于10。Stata 命令:命令:estat firststage,all forcenonr
14、obust第22页,共55页。3.Cragg-Donald Wald F 统计量统计量 4.Kleibergen-Paap Wald rk F 统计量统计量”Stata命令:命令:ivreg2第23页,共55页。如果存在弱工具变量该怎么办?如果存在弱工具变量该怎么办?1.如果有很多工具变量,有部分强工具变量和部分弱工具如果有很多工具变量,有部分强工具变量和部分弱工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在变量子集。在stata中,可以使用中,可以使用ivreg2命令进行命令进行“冗余检冗余检验验”,以决定选择舍弃哪个工具变
15、量。(直观上,冗余工,以决定选择舍弃哪个工具变量。(直观上,冗余工具变量是那些第一阶段回归中不显著的变量。)具变量是那些第一阶段回归中不显著的变量。)2.如果系数是恰好识别的,则你不能略去弱工具变量。如果系数是恰好识别的,则你不能略去弱工具变量。在这种情况下,有两个选择:在这种情况下,有两个选择:第一个选择第一个选择是寻找其他较强的工具变量。是寻找其他较强的工具变量。(难度较大难度较大)第24页,共55页。第二个选择第二个选择是利用弱工具变量继续进行实证分是利用弱工具变量继续进行实证分析,但采用的方法不再是析,但采用的方法不再是TSLS。而是对弱工。而是对弱工具变量不太敏感的有限信息极大似然法
16、具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,。在大样本下,LIML 与与2SLS是渐近是渐近等价的,但在存在弱工具变量的情况下,等价的,但在存在弱工具变量的情况下,LIML 的小样本性质可能优于的小样本性质可能优于2SLS。LIML 的的 Stata 命令为命令为ivregress liml depvar varlist1(varlist2=instlist)第25页,共55页。工具变量外生性的检验工具变量外生性的检验刚才我们提到:只有刚才我们提到:只有恰好识别恰好识别和和过度识别过度识别才才能用能用IV方法估计。方法估计。一个很重要的命题是:一个很重要的命题是:只有过度识别只
17、有过度识别情况下情况下才能检验工具变量的外生性,而恰好识别情才能检验工具变量的外生性,而恰好识别情况下无法检验。况下无法检验。第26页,共55页。过度识别约束检验过度识别约束检验基本思想:基本思想:假设有一个内生回归变量,两个工具变量且没假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的有包含的外生变量。则你可以计算两个不同的TSLS估计量:其中一个利用第一个工具变量,估计量:其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,但如果两个工具性,这两个估计量不会相同,但如果两个工具变
18、量都是外生的,则这两个估计量往往比较接变量都是外生的,则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不同,近。如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内则你可以得出其中一个或两个工具变量都有内生性问题的结论。生性问题的结论。第27页,共55页。识别标准:识别标准:Sargan 统计量统计量 J统计量统计量C统计量统计量过度识别检验的过度识别检验的 Stata 命令:命令:estat overid第28页,共55页。究竟该用究竟该用 OLS 还是工具变量法还是工具变量法豪斯曼检验豪斯曼检验原假设为:原假设为:H0:所有解释变量均为外生变量:所有解
19、释变量均为外生变量reg y x1 x2est store ols ivregress 2sls y x1(x2=z1 z2)est store iv hausman iv ols,sigmamore第29页,共55页。上述检验的缺点是,它假设在上述检验的缺点是,它假设在H0成立的情况成立的情况下,下,OLS 最有效率。但如果存在异方差,最有效率。但如果存在异方差,OLS 并不最有效率并不最有效率(不是不是 BLUE)。故传统的。故传统的豪斯曼检验不适用于异方差的情形。豪斯曼检验不适用于异方差的情形。此时可以使用杜宾此时可以使用杜宾-吴吴-豪斯曼检验豪斯曼检验(DWH),该检验在异方差的情况下
展开阅读全文