多元回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元回归分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 分析 课件
- 资源描述:
-
1、1复习多元回归分析n大样本性质n模型的函数形式n虚拟变量n异方差n数据问题时间序列模型n基本模型n平稳、弱相关和高度持久n序列相关工具变量和联立方程受限制因变量模型2小样本和大样本性质小样本性质:估计量在样本大小为有限的情况下表现出来的性质。n例如:无偏估计;t、F检验。大样本性质:估计量在样本大小为无限的情况下表现出来的性质。n例如:大数定律;一致估计;LM检验3一致性“一致”指的是当n 时,估计量的分布收敛于系数的真实值在MLR1-MLR5假设下,OLS估计值是一致的(也是无偏的)在无偏性的证明中,我们假设了条件均值为零:E(u|x1,x2,xk)=0证明一致性,我们只要相对较弱的假设,均
2、值为零:E(u)=0;不相关:Cov(xj,u)=0,j=1,2,k 没有这个假设,OLS就是有偏和不一致的4当n 时样本(估计)的分布b1n1n2n3n1 n2 1或F11111122nSSTnSSTknSSRR16拟合程度重要的是不要过于关注调整的R2 而忽略了理论和经济常识本身如果经济理论清楚地预计某个变量应当被包括进来,那么就加入这个变量不要加入影响对所关注的变量进行合理解释的变量;切记多元回归含意之一是控制了其它因素17函数形式我们已经知道一个线性的回归可以用来拟合一些非线性的关系可以用因变量或 自变量的对数形式或者同时用两者的对数形式可以用x的平方可以用x的交叉项但是我们如何知道我
3、们是否在模型设定中采用了正确的函数形式呢?18函数形式(续)首先,要靠经济理论来指导模型的设定考虑如何对模型进行解释究竟是变量x的绝对变化还是百分比的变化(用对数形式)对因变量y产生影响更加合理?因变量对x1的偏导随x1(平方项)还是随x2(交叉项)改变,或者是固定不变?19RESET检验RESET 采用的办法和White检验的特殊形式类似我们采用加入的函数的办法来检验,而不是直接加入x的函数因此,要估计方程 y=b0+b1x1+bkxk+12+13+error 来进行检验H0:1=0,2=0 根据 FF2,n-k-3 或者 LM2220虚拟变量虚拟变量就是取 1 或者 0 的变量例:male
4、(=1 若为男性,0 其它情况),south(=1 若在南方,0 其它情况),等.虚拟变量也叫二元变量21一个独立的虚拟变量考虑一个包括一个连续变量(x)和一个虚拟变量(d)的模型y=b0+0d+b1x+u这可以解释成截距项的变化若 d=0,那么 y=b0+b1x+u若 d=1,那么 y=(b0+0)+b1x+ud=0 的样本是参照组220 0 的例子xy0b0y=(b0+0)+b1xy=b0+b1xslope=b1d=0d=123其它变量与虚拟变量的交叉项也可以考虑虚拟变量 d 和连续变量 x 之间的交叉项 y=b0+1d+b1x+2d*x+u若 d=0,那么 y=b0+b1x+u若 d=1
5、,那么 y=(b0+1)+(b1+2)x+u这里的两种情况可以看成是斜率的变化24yxy=b0+b1xy=(b0+0)+(b1+1)x0 0 且 1 0的例子d=1d=025检验不同组之间的差异为了检验一个回归方程对不同的组是否应该取不同的参数,我们可以检验表示组的虚拟变量及其和所有其他x变量的交叉项的显著性因此可以估计有所有交叉项和没有交叉项两种情况下的模型,然后构造F 统计量,但这种方法不容易把握26Chow 检验也可以仅仅做没有交叉项的回归来构造适当的F统计量如果我们对第一组样本做没有交叉项的回归,得到SSR1,然后再对第二组样本做同样的回归,得到 SSR2再同样对所有样本做没有交叉项的
6、回归,得到 SSR,那么1122121kknSSRSSRSSRSSRSSRF27什么是异方差前面的同方差的假设,隐含着扰动项u的方差条件于解释变量是常数如果这个假设不成立,即对于x的不同的值u的方差不同,那么扰动项就是异方差例如:估计教育的回报率时,能力是不可观察的因素,因此可能的情况是能力的方差随教育程度不同而不同28.x x1x2yf(y|x)异方差的例子x3.E(y|x)=b0+b1x29异方差有什么影响?OLS 估计在没有同方差假设的情况下仍然是无偏和一致的但是在异方差的情况下标准差的估计是有偏的如果标准差的估计有偏我们就不能利用t 统计量或F 统计量或LM 统计量来做检验推论30 稳
7、健的标准差稳健的标准差只有在大样本的情况下才适用,在小样本的情况下用稳健的标准差构造出来的t 统计量的分布与t 分布相差较远,用来做检验是不对的在 Stata 软件中,稳健的标准差可以通过在回归命令中加入“robust”得到31异方差检验实际上我们需要检验 H0:Var(u|x1,x2,xk)=2,也就是H0:E(u2|x1,x2,xk)=E(u2)=2如果假设u2和xj之间是线性关系,我们可以把零假设当成一个线性条件来检验 因此对于 u2=0+1x1+k xk+v;也就是检验 H0:1=2=k=032Breusch-Pagan 检验虽然我们观察不到扰动项,但是我们可以用OLS回归把残差估计出
8、来用得到的残差的平方项对所有的x回归之后,就可以用R2构造F统计量或者LM统计量来进行检验其中F统计量就是软件中报告出来的检验整个回归的显著性的统计量,F=R2/k/(1 R2)/(n k 1),该统计量呈Fk,n k-1分布其中的LM统计量可由LM=nR2得到,该统计量服从2k分布33White 检验Breusch-Pagan检验能检验出任何线性形式的异方差而White检验则能够通过加入所有解释变量的平方项和交叉项来检验非线性形式的异方差检验的方法仍然是利用F统计量和LM统计量来检验xj,xj2和xjxh的联合显著性34White检验的其它形式假设OLS回归的拟合值是所有解释变量x的方程因此
9、2是解释变量的平方项和交叉项的函数,和2可以用作xj,xj2和xjxh的代理变量因此,用残差项对和2做回归,然后用回归结果中的R2来构造F或者LM统计量35加权的最小二乘法虽然我们能够得到OLS估计的稳健的标准差,但是如果我们知道其中异方差的具体形式,就能够得到比OLS更有效的估计基本的思想是将存在异方差的模型转换成同方差的模型,这称为加权的最小二乘法36WLS 小结对WLS使用F检验时,先从不受限制的模型得到权重,然后用这些权重分别对不受限制的模型和受限制的模型作WLS。WLS更有效,但OLS仍然是无偏和一致的。但WLS与OLS的估计由于抽样误差会不一样,但如果两者的差距很大,很有可能是假设
10、MLR1-MLR5不成立。37代理变量如果模型设定的问题是由于某个重要的解释变量没有可用的数据,怎么办?这种情况下,避免遗漏变量偏差的一个办法是用代理变量代理变量必须是和不可观察的变量相关的,如:x3*=0+3x3+v3,其中“*”表不可观察 现在假设我们就用x3代替x3*38滞后变量如果存在遗漏变量又找不到合适的代理变量,怎么办?如果遗漏变量对从前的和现在的y都有影响,那么可能的解决办法是加入一个滞后的被解释变量,来表示遗漏变量的影响。当然,采用这种办法的前提是你认为过去的y和现在的y是有关系的。39被解释变量的测量误差定义测量误差为:e0=y y*因此实际估计的方程为:y=b0+b1x1+
11、bkxk+u+e0什么条件下OLS会得到无偏的估计结果?当e0与xj,u不相关时估计结果是无偏的当E(e0)0时,常数项b0的估计是有偏的虽然在以上条件下,估计是无偏的,但是估计的结果的方差比没有测量误差时要大40解释变量的测量误差定义测量误差为:e1=x1 x1*假设 E(e1)=0,E(y|x1*,x1)=E(y|x1*)实际估计的方程为:y=b0+b1x1+(u b1e1)测量误差对估计结果的影响决定于我们所做的e1与x1的相关性假设 Cov(x1,e1)=0OLS 的估计结果仍然是无偏的,但方差变大41解释变量的测量误差(续)假设Cov(x1*,e1)=0,即所谓的经典的测量误差假设,
12、那么Cov(x1,e1)=E(x1e1)=E(x1*e1)+E(e12)=0+e2X1 与测量误差相关,因此估计是有偏的 22*2*122*2122*2111111111,plimexxexeexexVareuxCovbbbbbbb42解释变量的测量误差(续)注意到估计的偏差是多乘了一个Var(x1*)/Var(x1)因为Var(x1*)/Var(x1)1,估计的偏差的方向为趋于零的方向,该偏差称为减弱偏差多元回归的情况会更加复杂,但大致的结果仍然是经典的度量误差导致减弱偏差43时间序列与横截面时间序列数据有一个时间上的顺序,而横截面数据则没有由于我们面对不再是个人的随机样本,我们须要对原有假
13、设做出一些更改我们的数据变成了一个随机过程的一个实现值44无偏性所需的假设仍然假设一个线性(对参数)模型:yt=b0+b1xt1+.+bkxtk+ut 仍然假设条件均值为零:E(ut|X)=0,t=1,2,n注,这隐含着任何一期的扰动项与所有期的解释变量都不相关45无偏性所需的假设(续)条件均值为零的假设隐含着所有的解释变量x都是外生的(严格外生)一个与横截面中情形更一致的假设是E(ut|xt)=0这个假设说明所有解释变量在当期都是外生变量(同期外生)同期外生性只有在大样本的情况下才足于保证模型一致。小样本的无偏性需要严格外生的假设46无偏性所需的假设(续)还需要假设没有x可以为常数,且不存在
14、完全的线性相关注意,我们没有假设样本是随机抽取的随机抽样的主要结果是每一个ui都是独立的前面的严格外生的假设包含了每一个ui都是独立的47OLS 的无偏性根据以上三个假设条件,在使用时间序列数据时,OLS估计是无偏的因此正如在横截面数据中一样,在适当的假设条件下OLS估计是无偏的遗漏变量偏差可以用与横截面相同的方法来进行分析48OLS估计的方差正如横截面的情况中,计算方差需要同方差的假设我们假设Var(ut|X)=Var(ut)=2从而扰动项的方差独立于所有的解释变量x,且方差为常数随时间不变我们还需要无自相关的假设:Corr(ut,us|X)=0 对于 t s49OLS估计的方差(续)在以上
15、5个假设条件下,OLS回归的方差在时间序列与在横截面数据的情况中是相同的。此外对方差2的估计也是相同的OLS 估计仍然是最优线性无偏估计(BLUE)如果再加上扰动项的正态分布的假设,检验的方法也是相同50时间序列的趋势经济中的时间序列常有一个趋势当两个序列同时都有相同的趋势时,我们不能认为两者之间的关系就是因果关系 常有的情况是两个序列的趋势是由其它不可观察的因素引起的 虽然那些因素是不可观察的,我们应通过直接控制趋势的办法来控制这些因素51时间序列的趋势(续)一种可能性是一个线性的趋势,可以用模型表示为:yt=a0+a1t+et,t=1,2,还可能是指数型的趋势,可以用模型表示为:log(y
展开阅读全文