五章模型的建立与估计中的问题及对策.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《五章模型的建立与估计中的问题及对策.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模型 建立 估计 中的 问题 对策
- 资源描述:
-
1、五章模型的建立与估计中的问题及对策 我们已学到了许多有用的计量经济分析方法,如建立模型、估计参数、假设检验、预测、非线性模型的线性化,用虚拟变量将定性因素引入模型等。可是,我们所使用的最小二乘法,以及由此而得到的OLS估计量令人满意的性质,是根据一组假设条件而得到的。在实践中,如果某些假设条件不能满足,则OLS就不再适用于模型的估计。在这种情况下,分析方法就需要改变。下面列出实践中可能碰到的一些常见问题:l误设定(Misspecification 或specification error)l多重共线性(Multicollinearity)l异方差性(Heteroscedasticity)l自相
2、关(Autocorrelation)本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。第一节 误设定采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:函数形式正确和解释变量选择正确。在实践中,这样一个假设或许从来也不现实。我们可能犯下列三个方面的错误:l 选择错误的函数形式l遗漏有关的解释变量l包括无关的解释变量从而造成所谓的“误设定”问题。一.选择错误的函数形式 这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。因此,我们应当根据实际问题,选择正确的函数
3、形式。我们在前面各章的介绍中采用的函数形式以线性函数为主,上一章介绍了应变量和解释变量都采用对数的双对数模型,下面再介绍几种比较常见的函数形式的模型,为读者的回归实践多提供几种选择方案。这几种模型是:半对数模型 双曲函数模型 多项式回归模型1.半对数模型半对数模型 半对数模型指的是应变量和解释变量中一个为对数形式而另一个为线性的模型。应变量为对数形式的称为对数对数-线性模线性模型型(log-lin model)。解释变量为对数形式的称为线性线性-对数模对数模型型(lin-log model)。我们先介绍前者,其形式如下:对数-线性模型中,斜率的含义是Y的百分比变动,即解释变量X变动一个单位引起
4、的应变量Y的百分比变动。这是因为,利用微分可以得出:tttuXY10ln)1(1ln1dXYdYdXdYYdXYd 这表明,斜率度量的是解释变量X的单位变动所引起的应变量Y的相对变动。将此相对变动乘以100,就得到Y的百分比变动,或者说得到Y的增长率。由于对数-线性模型中斜率系数的这一含义,因而也叫增长模型增长模型(growth model)。增长模型通常用于测度所关心的经济变量(如GDP)的增长率。例如,我们可以通过估计下面的半对数模型 得到一国GDP的年增长率的估计值,这里t为时间趋势变量。ttutGDP10)ln(线性-对数模型的形式如下:与前面类似,我们可用微分得到 因此 这表明ttt
5、uXYln10XdXdY11XdXdYdXdYX1XXYXY的相对变动的绝对变动1XXY1 上式表明,Y的绝对变动量等于 乘以X的相对变动量。因此,线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。12.双曲函数模型双曲函数模型 双曲函数模型的形式为:不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化。双曲函数模型的特点是,当X趋向无穷时,Y趋向 ,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y=)。双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。tttuXY110003.多项式回归模型多项式回归模型 多项式回归模型通
6、常用于描述生产成本函数,其一般形式为:其中Y表示总成本,X表示产出,P为多项式的阶数,一般不超过四阶。多项式回归模型中,解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型。iPiPiiiuXXXY.2210二.遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量。三.包括无关的解释变量 模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。注 有关上述两点结论的说明请参见教科书P101-102。四.解决解释变量误设定问题的原则 在模型设定中的一般原则是尽量不漏掉有关
7、的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。尽管如此,还是有一些有助于我们进行判断的准则可用,它们是:选择解释变量的四条准则选择解释变量的四条准则 1.理论:从理论上看,该变量是否应该作为解释变量包括 在方程中?2.t检验:该变量的系数估计值是否显著?3.:该变量加进方程中后,是否增大?4.偏倚:该变量加进方程中后,其它变量的系数估计值是 否显著变化?2R2R如果对四个问题的回答
8、都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”,则该变量是无关变量,可以安全地从方程中删掉它。这是两种容易决策的情形。但根据以上准则判断并不总是这么简单。在很多情况下,这四项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后,增大,但该变量不显著。2R 在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量
9、。五.检验误设定的RESET方法 上面给出了选择解释变量的四条准则。可是,有时这些准则不能提供足够的信息使研究人员确信其设定是最恰当的,在这种情况下,可考虑使用一些更正规的检验方法来比较不同估计方程的性质。这类方法相当多,这里就不一一列出,仅介绍拉姆齐(J.B.Ramsey)的回归设定误差检验法(RESET法)。RESET检验法的思路 RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过F检验,表明它们改善
10、了原方程的拟合状况,则我们有理由说原方程存在误设定问题。等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代表它们。432,YYY和432,YYY和RESET检验法的步骤 拉姆齐RESET检验的具体步骤是:(1)用OLS法估计要检验的方程,得到 (2)由上一步得到的值 (i=1,2,n),计算 ,然后用OLS法估计:(3)用F检验比较两个方程的拟合情况(类似于上一章中联合假设检验采用的方法),如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论。使用的检验统计量为:iiiXXY22110432,YYY和iYiiiiiiiuY
11、YYXXY45342322110)1/(/)(knRSSMRSSRSSFM其中:RSSM为第一步中回归(有约束回归)的残差平方和,RSS为第二步中回归(无约束回归)的残差平方和,M为约束条件的个数,这里是M=3。应该指出的是,拉姆齐RESET检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定,或者说,不能告诉我们正确的模型是什么。但该方法毕竟能给出模型误设定的信号,以便我们去进一步查找问题。另一方面,如果模型设定正确,RESET检验使我们能够排除误设定的存在,转而去查找其它方面的问题。第二节 多重共线性 应用OLS法的一个假设条件是;矩阵X的秩=K+110作为存在严重多重共线性的标准
12、,特别在解释变量多的情形应当如此。需要指出的是,所有VIF值都低,并不能排除严重多重共线性的存在,这与使用相关系数矩阵检验的情况相似。5)(iVIF 四 解决多重共线性的方法 思路;加入额外信息。具体方法有以下几种:增加数据 对模型施加某些约束条件 删除一个或几个共线变量 将模型适当变形1增加数据 多重共线性实质上是数据问题,因此,增加数据就有可能消除或减缓多重共线性,具体方法包括增加观测值、利用不同的数据集或采用新的样本。例:需求函数Yt=1+2Xt+3Pt+ut 在时间序列数据中,收入(X)和价格(P)往往是高度相关的,用时间序列数据估计往往会产生多重共线性。然而,在横截面数据中,则不存在
13、这个问题,因为某个特定时点P为常数。如果取一横截面样本(如从5000个家庭取得的数据),则可用来估计 Yi=1+2Xi+ui 然后将得到的估计值 作为一个约束条件(2=)施加于时间序列数据的回归计算中,即估计 Yt-Xt =1+3Pt+ut,得到 ,。222132对模型施加某些约束条件 在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差,如在CobbDouglas生产函数中加进规模效益不变的约束,可解决资本和劳动的高度相关而引起的多重共线性问题。3删除一个或几个共线变量 这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删
14、除哪些变量,可根据假设检验的结果确定。应注意的是,这种做法可能会使得到的系数估计量产生偏倚,因而需要权衡利弊。4将模型适当变形例1某商品的需求函数为:其中:Q=需求量,X=收入,P=该商品的价格,P*=替代商品的价格 在实际数据中,P和P*往往呈同方向变动,它们之间高度相关,模型存在多重共线性。如果我们仅要求在知道两种商品的相对价格变动时,对需求量进行预测,则可将需求函数变为:就可以解决多重共线性问题。u*3210PPXQvPPXQ)(*321例2有滞后变量的情形 Yt=1+2Xt+3 Xt-1+ut 一般而言,Xt和Xt 1往往高度相关,将模型变换为:Yt=1+2(Xt-Xt 1)+3Xt-
15、1+ut 其中3=3+2 经验表明:Xt和Xt 1的相关程度要远远小于和Xt和Xt 1的相关程度,因而这种变换有可能消除或减缓多重共线性。5主成分法 可将共线变量组合在一起形成一个综合指数(变量),用它来代表这组变量。构造综合指数的最常用方法是主成分法。主成分法的计算相当复杂,这里不做介绍。同学们需要了解的是,主成分的特点是,各主成分之间互不相关,并且,用很少几个主成分就可以解释全部X变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。五.处理多重共线性问题的原则1.多重共线性是普遍存在的,轻微的多重共线性问题可
16、不 采取措施。3.如果模型仅用于预测,则只要拟合好,可不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不 影响预测结果。2.严重的多重共线性问题,一般可根据经验或通过分析回归结果发现。如影响系数的符号,重要的解释变量t 值很低。要根据不同情况采取必要措施。第三节 异方差性 回顾我们应用OLS法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:(1)E(ut)=0,t=1,2,n.扰动项均值为0(2)Cov(ui,uj)=E(uiuj)=0,ij.扰动项相互独立(3)Var(ut)=E(ut)=2,t=1,2,n.常数方差(4)ut N(0,2).正态性 对于(1),我们可论证其
17、合理性。而第(4)条,也没有多大问题。大样本即可假定扰动项服从正态分布。而对于(2),(3)两条,则无法论证其合理性。实际问题中,这两条不成立的情况比比皆是。下面即将讨论它们不成立的情况,即异方差性和自相关的情形。一 异方差性及其后果1定义 若Var(ut)=常数的假设不成立,即 Var(ut)=常数,则称扰动项具有异方差性。22t2 什么情况下可能发生异方差性问题?解释变量取值变动幅度大时,常数方差的假设往往难以成立。异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时间跨度过大。例:Yi=+Xi+ui 其中:Y=指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配
18、收入 设X的N个观测值取自一个家庭可支配收入的横截面样本。某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入。不难设想,低收入家庭的消费支出不大可能离开他们的均值E(Y)过远,太高无法支持,太低则消费将处于维持生存的水平之下。因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差。而高收入家庭则没有这种限制,其扰动项可能有大得多的方差。这就意味着异方差性。3异方差性的后果(1)参数估计量不再具有最小方差的性质 异方差性不破坏OLS估计量的无偏性,但不再是有效的。事实上,异方差性的存在导致OLS估计量既不是有效的,也不具有渐近有效性。(2)系数的显著性检验失去意义 更为严重的
19、是,在异方差性的情况下,矩阵主对角元素不再是OLS估计量方差的无偏估计量,从而导致系数的置信区间和假设检验结果不可信赖。例如在双变量模型中,如果 倾向于低估 的真实方差,则置信区间可能要比实际的窄,给我们一个错误信息,好象得到 的点预测值很精确。22/x21)(XX二 异方差性的检验 异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性。常用的检验方法有:斯皮尔曼等级相关检验法(Spearman Rank Relation test)戈德弗尔德匡特检验法(Goldfeld Quandt test)格里瑟检验法(Glesjer test)帕克检验法(Park test)怀特检验法 (W
20、hites General Heteroscedasticity test)1斯皮尔曼等级相关检验法 思路:将异方差性与扰动项u和某个解释变量X之间的相关程度挂钩(即 与 Xt 的大小有关),从而将对异方差性的研究转化为对ut与Xt的相关程度的研究。由于扰动项无法观测,因而用残差代替之,转化为对et与Xt的相关程度的研究,若et与Xt高度相关,则可推断异方差性存在。在此无法用相关系数来检验,因为et与Xt的相关系数恒等于0:因而改用Xt和et的等级相关系数检验et和Xt的相关程度。2t0)()()()()(2222eeXXxeeXeXeeXXeeXXrtttt等级相关系数的计算步骤(1)将两变
21、量的相应观测值分别按升序(或降序)排序,所得到的序号即为等级。(2)计算两变量各观测值相应的等级之差dt.(3)计算等级相关系数 )12(261nntdr例:等级相关系数的计算 假设我们有Xt和et如下:Xt 25,40,52,58,65 et 1.6,-2.9,-10.7,14.8,5.7我们有 et 1.6,2.9,10.7,14.8,5.7 Xt的等级 et的等级 dt 1 1 0 2 2 0 3 4 -1 4 5 -1 5 3 2 r=1 (6*6)/(5*24)=1-0.3=0.7 计算出等级相关系数后,就可判断异方差性是否存在。若相关系数绝对值高,则存在异方差性。对于多个解释变量的
22、情况,可分别计算et与各解释变量的等级相关系数进行检验。2.戈德弗尔德匡特检验法基本思路:假定 随Yt的数值大小变动。检验步骤:(1)将数据分为三组:小Yt值组,中Yt值组,大Yt值组 (数据项大致相等)(2)对小Yt值组估计模型,给出 (3)对大Yt值组估计模型,给出 2t11221kne13223kne (4)H0:H1:(或 )检验统计量为F0 =F(n3-k-1,n1-k-1)若F0Fc,则拒绝H0,存在异方差性。例:S=+Y+u 其中:S=储蓄 Y=收入 设 195160年,=0.01625 197079年,=0.9725 F0=0.9725/0.01625=59.9 查表得:d.f
23、.为(8,8)时,5%Fc=3.44 F0Fc 因而拒绝H0。结论:存在异方差性。23212321232121232123三 广义最小二乘法1消除异方差性的思路 基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用OLS法进行估计。对于模型 Yt=0+1X1t+k Xkt+ut (1)若扰动项满足 E(ut)=0,E(uiuj)=0,ij,但 E(ut2)=常数.也就是说,该模型只有同方差性这一条件不满足,则只要能将具有异方差性的扰动项的方差表示成如下形式:Var(ut)=,t=1,2,n其中 为一未知常数,表示一组已知数值,则用t去除模型各项,得变换模型:2t222tt22t (2
展开阅读全文