第十章 广义矩法(GMM).doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十章 广义矩法(GMM).doc》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十章 广义矩法GMM 第十 广义 GMM
- 资源描述:
-
1、1 第十章第十章广义矩法(广义矩法(GMM) 当前 GMM 流行的原因有二: 1GMM 包括许多常用的估计量,并且为比较和评价它们提供了有用的框 架。 2相对其它估计量来说,GMM 提供了一种“简单”的备选方法,特别是 当最大似然估计量难以写出时。 然而,在计量经济学中(如同在生活中一样) ,没有免费的午餐,获得这些 特色需付出代价。 首先,GMM 是大样本估计量。也就是说,只有当样本很大时,才有可能得 到它的良好性质。典型地说,GMM 估计量在大样本中才会渐近有效。而在有限 样本中是很少看到有效的。其次,这些估计量往往需要编写少量程序来实施,尽 管要做到这些,只需稍动脑筋,就能从不明显含有
2、GMM 估计程序的标准统计软 件包里编排出来。 在经济中,有许多这样的情况,经济理论只给出了数据生成的部分信息,密 度函数却不知道。 例如,需求函数 uIpfD),(6.1 需求量是价格与收入的函数,但也受个人偏好的影响,用扰动项u表示个人偏好 的差异,显然u的分布不知道。 知道的信息仅为),( iii IPD, i D的产生过程取决于 i 的分布,写出 i u的分布 很困难,但是能够作一些假定,而且这些假定与经济理论和现实都不相冲突: 0)(PuE即表明偏好与价格无关6.2 0)(IuE偏好与个人收入无关6.3 0)(uE这很容易做到,也合乎情理6.4 具体地, iiiiii uxuPID
3、210 6.5 我们清楚,OLS 估计并没有从这些矩条件出发,而是从残差平方和最小估计 出参数,即 2 min i u。广义矩法(GMM)方法是从上面三个矩条件出发估计出 2 参数。 1GMM 的思想 将 u 代入理论矩条件,有 )()() (0)( 1 xDExxExxEExDxxDE 6.6 三个矩条件并不需要知道数据 i D的生成过程,确切地说,并不需知道 i u的分 布。但是问题是,上面三个理论关系并不能进行实际计算,得出结果,因为计算 期望值仍需要知道随机变量的分布。 但是,我们可以利用“逼近”的思想,即样本均值收敛于理论均值 iiii ii N i i Dxxx xDx N uxE
4、 1 1 ) ( 0) ( 1 0)( 可以证明样本均值是期望的一致性估计。从 的表达式,可见 OLS 方法是 GMM 的一个特例。 再考察工具变量法。 若0)(xuE, OLS 估计得不到一致性估计量。 但能够找到工具 Z, 有0)(uZE, 于是 iiii DZxZ 1 )( 6.7 是的一致性估计量,在此例中, 矩:)(),(xDZxDZM6.8 理论矩条件. 0),(xDZME6.9 推广到一般的情形。 一般的模型中,用 Z 表示我们关注的数据,有 ),(xYZ 6.10 ),(ZM是列向量) 1(m函数,形式已知,),(ZM的表达式对于是可以知 道的,并满足下面的矩约束: 0),(Z
5、ME6.11 任务是去估计列向量 )1( k )(km ,即矩条件(约束)不少于待估参数的个 数。 3 假定0),(ZME,在其值处成立。用样本均值代替期望值: N i i ZM N 1 0) ,( 1 若km 如果km ,则找不到 使 N i i ZM N 1 . 0) ,( 1 引入一个距离来度量) ,(ZM向量与零之间的距离。对于任一个正交矩阵, 有: ),( 1 ),( 1 minarg 11 i N i i N i ZM N ZM N 6.12 这就是 GMM 方法的思想。 10.1矩法矩法 一个有用的起点是所谓的矩法(MOM) ,对此,我们稍后将做一般阐述。本 书的很多内容都集中于
6、讨论矩的问题。尽管你可能还没意识到这个事实,我们将 把总体矩简单地定义为一个随机变量 x 的某个连续函数 g 的数学期望: )(xgE 最常讨论的矩是均值 1 ,其中)(g仅仅是一个恒等函数 )( 1 xE 传统上,MOM 考虑 x 的乘幂。均值 1 有时称为一阶矩,而 )( 2 2 xE 有时称作二阶非中心矩 22 )()()var(xExEx(10.1) 2 12 (10.2) 按照习惯做法,我们将矩的函数,如)var(x也称为矩。 )( 1 xg n (10.3) 类似于均值的样本矩就是: x n 1 1(10.4) 类似地,相当于总体二阶矩的样本矩为: 2 1 1 x n (10.5)
7、 4 现在,我们已经定义了总体矩和样本矩,那么 MOM 是什么呢?MOM 无非是指 下面的一种想法: 为了估计总体矩(或总体矩的一个函数) ,只需使用相应的样本矩(或样本矩的函数) 。 在我们说明为什么这是个好的想法之前,让我们用一个简单的例子来阐述 MOM 估计方法。假如我们想要估计 x 的方差。MOM 的思路是,将(10.1)中 的总体矩用相应的样本矩去代替。于是,方差的 MOM 估计量无非是 2 2 11 )var( x n x n x(10.6) 稍加整理就可以看出,这个估计量和常用的方差估计量相似: 2 2 11 )var( x n x n x(10.7) 2 )( 1 xx n (
8、10.8) 2 )( 1 1 xx n (10.9) 其中(10.9)式就是我们常用的方差的(无偏)估计。另一方面,随着样本增大, 这两个估计量之差趋于零,即:MOM 估计量是一致性的。 或者,我们从总体方差的惯用定义开始,然后直接代之以相应样本矩;即总 体方差是 2 )()var(xExEx(10.10) 样本矩就是 2 )( v 1 xx n xar (10.11) 这里我们用样本的x代替方括号中的xE。下面我们将证明,MOM 原理除了具 有直观性外,也给了了具有良好的大样本性质的估计量。 10.2OLS 作为一个矩问题作为一个矩问题 GMM 的有用性在于:在很多的估计实践中,人们所感兴趣
9、的只是关于矩的 一个函数。为了说明这一点,让我们从一个简单的线性回归着手: Xy(10.12) 其中服从), 0( 2 Q分布,Q 表示某种分布(不一定是正态的) 。的均值于 0,方差为 2 。并且 X 是)(kn矩阵。再假定模型设定正确。于是 0)(XE(10.13) 如何进一步得到的估计量似乎并不明显。但是注意,在总体中 5 0)( XyXE(10.14) MOM 原理是说用样本类似物代替所说矩条件或正交条件的(10.14)式的左 边部分。 )( 1 XyX n (10.15) MOM 程序表明的估计是方程 0) ( 1 XyX n (10.16) 的解。改写(10.16)式,我们看出的
10、MOM 估计为 yXXX MOM )( 1 (10.17) 而且这也恰恰是的 OLS 估计。 10.3工具变量作为一个矩问题工具变量作为一个矩问题 现在我们考虑一个稍难一些的问题。考虑下面的模型: 11 xy(10.18) 这里我们怀疑0)( 1 xE,为使问题清楚,且设 1 x是1n向量。如果情况确实 如此,OLS 就不是一致性的了。正如我们从工具变量的讨论中知道的,一种办 法是找出一些工具变量 Z,它们与 1 x相关而与不相关;即0)(ZE。为了详细 说明这一点,这里有几个例子。 假设y是每小时的工资; 1 x表示退伍军人身份,工具变量 Z 指出生月日。待 检验的假设是:退伍人员是否享有正
11、的差别待遇。也就是说,给定一组与劳动生 产率相关的特性,退伍军人得到的工资要高于非退伍军人。由使用 OLS 而引起 的一个潜在的问题是,在计量经济学家所不能观测的方面,退伍军人和非退伍军 人有所差别。因此,0)( 1 xE,在越南战争中,应征入伍的人是根据他们的出 生日期随机选择的(这个程序称为摸彩入伍) 。因此,对那些在战争时期到了应 征年龄的人来说,他的出生日期就和他成为一名退伍军人的可能性直接相关(但 可设想与工资无关) 。在本例中,出生年月也许是合适的工具变量。 假设y是公司雇佣人数的对数, 1 x是合同规定的工资。有人只想估计劳动的 需求曲线,但问题是雇佣人数和工资是供给和需求共同变
12、化的产物。因此, 0)( 1 xE。由于合同工资事前商定,一个可能的工具变量是非预期通货膨胀。 根据定义,非预期通货膨胀在合同签订时对工会和厂商来说都是未知的,所以它 改变了实际工资。例如,如果通货膨胀出人意料地高,它将降低实际工资,从而 6 雇主会下移他们的劳动力需求曲线。 假定我们已经找到了两个工具变量,用 21,z z表示,再把常数 1 作为其自身的 工具变量包括进来。将它们用矩阵形式表示为 1 1 21 1 zzZ xX 可方便地将模型的参数也进行分块,这就是 1 这个问题的正交性条件是00)(ZE,因而前面的讨论告诉我们,一个优良 的估计将是令样本矩为 0,即 0) ( 1 XyZ
13、n (10.19) 给定我们的 OLS 例子,可以用 yZXZ)( 1 (10.20) 估计出 。但是注意, )(XZ是一个)23( 矩阵,因此它是不可求逆的。当然, 如果模型正确,则对总体来说,方程(10.19)左边的数学期望将等于 0,但是在 一个给定的样本中,这个结论一般不成立。 “问题”是上述矩约束通过) ( )/1 ( XyZn的每一行对唯有的两个参数( 和 1 )各施加了一个约束条件,总共施加了三个约束条件。在这种构架下,可以 有几种选择。第一,可以去掉一个方程,也就是去掉一个工具变量。第二,类似 于最小二乘法,在计算时对各个条件的离差均同等对待,务使离差平方和最小。 第三,可以根
14、据每个方程估计的准确程序(由方差度量) ,对方程给予不同的对 待。 通常第一种想法不是最优的(舍弃信息的做法很少会是最优的) 。第二种想 法可以用类似于最小二乘的方法进行求解,即最小化关于 的下式 ) ( 1 ) ( 1 3 XyZ n IXyZ n (10.21) 其中 3 I是一个)33( 的恒等矩阵。因此,这个程序得到了的一致估计,尽管在 这一类估计中,它并不典型地有效。根据汉森(1982 年)的一个结果,这因由 0)(ZE定义的的最优估计量是第三种类型,即 ) ( 1 ) ( 1 min 1 XyZ n VXyZ n (10.22) 其中 1 V是 1 )(/1(var( Zn的一致估
15、计。 在这个公式中, 对估计准确性较差 (方 差较大)的约束条件做的加权比对估计准确度较高(方差较小)的约束条件要小 7 些。在上一种情形中,GMM 估计量其实和我们所熟悉的一个估计量很相似。事 实上,当误差是同方差性和序列不相关时, (10.22)式就变成 2SLS(两阶段最 小二乘法) 。 证明这一点是有指导意义的。因为在最小化一个二次型时,我们需要推导对 的一阶条件,从而得到 0) ( )( 1 XZyZVZX 0 )( )( 11 XZVZXyZVZX )() ( 111 yZVZXXZVZX(10.23) 在误差齐性且序列不相关时,MOM 原理表明 1 V的一个优良估计量不外是 12
16、2 )/( Z Zn。 (学生们应能证明这个结论。 ) 假定可以得到 2 的一个估计,我们对(10.23)式中的项重新整理,得 )()( 111 yZZZZXXZZZZX (10.24) 由观察可知,它恰好就是 2SLS 估计量。从这种意义上讲,2SLS 是工具变量的 特例,而工具变量又是 GMM 的特例。 10.4GMM 和正交性条件和正交性条件 现在我们要转向对 GMM 估计量做更细致的分析。其要义为: 1 “理论”或先验信息给出关于一个总体正交性条件的论断,这个正交性条 件通常表达为0),( XygE,其中)(g是数据),(Xy和参数 的某个连续函 数。 2我们构造对应于总体正交性条件的
17、样本类似物)( m,并对求下式的最 小值: ) ,() ,(XymWXym (10.25) 这里W的最佳选择,如同第 6 章所讨论的怀特协主差矩阵中那样,是 1 )(var m的 一致估计,或如同在时间序列情形中那样,是适当的纽威魏斯特 (Newey-West)协方差矩阵。 3如果最优的W已经选出,则(10.25)式中二次型的最小值渐近服从 2 分 布,其自由度是矩条件的个数R与矩条件成立的零假设下参数的个数k之差。这 个结论非常有用,尤其是对类似于(线性或非线性的)2SLS 或 3SLS 的问题来 说。 第一点所说的,正交性条件非常重要。再次考虑简单的 OLS 模型: 8 Xy(10.26)
18、 然而一个合理的问题是: 需要有多少个变量才足以获得可靠的估计?这个问题并 不容易回答,但是对于大样本,GMM 方法清楚地告诉我们需要满足哪些条件。 尤其是当误差项有 0 均值时,我们可以放弃正态性条件。但是更重要的是矩 条件0)(XE所施加的约束。为了弄清楚它的含义,不妨考虑最经典的估计 设计:对照实验。假如我们找到了一种帮助戒烟的新处理。我们收集一个含有 nm2个吸烟者的样本,并将处理T随机地分派给样本的一半,另一半样本则接 受一种安慰剂即看似治疗而实无疗效的东西。经典的实验设计告诉我们,对 疗效的一个良好的估计,是在实验结束时比较两个组中吸烟人数的比例,或 ct yy 治疗效果 这 里
19、的c和t分 别 指 安 慰 ( 对 照 ) 组 和 处 理 组 , 且 n j m nj c j ct j t ynyyny 11 )/1 (,)/1 (。显然,我们可将它表示为一个简单的 OLS 回归: xy (10.27) 其中:x是一个虚拟变量,当主体接受处理时,x值为 1;当主体只得到安慰剂 时,x值为 0。类似地,y也是一个标示变量,当主体被治愈时,它取值为 1,否 则值为 0。证明这个例子中的的估计由 ct OLS yy 给出,这个问题当然不满足前面章节中所引入关于标准 OLS 模型的相当严格的 条件。误差当然不是正态的。 (只取四个值:,1,或1) 。 并且,除了治疗,当然还有其
20、他决定吸烟的因素。那么,难道我们对经典实验设 计的信任是一种误解吗?回答是,不。因为即使不是所有有关的变量都包含在模 型之中,经典实验设计能确保这些有关变量和我们右边的变量x不相关。换句话 说 0)( x E 这里的可理解为包含了具有潜在相关但实际上并未被包含在模型中的那些变 量。 我们如此关心随机分派的原因,正是因为将处理随机地分派给主体保证了正 交性条件成立。 为了更清楚地理解这一点,令真实模型为 zxy (10.28) 这里所有的变量都同前,z是某个变量如“抽烟年数” ,所以不妨假定0。如 果令 z ,经典实验设计就等同于做下面的回归 9 xy (10.29) 突出的问题是0)( x E
21、是否成立。 这是评估)0|() 1|(xExE 是否成立的 充分条件,当等式成立时,正交性条件也就成立。如果假定是随机噪声,这就 等价于问)0|() 1|(xzExzE是否成立。即,平均而言,接受处理的人和接 受安慰剂的人是否有相同的烟龄?由于随机方案的本质在于接受或不接受处理 的组之间不存在系统性差异,我们认为对一个设计良好的实验来说,正交性条件 是满足的,从而是无偏的。 假如我们觉得实验做得不够正确,有没有办法来检验x是否真的和误差不相 关呢?在这个简单例子中,不存在这样的检验,因为通过令 x1 X而得到疗 效的估计的样本矩条件 0) ( 1 XyX n 只有一个解,它恰好使得样本矩为 0
22、。换句话说,就是没有可检验的过度识别约 束条件。很快我们将看到,2SLS 的一个优点在于它使我们有可能来检验这样的 约束条件。 10.5GMM 估计量的分布估计量的分布 在转向一些实际应用之前,让我们来推导 GMM 估计量的分布。这个讨论很 有启发性。 假如我们有一个定义良好的矩条件或正交性条件,其表达式: 0),( 0 XygE(10.30) 其中Xy,表示数据, 0 表示使得数学期望为 0 的一组参数的值。然后我们收集 一个随机样本。对一个给定的样本,GMM 估计量不外是下式对参数 求最小值 得到的解 : ) ,() ,(min XymWXym n (10.31) 其中m),(Xy n n
23、 1 )/1 (g),( ii Xy,W的下标表示它可以是数据的函数。 并假定 n W正定、对称,且依概率收敛于某个仍然对称、正定的矩阵W。只要在 极限中,参数 0 的真实值使(10.31)的值最小,且适当的正则性条件成立,则 由(10.31)得到的估计量就是一致性的。 通过解一阶条件: 10 0) ,( ) ,( XymW Xym n (10.32) 得到。将一阶导数矩阵记为/mG,由于使(10.31)式最小而得到的估计 量是一致性的,所以) ( G依概率收敛于)( 0 G。我们已经假定 n W依概率收敛于 W,所以 WGWGp n )() (lim 0 (10.33) 的分布可以由(10.
24、32)式的一阶条件,在其值 0 的邻域里取) ( g的泰勒 级数迫近而得到。给定某些正则性条件,可以证明 的分布为 )()( ,( 11 0 WGGWGWGWGGN (10.34) 其中,)()( 00 ggE , 或者由于0),( 0 XygE, 它不外是矩条件的方差。 汉森 (1982) 证明W的最优选择就是 11 00 )()( ggE的异方差 (及自相关) 一致性估计。给定一致性估计 ,就可以得到一个估计值 1 。在这个最优选择 为 n W的特例中, (10.34)变为: )( ,( 11 0 GN (10.35) 学生们可以证实,W的任何其他选择都将使得夫方差矩阵比最优选择的要多出
展开阅读全文