《计量经济学》第十六章:综列数据方法及其应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《计量经济学》第十六章:综列数据方法及其应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量经济学 计量 经济学 第十六 数据 方法 及其 应用 课件
- 资源描述:
-
1、第十六章第十六章综列数据方法及其应用16.1综列数据简介 1.跨越时间的两种横截面数据集 独立混合横截面:是在不同时点(经常但并不一定是不同的年份)从一个大总体里进行随机抽样的结果。从统计学的观点看,这些数据集有一个重要的特点:它们都是由独立抽取的观测值构成的。综列数据(panel data)集:是指同一截面单元集上的重复观察值(repeated observations on the same set of cross-section units)一个独立混合横截面(independently pooled cross section)和单一个随机样本的差异在于,在不同时点上对总体进行抽样很
2、可能导致观测点(即观测结果)不是同分布(identically distributed)的情形。综列数据集虽然兼有横截面和时间序列的因次,但在一些重要方面却不同于独立混合横截面。如我们要在不同时间跟踪(或试图跟踪)相同的一些个人、家庭、厂家、城市、省份或别的什么单元,例如,在一个时点上,从某总体中随机地收集了一些人的个人工资、工作小时、学历和其他因素的一个综列数据集,那么,在以后的若干个时点上,要对同样的这些人反复采访,以便得到同样一群人在不同年份里的工资、工作小时、学历等数据。现在综列数据正越来越多的被经济研究所使用。一些著名的综列数据组有:(1)动态收入综列研究(动态收入综列研究(PSID
3、)。由密歇根大学的社会研究所于1968年开始主持,研究所每年收集大约5000个家庭的各种社会经济和人口统计变量。(2)收入和参与项目调查(收入和参与项目调查(SIPP)。这个类似PSID的调查由商业部人口普查局主持,每年将对被访问者就其经济状况进行四次调查。还有许多其他的调查被不同的政府机构所采用。2.2.综列数据类型综列数据类型 平衡综列数据平衡综列数据(balanced panel):对N个横截面单元(个人、厂商、城市等等)的每一个都有同样的T期数据。非平衡综列数据非平衡综列数据(unbalanced panel):如果各个综列单元的观测次数不相同时,我们就称之为非平衡综列非平衡综列。3.
4、3.综列数据的综列数据的优势优势 既然综列数据与一定时期内的个人、企业、州、国家等有关,那么这些单元中一定存在着差异性。通过时间序列和横截面数据的混合,综列数据提供“更加有价值的数据,变量之间增加了多变性和减少了共线性,并且提高了自由度和有效性。”通过对重复横截面数据的研究,综列数据更适用于变变化中的动态化中的动态的研究。综列数据能够更好的检测和度量单纯使用横截面数据或时间序列数据所无法观测到的影响。综列数据能够使我们对更加复杂的行为模型进行研究。通过使数据适用于数千个单元,综列数据能够将偏差降到最低,而这种偏差可能是由于我们将个人或企业情况加总到更大的集合体中所产生的。)2(;)1(;212
5、1212121222121211121nnniTiiikiTiTiTkiiikiiiiiTiiiuuuuxxxXyyyyuuuuxxxxxxxxxXyyyy)3(uXy 4.4.综列数据模型综列数据模型yit=截面单元i在时间t的因变量的值;i=1,n;t=1,Txjit=单元i在时间t的第j个解释变量的值;假设:有k个解释变量,即j=1,k;有n个横截面,即i=1,n;时间指标t=1,T记第i个横截面的数据为式中y为nT维,x为nTk维,u为nT维。5.5.综列数据:一个解释性的例子综列数据:一个解释性的例子 格伦费尔德(Y.Grunfeld)投资理论:企业的实际价值(X2)和实际资本存量(
6、X3)是如何决定实际总投资(Y)。横截面单元:四个公司,即通用电气(GE)、通用汽车(GM)、美国钢铁(US)以及威斯汀豪斯电气公司。时间区间:20年,19351954年。样本总数:80。一个先验的结论是Y与X2和X3正相关。20,2,1;4,3,2,1)5(33221tiuXXYitititit 假设X是非随机的,而且误差项遵从经典假设,即uN(0,2)(1)所有系数都不随时间和个体而变化所有系数都不随时间和个体而变化 最简单的方法(也可能是自然的方法)就是不考虑和时间的混合数据,只是对通常的OLS回归进行估计。即将每个公司的20次观测值逐一堆置,于是模型(5)中的每个变量总共可以得到80次
7、观测值。OLS结果如下:se=(29.6124)(0.0137)(0.0493)t=(2.1376)(8.0188)(6.1545)(6)R2=0.7565 D-W=0.2187 n=80 df=77323034.01101.03041.63XXY(2)斜率系数不变而截距随个体而变化:固定效斜率系数不变而截距随个体而变化:固定效应或最小二乘虚拟变量(应或最小二乘虚拟变量(LSDV)回归模型)回归模型 将每个公司或每个横截面单元的个体性考虑进来的一种方法是,假定截距随每个公司变化但斜率系数仍然不变。为了看到这一点,我们将模型(5)写成:注意到我们将下标i加到了截距项上,这就表明四个公司的截距是不
8、同的。这种差异可能是由于每个公司的特性所引起的,比如管理者风格或管理者哲学。模型(7)就是为人熟知的固定效应固定效应(回归)模型(FEMFEM)。)7(33221itititiituXXY 虚拟变量方法(7)式可以写成:其中,如果观测值属于GM,则D2i=1,否则为0;如果观测值属于US,则D3i=1,否则为0;如果观测值属于威斯汀豪斯,则D4i=1,否则为0。由于我们用的是四个公司,因此只需用3个虚拟变量。换言之,1代表GE的截距,而2、3、4以及级差截距系数就能够说明GM、US和威斯汀豪斯的截距相对于GE的截距有多大的不同。模型(模型(8 8)称为最小二乘虚拟变量()称为最小二乘虚拟变量(
9、LSDVLSDV)模型)模型。)8(33224433221itititiiiituXXDDDY (3)斜率系数不变而截距随个体和时间而变化斜率系数不变而截距随个体和时间而变化 为了考虑这种可能性,我们将(6)和(10)合并,如下所示:)11(53.36353322192104321itititWESTUSGMituXXDUMDUMDUMDDDYiii (4)所有系数随个体而变化所有系数随个体而变化 这里,我们假定所有个体单元或横截面单元的截距和斜率系数是不同的。也就是说,GE、GM、US和WEST的投资函数都不相同。我们可以容易的将LSDV模型扩展来考虑这种情形。表示级差斜率系数,正如2、3和
10、4表示级差截距。如果一个或多个系数具有统计显著性,这就是告诉我们一个或多个斜率系数与基准组不同。例如2和1具有统计显著性,在这种情况下,(2+1)就给出了通用汽车的X2的斜率系数值。这表明对于GM,X2的斜率系数与通用电气这个比较公司是有差异的。若所有的级差截距和所有的级差斜率系数都具有统计显著性,我们就可以得出这样一个结论,即通用汽车、美国钢铁和威斯汀豪斯的投资函数都是有别于通用电气的。如果事实确实如此,那么估计混合回归模型(6)就几乎没有意义了。)12()()()()()()(34624533423332222133224433221ititiitiitiitiitiitiititiiii
展开阅读全文