面板数据模型经典课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《面板数据模型经典课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据模型 经典 课件
- 资源描述:
-
1、图11.1.1 面板数据示意图 例如例如1990-2000年年30个省份的农业总产值数据。固定在某一年份上,它个省份的农业总产值数据。固定在某一年份上,它是由是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的年农业总产值数据组成的一一个时间序列。面板数据由个时间序列。面板数据由30个个体组成。共有个个体组成。共有330个观测值。个观测值。对于面板数据对于面板数据yi t,i=1,2,N;t=1,2,T来说,如果从横截面上看,来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,
2、则称此面板数每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。)。例例11.1.1 1996-2002年中国东北、华北、华东年中国东北、华北、华东15个省级地区的居民家庭人个省级地区的居民家庭人均消费和人均收入(不变价格)数据见表均消费和人均收入(不变价格)数据见表11.1.1和表和表11.1.2。数据是。数据是7年的,年的,每
3、一年都有每一年都有15个数据,共个数据,共105组观测值。组观测值。表表11.1.1 1996-200211.1.1 1996-2002年中国东北、华北、华东年中国东北、华北、华东1515个省级地区的居民家庭人个省级地区的居民家庭人均消费数据(不变价格)均消费数据(不变价格)表11.1.2 1996-2002年中国15个省级地区的居民家庭人均收入数据(不变价格)人均消费和收入的面板数据从纵剖面观察分别见图11.1.2和图11.1.3。从横截面观察分别见图11.1.4和图11.1.5。用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,
4、TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。2000300040005000600070008000900010000110001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图11.1.2 15个省市人均消费序列(纵剖面)图11.1.3 15个省市人均收入序列 200040006000800010000120001400019961997199819992000
5、20012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ图11.1.4 15个省市人均消费散点图(每条连线表示同一年度15个地区的消费值)图11.1.5 15个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值)15个地区个地区7年人均消费对收入的面板数据散点图见图年人均消费对收入的面板数据散点图见图11.1.6和图和图11.1.7。图。图11.1.6中每一种符号代表一个省级地区的中每一种符号代表一个省级地区的7个观测点组成的时个观测点组成的时间序列。相当于观察间序列。相当于观察15个
6、时间序列。图个时间序列。图11.1.7中每一种符号代表一个年中每一种符号代表一个年度的截面散点图(共度的截面散点图(共7个截面)。相当于观察个截面)。相当于观察7个截面散点图的叠加。个截面散点图的叠加。2000300040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图11.1.6 用15个时间序列表示的人均消费对收入的面板数据图11.1.7 用7个截面表示的人均消费对收入 的面板数据(7个
7、截面叠加)图图11.1.811.1.8给出北京和内蒙古给出北京和内蒙古1996-20021996-2002年消费对收入散点图。年消费对收入散点图。图图11.1.911.1.9给出给出1515个省级地区个省级地区19961996和和20022002年的消费对收入散点图。年的消费对收入散点图。图11.1.8 北京和内蒙古1996-2002年消费对收入时序图 图11.1.9 1996和2002年地区消费对收入散点图 11.1.2 面板数据模型的基本类型 设yit为被解释变量在横截面i和时间t上的数值,xjit为第j个解释变量在横截面i和时间t上的数值,uit为横截面i和时间t上的随机误差项;bji为
8、第i截面上的第j个解释变量的模型参数;ai为常数项或截距项,代表第i横截面(第i个体的影响);解释变量数为j=l,2,k;截面数为i=1,2,N;时间长度为t=1,2,T。其中,N表示个体截面成员的个数,T表示每个截面成员的观测时期总数,k表示解释变量的个数。则单方程面板数据模型一般形式可写成:对于平衡的面板数据,即在每一个截面单元上具有相同个数的观测值,模型样本观测数据的总数等于NT。当N=1且T很大时,就是所熟悉的时间序列数据;当T=1而N很大时,就只有截面数据。面板数据模型划分为3种类型:(1)无个体影响的不变系数模型:无个体影响的不变系数模型:ai=aj=a,bi=bj=b 这种情形意
9、味着模型在横截面上无个体影响、无结构变化,可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本假设条件,就可以采用OLS法进行估计(共有k+1个参数需要估计),该模型也被称为联合回归模型(pooled regression model)。(2)变截距模型:变截距模型:aiaj,bi=bj=b 这种情形意味着模型在横截面上存在个体影响,不存在结构性的变化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项ai(i1,2,N)的差别来说明,故通常把它称为变截距模型。(3)(3)变系数模型:变系数模型:aiaj,bi
10、bj 这种情形意味着模型在横截面上存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项ai(i1,2,N)来说明的同时还允许系数向量bi(i1,2,N)依个体成员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。11.1.3 面板数据模型的优点 1利用面板数据模型可以解决样本容量不足的问题 2有助于正确地分析经济变量之间的关系 3可以估计某些难以度量的因素对被解释变量的影响11.2 模型形式设定检验 建立面板数据模型首先要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式,从而避免模型
11、设定的偏差,改进参数估计的有效性。主要检验如下两个假设:如果接受假设H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系数模型。下面介绍假设检验的F统计量的计算方法。首先计算变截距、变系数模型首先计算变截距、变系数模型(11.1.6)(11.1.6)的残差平方和的残差平方和S1S1。如果记11.3 变截距模型 该模型允许个体成员上存在个体影响,并用截距项的差别来说明。模型的回归方程形式如下:11.3.1 固定影响变截距模型 1最小二乘虚拟变量模型(LSDV)及其参数估计 其中
12、例例11.3.111.3.1 利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试研究这些地区的居民家庭消费行为。(1)建立合成数据库(pool)对象或混合数据库对象;(2)定义序列名并输入数据;(3)估计无个体影响的不变系数模型;(4)估计变截距模型。(1 1)建立合成数据库()建立合成数据库(poolpool)对象)对象 在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object(新对象)选择窗(见图11.3.1)。图11.3.1 Pool对象定义对话框 在T
13、ype of Object选择区选择Pool(混合数据库),在Name of Object选择区命名CS(初始显示为Untitled),点击OK,从而打开Pool对象说明窗口。在窗口中输入15个地区标识AH(安徽)、BJ(北京)、ZJ(浙江)。如图11.3.2所示。图11.3.2 Pool对象说明窗口(2)定义序列名并输入数据)定义序列名并输入数据 在新建立的Pool(混合数据)窗口的工具栏中点击Sheet键,从而打开Series List(列出序列名)窗口,定义时间序列变量CP?和IP?,如图11.3.3。点击OK键,从而打开Pool(混合数据库)窗口,输入数据,输入完成后的情形见图11.3
14、.4。图11.3.3 序列列表对话框 图11.3.4 序列的堆栈形式数据表 (3 3)估计无个体影响的不变系数模型)估计无个体影响的不变系数模型模型形式为 其中:a为15个省市的平均自发消费倾向,b为边际消费倾向。在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation(混合估计)窗口如图11.3.5。图11.3.5 合成数据模型定义对话框 在对话框左上部的Dependent Variable选择窗填入被解释变量CP?;在中部的Common coefficients(系数相同)选择窗填入解释变量IP?;Cross section specific coeffici
15、ents(截面系数不同)选择窗保持空白;Intercept选项代表截距的处理方式。None代表模型不包含截距,Common指所有截面单元具有相同截距,Fixed effects与Random effects分别表示截距变动的固定效应和随机效应。本例选择窗点击Common。对话框Weighting(权数)选项是模型的估计方法。本例选择不加权,点击No weighting。完成合成数据模型定义对话框后,点击OK键,得输出结果如表11.3.1。表11.3.1 无个体影响的不变系数模型估计结果 表11.3.1结果表明,回归系数显著不为0,调整后的样本决定系数达0.98,说明模型的拟合优度较高。从结果看
16、,平均消费倾向为0.76,表明15个省级地区的人均消费支出平均占收入的76%。(4)变截距模型)变截距模型 模型形式为 其中:ai为15个省市的自发消费倾向,用来反映省市间的消费结构差异,b为边际消费倾向。EViews估计方法:在EViews的Pooled Estimation对话框中Intercept选项中选Fixed effects。其余选项同上。得输出结果如表11.3.2。表11.3.2 变截距模型估计结果 表11.3.2中给出了变截距模型估计结果,表中的系数0.697561为边际消费倾向,后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式是安
17、 徽:CP_AH=479.3076014+0.6975614547*IP_AH北 京:CP_BJ=1053.179629+0.6975614547*IP_BJ福 建:CP_FJ=467.9678362+0.6975614547*IP_FJ河 北:CP_HB=361.3764747+0.6975614547*IP_HB黑龙江:CP_HLJ=345.9120278+0.6975614547*IP_HLJ吉 林:CP_JL=540.1174754+0.6975614547*IP_JL江 苏:CP_JS=480.417445+0.6975614547*IP_JS江 西:CP_JX=195.917581
18、2+0.6975614547*IP_JX辽 宁:CP_LN=622.0405359+0.6975614547*IP_LN内蒙古:CP_NMG=306.0650134+0.6975614547*IP_NMG山 东:CP_SD=381.4986769+0.6975614547*IP_SD上 海:CP_SH=782.5988793+0.6975614547*IP_SH陕 西:CP_SX=440.7243659+0.6975614547*IP_SX天 津:CP_TJ=562.8424811+0.6975614547*IP_TJ浙 江:CP_ZJ=714.233227+0.6975614547*IP_Z
19、J 表11.3.2结果表明,回归系数显著不为0,调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,对于本例中的15个省市来说,虽然居民边际消费倾向相同,但是其居民的自发消费存在显著的差异,其中北京、上海、浙江是居民自发消费最高的3个地区,而居民自发消费最低的是江西,其次是内蒙古。对于随机效应模型或者变系数模型,用对于随机效应模型或者变系数模型,用EViews建模建模过程大同小异,只是结果输出窗口中的参数估计格式有过程大同小异,只是结果输出窗口中的参数估计格式有所区别。所区别。EViews 5.1EViews 5.1版本的面板数据模型估计版本的面板数据模型估计(Pool
20、(Pool Estimation)Estimation)窗口分成了两个模块:窗口分成了两个模块:Specification(Specification(设定设定)和和Option(Option(选择选择),但基本功能与早期版本无本质区别,但基本功能与早期版本无本质区别,主要选择都集中在主要选择都集中在Specification(Specification(设定设定)模块中,见图模块中,见图11.3.611.3.6。熟悉了图。熟悉了图11.3.511.3.5中选择方法对图中选择方法对图11.3.611.3.6对话框对话框不难理解。不难理解。图11.3.6 EViews5.1合成数据模型定义对话框
21、 在Estimation Method(估计方法)选项区内有三个选项框:(1)Crosssection(横跨个体)中包括None(不选)、Fixed(固定)、Random(随机),分别用来做非个体效应、个体固定效应和个体随机效应的设定(见图11.3.6)。(2)Period(时点)中也包括None(不选)、Fixed(固定)、Random(随机)三项选择,分别用来进行非时点效应、时点固定效应或时点随机效应设定。(3)Weight(权数)可以在5种加权方法中做选择。在Estimation Settings(估计方法设定)区包括两种估计方法:一种为LS(最小二乘)方法;一种为TSLS(两阶段最小二
22、乘)方法。EViews5.1估计结果如表11.3.3所示。表11.3.3 各地区自发消费对平均自发消费偏离的估计结果 从表从表11.3.311.3.3可知,可知,515.6133515.6133为为1515个省市的平均自发消费水平,表中的个省市的平均自发消费水平,表中的系数系数0.6975610.697561为边际消费倾向,后面第为边际消费倾向,后面第3 3行至第行至第1717行数据为各地区自发消费行数据为各地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为
23、各地区自发消费。表平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表11.3.311.3.3回归结果与表回归结果与表11.3.211.3.2回归结果本质上是相同的。回归结果本质上是相同的。2 2非平衡数据的固定影响模型非平衡数据的固定影响模型 在所获得的面板数据中,一些个体成员的数据较多而另一些个体成员的在所获得的面板数据中,一些个体成员的数据较多而另一些个体成员的数据较少。这种情况下的面板数据被称为非平衡数据。数据较少。这种情况下的面板数据被称为非平衡数据。3 3固定影响变截距模型的广义最小二乘估计固定影响变截距模型的广义最小二乘估计 在固定影响变截距模型中,如果随机误差项不满足
24、等方差或相互独立的在固定影响变截距模型中,如果随机误差项不满足等方差或相互独立的假设,则需要使用广义最小二乘法假设,则需要使用广义最小二乘法(GLS)(GLS)对模型进行估计。对模型进行估计。下面只介绍个体成员截面异方差和同期相关协方差两种情形。下面只介绍个体成员截面异方差和同期相关协方差两种情形。(1)(1)个体成员截面异方差情形的个体成员截面异方差情形的GLSGLS估计估计 个体成员截面异方差是指各个体成员方程的随机误差项之间存在异方差,个体成员截面异方差是指各个体成员方程的随机误差项之间存在异方差,但个体成员之间和时期之间的协方差为零,对应的假设为:但个体成员之间和时期之间的协方差为零,
25、对应的假设为:(2)(2)同期相关协方差情形的同期相关协方差情形的SURSUR估计估计 同期相关协方差是指不同的个体成员同期相关协方差是指不同的个体成员i i和和j j的同时期的随机误差项是相关的同时期的随机误差项是相关的,但其在不同时期之间是不相关的,相应的假设为的,但其在不同时期之间是不相关的,相应的假设为 需要指出的是同期相关协方差是允许同一时期即需要指出的是同期相关协方差是允许同一时期即t t不变时,不同个体成不变时,不同个体成员之间存在协方差。如果把假设式员之间存在协方差。如果把假设式(11.3.14)(11.3.14)中的第一个表达式写成向量和中的第一个表达式写成向量和矩阵的形式:
展开阅读全文