书签 分享 收藏 举报 版权申诉 / 38
上传文档赚钱

类型STATA与面板数据回归课件1.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:3761558
  • 上传时间:2022-10-10
  • 格式:PPT
  • 页数:38
  • 大小:198.67KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《STATA与面板数据回归课件1.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    STATA 面板 数据 回归 课件
    资源描述:

    1、面板数据模型与stata软件的应用 一、什么是面板数据 二、面板数据模型的优势 三、面板模型的估计方法:FE和RE 四、stata软件简介 五、如何用stata估计面板模型:案例分析一、面板数据类型 时间维度+截面维度 如我们在分析中国各省份的经济增长时,共有31个截面,每个截面都取1979-2019共20年的数据,共有620个观察值,这是一个典型的平行面板数据 上市公司财务数据,研究一段时期内(2019-2019)上市公司股利的发放数额与股票账面价值之间的关系,共有20 11=220个观测值 强调经济理论基础、强调微观行为基础表1 2019-2019年中国东北、华北、华东15个省级地区的居民

    2、家庭人均消费数据(不变价格)地区人均消费地区人均消费2019201920192019200020192019CP-AH(安徽)3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京)5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建)4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北)3197.339 3868.319 3896.7

    3、78 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龙江)2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林)2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江苏)3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西)2714.124 3136.873 3234.465 3531.775 36

    4、12.722 3914.080 4544.775CP-LN(辽宁)3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(内蒙古)2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山东)3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海)6193.333 6634.183 6866.410 8125.803 8651.893 9336.10

    5、0 10411.94CP-SX(山西)2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津)4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江)5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210表2 上市公司的投资与股票账面价值:N=20,T=4面板数据模型和stata软件应用 二、面板数据模型有以下几个优点:第一,Panel Data 模型可以

    6、通过设置虚拟变量对个别差异(非观测效应)进行控制;第二,Panel Data 模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性;第三,Panel Data模型是对同一截面单元集的重复观察,能更好地研究经济行为变化的动态性举例 交通死亡率与酒后驾车人数(一段时间内江苏省各市)其他的非观测(潜在)因素:南京与苏州 汽车本身状况 道路质量 当地的饮酒文化 单位道路的车辆密度 非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应 面板数据模型形式:其中,i=1,2,3.N,截面标示;t=1,2,.T,时间标示;xit为k1解释

    7、变量,为k1系数列向量 对于特定的个体i 而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、地区的经济结构,法律和产权制度等,一般称其为“个体效应”(individual effects)itiitityxuiitu 面板数据模型的误差项由两部分组成:一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项 北京江苏GDPX(Invest、edu)北京江苏省山西省山西基础设施更加完善

    8、,受教育程度较好、经济结构以服务业为主、法制更健全面板模型选择:固定效应还是随机效应 对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型 固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上 FE(Fixed Effects)Model RE(Random Effects)Model 其中,是截距中的随机变量部分,代表个体的随机影响itiitityxu(Replace with dummy v

    9、ariables)ititiityxui固定效应模型 1、例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求 同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化 面板数据(Panel Data)从某种程度上克服了这一困难。考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势 例如,在研究中国地区经济增长的过程中,以全国28 个省区为研究对象,可以认为这28 个省区几

    10、乎代表了整个总体 同时假设在样本区间内,各省区的 经济结构 人口素质 等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的ititiityxu 2、而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力、消费习惯等方面的差异是随机的,采用随机效应模型较为合适 随机效应模型:RE认为个体的差异是随机的,其中 非观测的个体差异效应 与随机扰动项一样都是随机变量i随机效应模型 总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机变量,并且符合一个特

    11、定的分布,则模型为随机效应模型 3、在实证分析中,一般通过hausman检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件 因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型 Hausman检验的基本思想是:在固定效应u_i和其他解释变数不相关的原假设下,用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的。反之,OLS是一致的,但GLS则不是 因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检

    12、验量。如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的。四、stata软件简介 STATA软件估计与应用:打开数据库:use E:Program FilesStata10.0绿色软件Stata10东部.dta“或者重新输入数据:edit 相关系数:cor gdp invest edu sci health 简单回归:regress gdp invest culture sciregress gdp invest culture sci 无常数:无常数:regress gdp invest culture sci,noconstantregress gdp invest culture

    13、sci,noconstant估计结果 _cons 5 5.3 39 92 29 94 43 3 .4 44 42 20 05 51 19 9 1 12 2.2 20 0 0 0.0 00 00 0 4 4.5 52 22 27 70 07 7 6 6.2 26 63 31 17 79 9 sci .5 55 57 70 00 05 57 7 .0 05 51 10 00 00 07 7 1 10 0.9 92 2 0 0.0 00 00 0 .4 45 56 66 60 04 44 4 .6 65 57 74 40 07 71 1 culture .7 71 16 63 33 30 08 8

    14、.0 06 61 13 37 74 41 1 1 11 1.6 67 7 0 0.0 00 00 0 .5 59 95 55 50 08 8 .8 83 37 71 15 53 36 6 invest -.1 16 60 01 12 20 06 6 .0 04 49 91 10 08 87 7 -3 3.2 26 6 0 0.0 00 01 1 -.2 25 56 67 79 97 74 4 -.0 06 63 34 44 43 38 8 gdp Coef.Std.Err.t P|t|95%Conf.Interval Total 3 32 21 1.6 64 44 49 90 04 4 2 2

    15、7 78 8 1 1.1 15 56 69 99 96 60 06 6 Root MSE =.4 40 00 06 69 9 Adj R-squared=0 0.8 86 61 12 2 Residual 4 44 4.1 15 51 14 48 86 67 7 2 27 75 5 .1 16 60 05 55 50 08 86 61 1 R-squared =0 0.8 86 62 27 7 Model 2 27 77 7.4 49 93 34 41 18 8 3 3 9 92 2.4 49 97 78 80 05 59 9 Prob F =0 0.0 00 00 00 0 F(3,275)

    16、=5 57 76 6.1 13 3 Source SS df MS Number of obs=2 27 79 9回归诊断:是否存在异方差:estat hettest 怀特检验:estat imtest,white 回归信息检验:estat imtest 是否遗漏重要解释变量:estat ovtest 拟合图:rvfplot 单一变量的相关图:cprplot invest画图 菜单与命令结合菜单与命令结合 twoway(scatter gdp invest)twoway(scatter gdp invest|lfit gdp invest)14161820101112131415investg

    17、dpFitted values基本建设支出与GDP的相关关系图1112131415edu19982000200220042006tsheng=1/sheng=16/sheng=31sheng=2/sheng=17sheng=3/sheng=18sheng=4/sheng=19sheng=5/sheng=20sheng=6/sheng=21sheng=7/sheng=22sheng=8/sheng=23sheng=9/sheng=24sheng=10/sheng=25sheng=11/sheng=26sheng=12/sheng=27sheng=13/sheng=28sheng=14/sheng

    18、=29sheng=15/sheng=30各省教育支出的增长趋势:2019-2019 Durbin-Watson 统计量:estat dwatson 序列相关检验:estat durbinalt 滞后阶数选择:estat durbinalt,lags(2)条件异方差检验:estat archlm,lags(2)可选变量的异方差检验:estat szroeter gdp gdp invest culture sciinvest culture sci五、Stata对面板数据模型的估计F test that all u_i=0:F(3 30 0,2 24 42 2)=8 84 4.3 32 2 Pr

    19、ob F=0 0.0 00 00 00 0 rho .9 96 66 65 52 28 85 5 (fraction of variance due to u_i)sigma_e .1 10 09 96 68 81 16 66 6 sigma_u .5 58 89 93 39 91 13 33 3 _cons 7 7.8 80 03 36 60 01 1 .2 22 23 37 70 06 68 8 3 34 4.8 88 8 0 0.0 00 00 0 7 7.3 36 62 29 94 4 8 8.2 24 44 42 26 62 2 techno .1 12 29 95 54 41 16

    20、 6 .0 03 33 38 86 61 1 3 3.8 83 3 0 0.0 00 00 0 .0 06 62 28 84 41 17 7 .1 19 96 62 24 41 14 4 admin .1 13 33 38 81 12 25 5 .0 04 41 10 07 74 46 6 3 3.2 26 6 0 0.0 00 01 1 .0 05 52 29 90 03 32 2 .2 21 14 47 72 21 18 8 health .5 58 85 50 01 13 35 5 .0 06 63 30 05 57 7 9 9.2 28 8 0 0.0 00 00 0 .4 46 60

    21、 08 80 02 28 8 .7 70 09 92 22 24 42 2 sci -.1 19 96 69 91 17 75 5 .0 05 55 51 19 99 96 6 -3 3.5 57 7 0 0.0 00 00 0 -.3 30 05 56 65 50 06 6 -.0 08 88 81 18 84 45 5 culture .0 06 64 49 91 19 98 8 .0 03 34 43 36 64 45 5 1 1.8 89 9 0 0.0 06 60 0 -.0 00 02 27 77 71 19 9 .1 13 32 26 61 11 15 5 invest .0 0

    22、3 34 45 57 77 75 5 .0 02 25 51 10 00 05 5 1 1.3 38 8 0 0.1 17 70 0 -.0 01 14 48 86 65 58 8 .0 08 84 40 02 20 08 8 gdp Coef.Std.Err.t P|t|95%Conf.Interval corr(u_i,Xb)=0 0.6 63 36 64 4 Prob F =0 0.0 00 00 00 0 F(6 6,2 24 42 2)=4 43 35 5.1 12 2 overall=0 0.8 81 17 75 5 max=9 9 between=0 0.8 86 65 54 4

    23、 avg=9 9.0 0R-sq:within =0 0.9 91 15 52 2 Obs per group:min=9 9Group variable:s sh he en ng g Number of groups =3 31 1Fixed-effects(within)regression Number of obs =2 27 79 9 rho .8 89 91 14 49 90 04 49 9 (fraction of variance due to u_i)sigma_e .1 10 09 96 68 81 16 66 6 sigma_u .3 31 14 43 38 82 25

    24、 59 9 _cons 7 7.4 43 37 78 88 8 .2 24 44 46 68 87 78 8 3 30 0.4 40 0 0 0.0 00 00 0 6 6.9 95 58 83 30 01 1 7 7.9 91 17 74 46 6 techno .1 17 79 90 03 32 21 1 .0 03 35 54 41 14 43 3 5 5.0 06 6 0 0.0 00 00 0 .1 10 09 96 62 21 12 2 .2 24 48 84 44 42 29 9 admin .0 07 79 93 35 57 7 .0 04 43 36 65 52 25 5 1

    25、 1.8 82 2 0 0.0 06 69 9 -.0 00 06 62 20 00 04 4 .1 16 64 49 91 14 45 5 health .5 56 68 86 64 42 28 8 .0 06 68 86 64 47 74 4 8 8.2 28 8 0 0.0 00 00 0 .4 43 34 40 09 96 64 4 .7 70 03 31 18 89 91 1 sci -.0 05 52 20 02 28 82 2 .0 05 55 52 26 65 59 9 -0 0.9 94 4 0 0.3 34 46 6 -.1 16 60 03 34 47 74 4 .0 0

    26、5 56 62 29 91 1 culture .0 03 39 95 51 19 94 4 .0 03 37 73 34 49 93 3 1 1.0 06 6 0 0.2 29 90 0 -.0 03 33 36 68 83 39 9 .1 11 12 27 72 22 27 7 invest .0 00 03 30 08 86 68 8 .0 02 27 70 00 02 29 9 0 0.1 11 1 0 0.9 90 09 9 -.0 04 49 98 83 38 8 .0 05 56 60 01 11 16 6 gdp Coef.Std.Err.z P|z|95%Conf.Inter

    27、val corr(u_i,X)=0 0(assumed)Prob chi2 =0 0.0 00 00 00 0Random effects u_i G Ga au us ss si ia an n Wald chi2(6 6)=2 23 34 42 2.8 80 0 overall=0 0.8 86 64 41 1 max=9 9 between=0 0.8 89 94 43 3 avg=9 9.0 0R-sq:within =0 0.9 91 11 15 5 Obs per group:min=9 9Group variable:s sh he en ng g Number of group

    28、s =3 31 1Random-effects GLS regression Number of obs =2 27 79 9随机效应模型Stata对面板数据模型的估计 首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company year tsset industry year 产生新的变量:gen newvar=human*lnrd 产生滞后变量Gen fiscal(2)=L2.fiscal 产生差分变量Gen fiscal(D)=D.fiscal 描述性统计:xtdes:对Panel Data截面个数、时间跨度的整体描述 Xtsum:分组内、组间和样本整体计算各个变

    29、量的基本统计量 xttab 采用列表的方式显示某个变量的分布 Stata中用于估计面板模型的主要命令:xtreg xtreg depvar varlist if exp,model_type level(#)Model type 模型 be Between-effects estimator fe Fixed-effects estimator re GLS Random-effects estimator pa GEE population-averaged estimator mle Maximum-likelihood Random-effects estimator 主要估计方法:xt

    30、reg:Fixed-,between-and random-effects,and population-averaged linear models xtregar:Fixed-and random-effects linear models with an AR(1)disturbance xtpcse:OLS or Prais-Winsten models with panel-corrected standard errors xtrchh:Hildreth-Houck random coefficients models xtivreg:Instrumental variables

    31、and two-stage least squares for panel-data models xtabond:Arellano-Bond linear,dynamic panel data estimator xttobit:Random-effects tobit models xtlogit:Fixed-effects,random-effects,population-averaged logit models xtprobit:Random-effects and population-averaged probit models xtfrontier:Stochastic fr

    32、ontier models for panel-data xtrc gdp invest culture edu sci health social admin,beta xtreg命令的应用:声明面板数据类型:tsset sheng t 描述性统计:xtsum gdp invest sci admin 1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe 固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相

    33、应的P 值,本例中固定效应非常显著 2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re 检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0 检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型 3.最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验 Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果 xtreg gdp invest cultu

    34、re sci health admin techno,fe est store fe 第二步:估计随机效应模型,存储结果 xtreg gdp invest culture sci health admin techno,re est store re 第三步:进行hausman检验 hausman fe Hausman检验量为:H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型 如果hausman检验值为负,说明的模型设定有问题,导致

    35、Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等 可以改用hausman检验的其他形式:hausman fe,sigmaless 对于固定效应模型的异方差检验和序列相关检验:Xtserial gdp invest culture sci health admin techno 异方差检验:xtreg gdp invest culture sci health admin techno,fe xttest3(Modified Wald statistic for groupwise heteroskedasticity in fixed effect model

    36、)随机效应模型的序列相关检验:xtreg gdp invest culture sci health admin techno,re Xttest1 Xttest1用于检验随机效应(单尾和双尾)、一阶序列相关以及两者的联合显著 检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著 可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtgls gdp invest culture sci health admin techno,panels(hetero),修正异方差 xtgls gdp invest culture sci health admin techno,panels(correlated),修正依横截面而变化的异方差 xtgls gdp invest culture sci health admin techno,panels(hetero)corr(ar1),修正异方差和一阶序列相关ar(1)

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:STATA与面板数据回归课件1.ppt
    链接地址:https://www.163wenku.com/p-3761558.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库