《计量经济学》第九章:虚拟变量课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《计量经济学》第九章:虚拟变量课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量经济学 计量 经济学 第九 虚拟 变量 课件
- 资源描述:
-
1、1 第九章第九章虚 拟 变 量115.1虚拟变量的性质虚拟变量的性质:变量假定为变量假定为“1”和和“0”变量通常表明二分化:变量通常表明二分化:“存在存在”或或“不存在不存在”,“是是”或或“不是不是”,等等.变量表明了变量表明了“性质性质”或或“属性属性”,例如例如“男性男性”或或“女性女性”,“黒黒”或或“白白”,“城市城市”或非城市或非城市”“以前以前”或或“以后以后”“北北”或或“南南”,“东东”或或“西西”.obs男男Dummy女女Dummy薪水薪水(K)教龄教龄11023120119.5131024240121251025360122371026.5480123.14901255
2、1010285111029.561201266130127.57141031.571501296161022517011921810182190121.75200118.522110214221020.542301171240117.51251021.25分离出的男性样本男性样本:obsStarting salary,YYears of teaching,X2123132425253726.54102851129.561431.57162251821.75212142220.542521.25obsStaring salary,YYears of teaching,X2219.51421262
3、23823.149255122661327.571529617192191822018.52231712417.51女性样本:分离出的女性样本101520253035012345678男回归线(男)薪水YX 教龄Y=1+2 X (男)回归线(女)女Y=1+2X(女)两个独立的模型:Ym=1+2 Xm+umYf=1+2 Xf+uf(男)(女)假定*2=2,斜率相同但截距不同.第一个模型:Yi=1+*1 Di+2 Xi+uiYi=1+*1 Di+2 Xi+*2 DiXi+uiYi=年收入Xi=教龄Di=1 如果是男性 =0 否则(女性)控制变量假定*2 2,斜率与截距都不同.第二个模型:薪水YX
4、教龄Y=1+2X(女)Y=1+2 X (男)012345678男男女女回归线(男)回归线(女)152025303510Y=”1+”2 X (全部)两个独立的模型:Ym=1+2 Xm+umYf=1+2 Xf+uf(男)(女)D1+D2=1D1=1-D2m a lefem a lea n n u a lS a la ryy ea rs o ftea ch in go b sD 2D 1YX1012 312101 9.513012 424102 125012 536102 237012 6.548102 3.149102 551 0012 851 1012 9.561 2102 661 3102 7
5、.571 4013 1.571 5102 961 6012 251 7101 921 8011 821 9102 1.752 0101 8.522 1012 142 2012 0.542 3101 712 4101 7.512 5012 1.25每个虚拟每个虚拟变量可区变量可区分两个类分两个类别别,但把两但把两个虚拟变个虚拟变量求和后量求和后 就无法区就无法区分男性或分男性或女性女性谨慎使用虚拟变量谨慎使用虚拟变量 (虚拟变量陷阱虚拟变量陷阱)假如在一个模型中引入两个虚拟变量,例如Yi=1+*1 D1i+*1 D2i+2 Xi+ui这里D1i=1 假如是女性 =0 否则这里D2i=1 假如是男
6、性 =0 否则因为D1 和D2 之间的完全共线性,这个模之间的完全共线性,这个模型不可估计型不可估计D1=1-D2or D2=1-D1或 D1+D2=1 (完全共线性)在一个模型中使用两个虚拟变量来区分一个二分变量就会落入“完全多重共线性的陷阱完全多重共线性的陷阱”一般规则:为了避免完全的多重共线性如果变量有“m m”个类别,则引入“m-1m-1”个虚拟变量.1D1 D2 D3 D4 D5 Dm-1年龄110203040m类别类别虚拟变量虚拟变量=定性变量定性变量度量两组估计结果:男:=Yi=(1+*1 D2i)+2Xi D2i=1 女:=Yi=1+2Xi D2i=0 对两组考虑不同的截距:M
7、odel:Yi=1+*1 D2i+2Xi+ui D2i=1 假如是男性 =0否则,(女性)当一个类别被赋予零值,这个类别被称为标准类(基底类)为了检验两组有什么不同为了检验两组有什么不同比较:Yi=1+2Xi Yi=(1+*1 D)+2 Xi如果 t统计量是显著的 则说明截距是不同的.=相同的 意味着两类的X和Y有相同的关系检查检查 t t统计量统计量2H0 :*1=0H1:*1 0 或H1:*1 0T检验是恰当的检验比较临界的 tc(/2,n-k)值 和估计的 t*值如果t*tc =拒绝H0:*1=0Y=1+*1Di+2 Xi +*2DiXi 检验 T统计量=这个部分这个部分用来检验用来检验
8、截距的不同截距的不同这个部分用来检验这个部分用来检验斜率的不同斜率的不同检验T统计量=例子(男性和女性)例子(男性和女性):女性女性男性男性两个回归结果的斜率与截距都不同两个回归结果的斜率与截距都不同.但是它们在统计上真的但是它们在统计上真的不同吗不同吗?除非检验除非检验F F*值,否则我们不可能从这两个回归中得值,否则我们不可能从这两个回归中得到回答到回答设置两个虚拟变量的例子设置两个虚拟变量的例子:表表15.1+15.5Yi=(1+”1D1)+2 Xi =(19.937-1.2810)+1.561XD1:女性女性=1其他其他=0D2:男性男性=1其他其他=0=(16.656+1.2810)
9、+1.561XYi=(1+*1 D2)+2 Xi Yi=1+2Xi =17.095+1.608Xi 全部样本全部样本D1:女女=1男:Y=1+2Xi =18.689+1.373 Xm女:Y=(1+1D1)+(2+2D1)Xi =16.255+1.677 Xf如果如果D2:男男=1女:Y=1+2 Xi =16.255+1.677 X男:Y=(1+1 D2)+(2+2D2)X=18.689+1.373 X1Y=15.2对一个定量变量和一个多分定性变量的回归(Health care)=1+1 D2+1 D3+2Income+u(Y)(X)D2=1 如果是高中 =0 其他D3=1 如果是大学 =0 其
10、他健康状况收入低于高中教育Y=1+2 X1高中教育Y=(1+1 D2)+2X D2=11D3=1大学教育Y=(1+1”D3)+2 X1D2=1 高中 =0 其它D3=1 大学 =0 其它=obsYXD2D3=16.000000 40.000000.0000001.00000023.900000 31.000001.0000000.00000031.800000 18.000000.0000000.00000041.900000 19.000000.0000000.00000057.200000 47.000000.0000001.00000063.300000 27.000001.000000
11、0.00000073.100000 26.000001.0000000.00000081.700000 17.000000.0000000.00000096.400000 43.000000.0000001.000000107.900000 49.000000.0000001.000000111.500000 15.000000.0000000.000000123.100000 25.000001.0000000.000000133.600000 29.000001.0000000.000000142.000000 20.000000.0000000.000000156.200000 41.0
12、00000.0000001.000000=低于高中:Yi=-1.2859+0.1722 XiYi=(-1.2859-0.068 )+0.1722 Xi=-1.3539+0.1722 X高中:如果如果 D D2 2 的的 t t值是统计值是统计上显著的上显著的Yi=(-1.2859+0.447 )+0.1722 Xi=-0.8389+0.1722 Xi大学:如果如果 D2 D2 的的 t t值是值是统计上显著的统计上显著的=-1.2859+0.1722 X=-1.2859+0.1722 X假如假如 t t检验是统计上检验是统计上不显著的不显著的不同组的估计结果不同组的估计结果:15.3对一个定量
13、变量和两个以上的虚拟或定性变量的回归(续)对一个定量变量和两个以上的虚拟或定性变量的回归(续)(Y)Salary=1+1D1+”1 D2+2X+uor Y=1+1D1+”1D2+2X+2D1*X+”2D2*X+uD1=1 如果是男的 =0 其它性别D2=1 如果是白人 =0 其它种族(1)非白人女教师薪水的均值:Y=1+2X 此时 D1=0,D2=0(2)非白人男教师薪水的均值:Y=(1+1 D1)+(2+2D1)X 此时 D1=1,D2=0(3)白人女教师薪水的均值:Y=(1+1 D2)+2 X+”2D2X 此时 D1=0,D2=1(4)白人男教师薪水的均值:Y=(1+1 D1+”1D2)+
14、(2+2D1+”2D2)X 此时 D1=1,D2=1D=1 如果1970-1981 =0 其它 (1982-1995)1.重合回归:Y=1+2 X+1D+2D*XH0:1=0 and 2=02.平行回归:Y=1+2 X+1 D+2D*XH0:1=04.相异回归:Y=1+2 X+1D+2D*XH0:1 0 and 2 03.汇合回归:Y=1+2 X+1 D+2D*XH0:2=0 15.4(利用虚拟变量利用虚拟变量)检验模型的结构稳定性检验模型的结构稳定性(1970-1981):Yt=A1+A2 Xt+u1t(1982-1995:Yt=B1+B2 Xt+u2t YXA1=B11A2=B2重合回归Y
15、XA1 1A2 平行回归A1 B1,A2=B2B21B1YXA0=B01B1汇合回归A11A0=B0,A1 B1YXA0 1A1 相异回归A0 B0,A1 B1B01B1汇合回归模型例:我们怎样才能检验一辆新车与一辆旧车在汽油消耗上不同这一假设呢?让我们假定在开始时新车和旧车没有区别.汽油消耗量汽油消耗量里程数Y X0新车 Y=1+2 X旧车 Y=1+2XY=1+(2+2)X估计的关系为估计的关系为 :旧车:Yi=1+(2+2D)Xi 这里 D=1 新车:Yi=1+2 Xi=Yi=1+2 Xi=或如果2 0,意味着车的斜率是不同的.让 2=2+2 D 这里D=1如果时旧车 =0 其它现在在模型
16、中:Yi=1+(2+2 D)Xi+ui =1+2 Xi+2 D*Xi+ui =1+2 Xi+2 Zi+ui 对 2使用t检验比较tc(,N-3)和t*H0:2=0H1:2 0如果t*tc(,N-3)=拒绝H0或(2 0)检验是否 2=0,12i2Y=+X +Z检查t值Y=1 +2 Xi +2 ZiobsYiXiDi(Di Xi)=Zi121010000225011011103340150115043051201120(2)基于虚拟变量的结构稳定性检验估计的模型是:1974年第一季以后Y=1+2 X 现在基本模型为Yt=1+1 D+2 Xt+2 D Xt+utYt=1+1 D+2 Xt+2 X*
展开阅读全文