模型设定和虚拟变量专题之虚拟变量课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模型设定和虚拟变量专题之虚拟变量课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模型 设定 虚拟 变量 专题 课件
- 资源描述:
-
1、1第五讲第五讲 模型设定和虚拟变量专题模型设定和虚拟变量专题 之之 虚拟变量虚拟变量 y=b0+b1x1+b2x2+.bkxk+u 2前言前言n前面有关多元回归模型的因变量和自变量都具有定量的 含义,如小时工资率、受教育年数,大学平均成绩、企业销售水平等等。在经验分析中,每个变量的大小都传递了有用的信息,n然而,经验分析还常常碰到定性的问题,如,一个人的性别、种族、企业所属行业以及城市所处的地理位置等等,当考虑这些因素作为变量时,则必须采用虚拟变量设置。前言前言n其中,如果我们把上述定性变量作为自变量,就是本章要讲的虚拟变量设置,并估计的问题。n如果我们把上述定性变量作为因变量,则为线性概率模
2、型,这些在微观计量经济学中用的比较多,教材也阐述一些,但是本章不讲解该部分的内容,因为如果讲清楚需要很足够时间,如果提到当讲不清楚,不如不讲,等后面以后再学之。3问题问题n定性问题经常以二值信息形式出现:一个人是男还是女,结婚与否,一个人有还没有一台电脑等等。该问题可通过定义一个二值变量(binary variable)或一个0-1变量来刻画,此变量即为虚拟变量(dummy variable)n那么如何引入虚拟变量呢?4举例:一个虚拟变量设置举例:一个虚拟变量设置n设置原理如下:n n虚拟变量的取值n n虚拟变量的作用:n举例,举例,如类别变量n性别变量5该因素不起作用 0某种因素起作用 1d
3、设置方式设置方式n两种设置方式:n(1)n保留常数项和其中一个虚拟变量n(2)6iiiiuddy2211iiiudy22112)0|(iidyE212)1|(iidyE举例举例:多虚拟变量:多虚拟变量n举例:举例:季节变量有四个状态7其他季节春天 0 11 id其他季节夏天 0 12id其他季节秋天 0 13id其他季节冬天 0 14idiiiiiudddy4433221虚拟变量系数分析虚拟变量系数分析n通过例子的形式介绍虚拟变量系数的含义:n例子:例子:n n虚拟变量 n ,那么在其他条件相同的情况下,女人总体上挣的钱要比男人少。8001wagefemaleeducubb0(1,)(0,)E
4、 wage femaleeducE wage femaleeduc009Example of 0 0 xy0b0y=(b0+0)+b1xy=b0+b1xslope=b1d=0d=1100122wagemalefemaleeducubbbb122wagemalefemaleeducubbb1,femalemalemalefemale由于模型同时引入和将产生完全共线性,产生所谓的虚拟变量陷阱。2Rbb12将总截距去掉,将每一组的虚拟变量包括进来,男人的截距是,女人的截距是,因为没有总截距,所以不存在虚拟变量陷阱。但检验截距的差值更困难,而且对于不含截距项的回归计算方法没有一致同意的方法。11例例7
5、.1 是否存在性别歧视是否存在性别歧视0.025exp1.570.5720.141(0.72)(0.049)(0.021)(0.26)(1.810.012)wagefemaleereductenure2526,0.364nR7.10(0.21)(0.30)2.51wagefemale2526,0.116nR均值比较检验是否存在性别歧视?注意t值检验,同时,通常的对一个常数和一个虚拟变量进行简单回归时,是比较两组均值的直接方法,要通常的t统计量生效,我们还必须假定同方差性,这就意味着,对男人和女人而言,工资的总体方程式相同的。12例例7.2 拥有计算机拥有计算机 与大学与大学GPA0012col
6、GPAPChsGPAACTubbb1.260.4470.008(0.33)(0.057)(0.0940.157)colGPAPChsGPAACT(0.0105)2141,0.219nR0.157/0.572.75PCt13例例7.3 培训津贴对培训小时数的影响培训津贴对培训小时数的影响loglog46.670.986.07143.413.5426.255.539.88hrsempgrantsalesemploy24.7105,0.237grantnRt问题的关键是:定性变量所度量的影响是否为因果性?办法之一是,尽可能控制与虚拟变量及因变量相关的因素。14当因变量为当因变量为log(y)时对虚拟
7、变量系数的解释时对虚拟变量系数的解释n当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百百分比分比解释。在保持其他因素不变的情况下,一套殖民地建筑风格的住房的卖价预计高出约5.4%。15当y有较大比例变化时,如何更准确估计y变化的百分比?loglog0.297 1exp0.29710.257FMFMMwagewagewagewagewage 这表明,一个女人的工资比一个与他相当的男人的工资大致低25.7%。161022100122000220220220logloglogloglogloglog1exp1yyyxyyyyxyyyyxyyxyyxybbbbb 17多
8、元分类的虚拟变量多元分类的虚拟变量n在应用研究中,我们需要使用多个虚拟变量。在控制性别的基础上,研究婚姻状态的影响;在区域研究中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。虚拟变量可以描述包含序数的信息:信用等级18例7.6 工资方程估计一个工资对如下四组都不同的模型:已婚男人、已婚女人、单身男人、单身女人。首先选择基组:单身男人,对剩下的每一组定义一个虚拟变量,并称之为marrmal,marrfem,和singfem。因此,三个虚拟变量的估计量度量的都是与因此,三个虚拟变量的估计量度量的都是与单身男人相比,工资的比例差异。单身男人相比,工资的比例差异。19n如果
9、要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到:n在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。0.088/0.0521.69singfemt20通过虚拟变量来包含序数信息通过虚拟变量来包含序数信息n序数变量序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。01MBRCRbb其他因素2
10、11122CR1CR1CR0CR2CR1CR0可以考虑如下模型,其中,如果,则,否则;如果,则,否则;如此等等。即以等于零的信用等级作为基组,得到如下方程:011223344MBRCRCRCRCRb 其他因素MBR1,2,3,4jjj系数含义可解释为:保持其他因素不变,信用等级为级的城市和信用等级为的城市之间在上的差异其零级。中,。问题:两种估计方法中,哪种方法更优?22例例7.7 相貌吸引力对工资的影响相貌吸引力对工资的影响n在劳动力市场中,除了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人
11、估计方程得:23tt0.5如何解释两方程中相貌因素对工资的作用:对于男人组,那些相貌低于平均水平的人,在其他方面相同的情况下,预计比相貌处于平均水平的男人约少挣16.4%,且统计量为-3.57,表明这个影响在统计上是显著异于零的;类似地,相貌高于平均水平的男人预计要多挣约1.6%,尽管这种影响在统计上并不显著()。女人组的情况如何?通过这两个回归方程,你得到什么启示?24例例7.8 法学院排名对起薪的影响法学院排名对起薪的影响10,11 25,26 40,41 60,61100,1100toprrrr定义虚拟变量并让这些变量在排名落在相应的区间时取值。以排名在名以后的法学院为基组,所估计的方程
展开阅读全文