第八章虚拟变量回归-资料课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章虚拟变量回归-资料课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 虚拟 变量 回归 资料 课件
- 资源描述:
-
1、1第八章虚拟变量回归计量经济学2在对在校学生的消费行为进行的调查中在对在校学生的消费行为进行的调查中,发现在校发现在校生的消费行为呈现多元化的结构。人际交往消费、生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。消费、学习用品类消费不突显。显然显然,男女生在消费上存在差异。为了了解男、女男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?生的消费支出结构差异,应当如何建立模型?面临
2、的问题:面临的问题:如何把男女生这样的非数量变量引如何把男女生这样的非数量变量引入方程?入方程?引子引子:男女大学生消费真有差异吗男女大学生消费真有差异吗?3 问题的一般性描述问题的一般性描述在实际建模中,一些在实际建模中,一些定性变量定性变量具有不可忽视的重要具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些的收入水平等
3、是值得考虑的重要影响因素,但这些因素共同的特征是因素共同的特征是定性描述定性描述的。的。如何对非定量因素进行回归分析?如何对非定量因素进行回归分析?采用采用“虚拟变量虚拟变量”对定性变量进行量化一种思路。对定性变量进行量化一种思路。4第八章第八章 虚拟变量回归虚拟变量回归 本章主要讨论本章主要讨论:虚拟变量虚拟变量 虚拟解释变量的回归虚拟解释变量的回归 虚拟虚拟被解释变量被解释变量的回归的回归(选讲选讲,不包括不包括)5第一节第一节 虚拟变量虚拟变量 本节基本内容本节基本内容:基本概念基本概念 虚拟变量设置规则虚拟变量设置规则 6一、基本概念一、基本概念定量因素:可直接测度、数值性的因素。定量
4、因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性定性因素:属性因素,表征某种属性存在与否存在与否的的 非数值非数值性的因素。性的因素。基本思想:基本思想:直接在回归模型中加入定性因素存在诸多的困难直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用化,以达到定性因素能与定量因素有着相同作用之目的。之目的。7计量经济学中,将计量经济学中,将取值为取值为0 0和和1 1的人工变量称为虚的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等拟变量。虚拟变量也称:哑元
5、变量、定性变量等等。通常用字母等。通常用字母D或或DUM加以表示(英文中虚拟加以表示(英文中虚拟或者哑元或者哑元Dummy的缩写)。的缩写)。对定性变量的量化可采用虚拟变量的方式实现。对定性变量的量化可采用虚拟变量的方式实现。一般设置某一属性存在则一般设置某一属性存在则d=1d=1,属性不存在则,属性不存在则d=0d=0。这样就这样就 把不能精确计量的定性因素用把不能精确计量的定性因素用0-10-1数字来数字来定量描述了。定量描述了。虚拟变量的定义虚拟变量的定义8虚拟变量的设置规则涉及三个方面虚拟变量的设置规则涉及三个方面:1.“0”1.“0”和和“1”1”选取原则选取原则 2.2.属性(状态
6、、水平)因素与设置虚拟变量属性(状态、水平)因素与设置虚拟变量数量的关系数量的关系 3.3.虚拟变量在回归分析中的角色以及作用等虚拟变量在回归分析中的角色以及作用等方面的问题方面的问题二、二、虚拟变量虚拟变量设置规则设置规则9 “0”“0”和和“1”1”选取原则选取原则l 虚拟变量取虚拟变量取“1”1”或或“0”0”的原则,应从分析问的原则,应从分析问题的目的出发予以界定。题的目的出发予以界定。l 从理论上讲,虚拟变量取从理论上讲,虚拟变量取“0”0”值通常代表比较值通常代表比较的基础类型的基础类型;而虚拟变量取;而虚拟变量取“1”1”值通常代表被值通常代表被比较的类型比较的类型。“0”0”代
7、表基期(比较的基础,参照物);代表基期(比较的基础,参照物);“1”1”代表报告期(被比较的效应)。代表报告期(被比较的效应)。10例如,比较收入时考察性别的作用。当研究男性收入是否例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有高于女性时,是将女性作为比较的基础(参照物),故有男性为男性为“1”1”,女性为,女性为“0”0”。例例1 1问题问题:为何只选为何只选0 0、1 1,选,选2 2、3 3、4 4行吗?为什么?行吗?为什么?D1男(1)=0女D()1 改革开放以后2 =0 改革开放以前1D天 气 阴()其 他13=02D()1天 气
8、 雨4=0其 他11定性因素的属性既可能为两种状态,也可能为多种定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(状态。例如,性别(男、女两种)、季节(4 4种状种状态),地理位置(东、中、西部),行业归属,所态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。有制,收入的分组等。属性的状态(水平)数与虚拟变量属性的状态(水平)数与虚拟变量数量的关系数量的关系 (0,1)(0,0)D D12(1,0)天气阴如:(,)=天气雨其 他121 1.若定性因素具有若定性因素具有 个个 相互排斥属性相互排斥属性(或或几个水平几个水平),当回归模型有截距项时,只
9、能引入,当回归模型有截距项时,只能引入 个虚拟变量;个虚拟变量;2.2.当回归模型无截距项时,则可引入当回归模型无截距项时,则可引入 个虚拟变个虚拟变量;否则,就会陷入量;否则,就会陷入“虚拟变量陷阱虚拟变量陷阱”。(为什(为什么?)么?)虚拟变量数量的设置规则虚拟变量数量的设置规则()m 2-1mmm13研究居民住房消费支出研究居民住房消费支出 和居民可支配收入和居民可支配收入 之间的之间的数量关系。回归模型的设定为:数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办?为了对为了对“城镇居民城镇居民”、“农村居民农村居民
10、”进行区分,分析进行区分,分析各自在住房消费支出各自在住房消费支出 上的差异,设上的差异,设 为城镇为城镇;为农村为农村,则模型为则模型为(模型有截距,模型有截距,“居民属性居民属性”定性变量只有两个相互排斥定性变量只有两个相互排斥的属性状态(的属性状态(),故只设定一个虚拟变量。),故只设定一个虚拟变量。)一个例子一个例子(虚拟变量陷阱虚拟变量陷阱)iXiY011iiiY=+X+u()01112iiiY=+X+D+u()1=1iDiY1=0iD2m14若对两个相互排斥的属性若对两个相互排斥的属性“居民属性居民属性”,仍然,仍然引入引入 个虚拟变量,则有个虚拟变量,则有则模型(则模型(1 1)
11、为)为则对任一家庭都有:则对任一家庭都有:,即产生完全共线,陷入了即产生完全共线,陷入了“虚拟变量陷阱虚拟变量陷阱”。“虚拟变量陷阱虚拟变量陷阱”的实质是:的实质是:完全多重共线性完全多重共线性。21=0iD农村居民城镇居民0111223iiiYXDDu()121D+D=11=0iD城镇居民农村居民1210D+D-=2m15三、虚拟变量的作用n属性因素代表:性别,所有制n非精确计量的数量因素的代表:教育程度,管理者素质,企业规模。n偶然因素或政策因素代表:战争、灾害、改革等。n时间序列里的季节或月份的代表。n分段回归,研究截距斜率变化。16虚拟变量既可作为被解释变量,也可作为解释虚拟变量既可作
12、为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如前沿领域,如MacFadden、Heckmen等人的微观计等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。量经济学研究,大量涉及到虚拟被解释变量的分析。本课程本课程只是讨论虚拟解释变量只是讨论虚拟解释变量的问题的问题 虚拟变量在回归模型中的角色虚拟变量在回归模型中的角色17第二节第二节 虚拟解释变量的回归虚拟解释变量的回归 本节基本内容本节基本内容:加法类型加法类型 乘法类
13、型乘法类型 虚拟解释变量综合应用虚拟解释变量综合应用18在计量经济学中,通常引入虚拟变量的方式分为在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即加法方式和乘法方式两种:即实质实质:加法方式引入虚拟变量改变的是加法方式引入虚拟变量改变的是截距截距;乘法方式引入虚拟变量改变的是乘法方式引入虚拟变量改变的是斜率斜率。0tttYXu1D1tttYXu2tX D0112iii Y=+X+u=+D=+D原原模模型型加加法法方方式式引引入入乘乘法法方方式式引引入入:19 以加法方式引入虚拟变量时,主要考虑的问以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数
14、。题是定性因素的属性和引入虚拟变量的个数。分为四种情形讨论:分为四种情形讨论:(1 1)解释变量只有一个定性变量而无定量变量,)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;而且定性变量为两种相互排斥的属性;(2 2)解释变量分别为一个定性变量(两种属性)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;和一个定量解释变量;一、加法类型一、加法类型20(3 3)解释变量分别为一个定性变量(两种)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;以上属性)和一个定量解释变量;(4 4)解释变量分别为两个定性变量(各自)解释变量分别为两个定性变量(各自
15、分别是两种属性)和一个定量解释变量;分别是两种属性)和一个定量解释变量;21(1 1)一个两种属性定性解释变量而)一个两种属性定性解释变量而无定量变量的情形无定量变量的情形010iiiiYY城市()0101()iiiiiiiYf DDYD模型形式:例如:010E=1=+E=0=iiiiY|DY|D那么:()1 0iD城市其中:(比较的基础:农村)农村农村22n这种类型实质是研究两类样本是否存在差别。通过判断系数是否显著。23(2)一个定性解释变量(两种属性)一个定性解释变量(两种属性)和一个定量解释变量的情形和一个定量解释变量的情形01011 0iiiiiiiiiiY=f(DX)+DY=D+X
16、+YXD模型形式,例如:城市其中:支出;收入;农村010|,1|,0iiiiiiiiE YXDXE YXDX()()010iiiiiiY=+X+Y=+X+()城市农村24共同的特征:共同的特征:由收入引起的平均消费变化由收入引起的平均消费变化是相同的,但是相同的,但截距发生改变截距发生改变。YX125(3 3)一个定性解释变量(两种以上)一个定性解释变量(两种以上属性)和一个定量解释变量的情形属性)和一个定量解释变量的情形1201 12233123()564110010iiiiiiY=f X D D.+YXDYDDDXDDD模型形式(如:民族有种特性;季度有 种特性)例如:啤酒售量、人均收入、
17、季度;一季度二季度其中:其它其它三季度其它,26单个是否显著用t检验判断,各个参数都为零的联合假设检验由F检验完成。11230112130213120311230E,1,0E,1,0()E,1,0()E,0iiiiiiiiY|X DDDXY|X DDDXY|X DDDXY|X DDDX一季度:二季度:三季度:四季度:基准:四季度()27n啤酒消费需求模型,为了分析城乡差别和季节差异,引入两个虚拟变量(这时不会有虚拟变量陷阱,因为这两个没有非此即彼关系)。(4 4)两个定性解释变量(均为两种属)两个定性解释变量(均为两种属性)和一个定量解释变量的情形性)和一个定量解释变量的情形,农村居民,城镇居
18、民,冬季,夏季为虚拟变量、为收入,表示啤酒需求量,01D01DDDYQuYDDQ3i2i3i2iiiii3i2i21i28夏季、城市居民夏季、农村居民1201E=1,=0=+iiiY|X,DDX()+120E|,0,0iiiYXDDX12012E|,1,1iiiYXDDX()1202E|,0,1()iiiYXDDX冬季、城市居民冬季、农村居民29上述图形的前提条件是什么?上述图形的前提条件是什么?DD121,1DD120,10DD121,00DD12,YX30 运用运用OLS得到回归结果,再用得到回归结果,再用t检验讨论因素检验讨论因素 是否对模型有影响。是否对模型有影响。01 122.ttt
19、kktttYDDDXu 加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望。条件期望。1201122E(/,.,).tttktttkkttY D DDDDDX 31加法方式引入虚拟变量的主要作用为:加法方式引入虚拟变量的主要作用为:1.1.在有定量解释变量的情形下,主要改变方程在有定量解释变量的情形下,主要改变方程 截距;截距;2.2.在没有定量解释变量的情形下,主要用于方在没有定量解释变量的情形下,主要用于方 差分析。差分析。32基本思想基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将以乘法方式引入虚拟变量时,是在所设立的模型中,将虚
20、拟虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,模型中,以达到其调整设定模型斜率系数的目的。或者将模以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。型斜率系数表示为虚拟变量的函数,以达到相同的目的。乘法引入方式乘法引入方式:(1 1)截距不变;)截距不变;(2 2)截距和斜率均发生变化;)截距和斜率均发生变化;分析手段:分析手段:仍然是条件期望。仍然是条件期望。二、乘法类型二、乘法类型33模型形式:模型形式:例:研究消费支出例:研究消费支出 受收入受收入 、年份状况、年份状况 的
21、影响的影响(1 1)截距不变的情形)截距不变的情形YX12121()10E|,1()E|,0ttttttttttttttYXDXYXDY X DXY X DX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份的基础上进行比较,(只有斜率系数发生改变)。12,tttttY=f X D XuD D34(2 2)截距和斜率均发生变化)截距和斜率均发生变化 例,同样研究消费支出例,同样研究消费支出 、收入收入 、年份状况、年份状况 间的影间的影 响关系。响关系。011201121()10E|,1()E|,0tttttttttttttttYXDD XYXDYXDXYXDX反常年份其中:消费
展开阅读全文