第八章-虚拟变量课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章-虚拟变量课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 虚拟 变量 课件
- 资源描述:
-
1、Company Logo2主要内容主要内容v一、为什么引入虚拟变量一、为什么引入虚拟变量v二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动v三、测量斜率变动三、测量斜率变动v四、分段线性回归四、分段线性回归Company Logo3一、为什么引入虚拟变量一、为什么引入虚拟变量v1.定量解释变量定量解释变量 诸如前几章介绍的,可以在取值范围内连续取值的诸如前几章介绍的,可以在取值范围内连续取值的解释变量,称作解释变量,称作定量解释变量定量解释变量。如:人均收入,农产。如:人均收入,农产品收购量,等。品收购量,等。v2.定性变量定性变量 如性别、民族、国籍、战争、自然灾害和政治体制如性别、民族
2、、国籍、战争、自然灾害和政治体制等,只表示某种特征的等,只表示某种特征的存在存在与与不存在不存在,称作,称作定性变量定性变量。Company Logo4一、为什么引入虚拟变量一、为什么引入虚拟变量 建立回归模型的过程中,被解释变量不仅受定量解建立回归模型的过程中,被解释变量不仅受定量解释变量影响,有时还受一些诸如如性别、民族、国籍、释变量影响,有时还受一些诸如如性别、民族、国籍、战争、自然灾害和政治体制等定性变量的影响。战争、自然灾害和政治体制等定性变量的影响。因此,当这些定性变量对被解释变量产生影响时,因此,当这些定性变量对被解释变量产生影响时,当然也应该包括在回归模型中。当然也应该包括在回
3、归模型中。Company Logo5一、为什么引入虚拟变量一、为什么引入虚拟变量v3.如何将定性变量引入模型如何将定性变量引入模型 由于定性变量通常表示的是某种特征或属性是否存由于定性变量通常表示的是某种特征或属性是否存在,如男性、女性,城市户口、非城市户口等,所以在,如男性、女性,城市户口、非城市户口等,所以量化方法可采用取值为量化方法可采用取值为0或或1。可以用可以用1表示该属性存在,表示该属性存在,0表示该属性不存在表示该属性不存在(也也可相反可相反)。Company Logo6一、为什么引入虚拟变量一、为什么引入虚拟变量v4.虚拟变量虚拟变量 上述这种取值为上述这种取值为0或或1的变量
4、称作虚拟变量,用的变量称作虚拟变量,用D(Dummy)表示。虚拟变量应用于模型中,对其回)表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。归系数的估计与检验方法与定量变量相同。当一个定性变量含有当一个定性变量含有m个类别时,应向模型引入个类别时,应向模型引入 m-1个虚拟变量。个虚拟变量。Company Logo7一、为什么引入虚拟变量一、为什么引入虚拟变量 比如比如“性别性别”含男性与女性两个类别,所以当含男性与女性两个类别,所以当“性性别别”作解释变量时,应向模型引入一个虚拟变量。取作解释变量时,应向模型引入一个虚拟变量。取值方式是:值方式是:01D(男性)(男性)
5、(女性)(女性)01D(女性)(女性)(男性)(男性)或或Company Logo8一、为什么引入虚拟变量一、为什么引入虚拟变量 再例如,定性变量再例如,定性变量“学历学历”还有四个类别,即大学还有四个类别,即大学学历、中学学历、小学学历和无学历。当学历、中学学历、小学学历和无学历。当“学历学历”作作解释变量时,应向模型引入(解释变量时,应向模型引入(4-1)三个虚拟变量,)三个虚拟变量,一种取值方式是:一种取值方式是:011D(大学学历)(大学学历)(非大学学历)(非大学学历)013D(小学学历)(小学学历)(非小学学历)(非小学学历)012D(中学学历)(中学学历)(非中学学历)(非中学学
6、历)Company Logo9一、为什么引入虚拟变量一、为什么引入虚拟变量v5.虚拟变量注意事项虚拟变量注意事项(1)当定性变量含有当定性变量含有m个类个类别时,模型不能引入别时,模型不能引入m个个虚拟变量。否则在虚拟变虚拟变量。否则在虚拟变量间会产生完全多重共线量间会产生完全多重共线性,无法估计回归参数。性,无法估计回归参数。例如:一年四季,取例如:一年四季,取m=4个虚拟变量。个虚拟变量。截距项对应的单位向量截距项对应的单位向量等于等于D1+D2+D3+D4。即出。即出现完全多重共线性。现完全多重共线性。t0D1 D2 D3 D41995.1110001995.2101001995.310
7、0101995.4100011996.1110001996.2101001996.3100101996.4100011997.11 Company Logo10一、为什么引入虚拟变量一、为什么引入虚拟变量(2)把虚拟变量取值为)把虚拟变量取值为0所对应的类别称作基础类别。所对应的类别称作基础类别。例如:按上面对例如:按上面对“学历学历”的赋值方法,的赋值方法,“无学历无学历”为为基础类别。基础类别。(3)当定性变量含有)当定性变量含有m个类别时,不能把虚拟变量的个类别时,不能把虚拟变量的值设成如下形式:值设成如下形式:110mD(第一个类别)(第一个类别)(第二个类别)(第二个类别)(第(第m
8、个类别)个类别)这种赋值法在一这种赋值法在一般情形下与虚拟变般情形下与虚拟变量赋值是完全不同量赋值是完全不同的两回事。的两回事。Company Logo11一、为什么引入虚拟变量一、为什么引入虚拟变量(4)回归模型可以只用虚拟变量作解释变量,也可以)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起作解释变量。用定量变量和虚拟变量一起作解释变量。Company Logo12二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动v下面给出的模型都属于测量截距变动的模型。下面给出的模型都属于测量截距变动的模型。iiiiiuDXYuDY21010以上面第二个模型为例,以上面第二个模型为
9、例,D=1、0时,回归函数分别是时,回归函数分别是iiiiXYEXYE10120)()()((D=1)(D=0)由此可见,向模型引入虚拟变量,其数学意义就是由此可见,向模型引入虚拟变量,其数学意义就是回归函数截距项发生变化。回归函数截距项发生变化。对虚拟变量的系数作显著性检验,就是判别两条回对虚拟变量的系数作显著性检验,就是判别两条回归直线的截距项是否存在显著性差异。归直线的截距项是否存在显著性差异。Company Logo13二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动v例例8.3 随机调查美国旧金山地区随机调查美国旧金山地区20个家庭的储蓄情况,个家庭的储蓄情况,拟建立年储蓄额拟建
10、立年储蓄额Yi(千美元千美元)对年收入对年收入Xi(千美元千美元)的回归的回归模型。模型。0.00.51.01.52.02.53.03.551015202530354045XY上部的上部的6个样本个样本点,都是自己有点,都是自己有房的家庭。房的家庭。下部的下部的14个样本个样本点,都是租房住点,都是租房住的家庭。的家庭。这两类家庭所对应的样本这两类家庭所对应的样本观测点各自都表现出明显观测点各自都表现出明显的不同的线性关系。的不同的线性关系。Company Logo14二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动 为研究不同住房状况家庭的储蓄情况,引入定性变量为研究不同住房状况家庭的储
11、蓄情况,引入定性变量“住房状况住房状况”,用,用D表示。表示。虚拟变量虚拟变量D定义如下:定义如下:建立回归模型:建立回归模型:01D(有房户)(有房户)(租房户)(租房户)iiiuDXY210Y年储蓄额年储蓄额Y(千美元千美元)X年收入年收入(千美元千美元)D住房状况住房状况Company Logo15二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动因为因为D不能作为不能作为Eviews的用户变量名,的用户变量名,所以虚拟变量的名称所以虚拟变量的名称取取D1。Company Logo16二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动27.2,99.0)0.11()9.16()2.5
12、(8273.00675.03204.02DWRDXYii 由于虚拟变量由于虚拟变量D的回归系数显著地的回归系数显著地不为零,说明对住不为零,说明对住房状况不同的两类房状况不同的两类家庭来说,回归函家庭来说,回归函数截距项确实明显数截距项确实明显不同。不同。(因为(因为D不能作为不能作为Eviews的用户变量名,的用户变量名,所以取所以取D1)Company Logo17二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动 当模型不引入虚拟变量当模型不引入虚拟变量“住房状况住房状况”时,得回归方程时,得回归方程如下如下:85.1,88.0)6.11()5.3(0963.05667.02DWRXY
13、ii 比较上述两个回归方程的统计检验指标,说明该比较上述两个回归方程的统计检验指标,说明该回归模型引入虚拟变量非常必要。回归模型引入虚拟变量非常必要。Company Logo18二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动 引入虚拟变量后,不同住房状况的居民的储蓄明显具引入虚拟变量后,不同住房状况的居民的储蓄明显具有不同的截距:有不同的截距:iiXY0675.05069.0(1)D=1时,即对于有房户时,即对于有房户(2)D=0时,即对于租房户时,即对于租房户iiXYCompany Logo19二、用虚拟变量测量截距变动二、用虚拟变量测量截距变动v例例8.4 季节影响季节影响 “季节季
展开阅读全文