一般离散因变量模型和面板离散因变量模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《一般离散因变量模型和面板离散因变量模型课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一般 离散 因变量 模型 面板 课件
- 资源描述:
-
1、王中昭制作王中昭制作 如果回归模型的解释变量中含有定性变量,则可以用虚拟变量如果回归模型的解释变量中含有定性变量,则可以用虚拟变量进行处理。在实际经济问题中,被解释变量也可能是定性变量。如进行处理。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,是否签通过一系列解释变量的观测值观察人们对某项动议的态度,是否签订合同。对某一商品是否购买订合同。对某一商品是否购买(汽车或房子汽车或房子),某件事情的成功和失,某件事情的成功和失败,求职者对某种职业是否接受或者拒绝,那么这种选择就可以用败,求职者对某种职业是否接受或者拒绝,那么这种选择就可以用1或者
2、或者0来表示,这与解释变量的虚拟变量一样,只不过这里的变量来表示,这与解释变量的虚拟变量一样,只不过这里的变量为被解释变量,建模过程就较为复杂。为被解释变量,建模过程就较为复杂。 当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型。这里主要介绍二元选择模型或多元选择模型。这里主要介绍Tobit(线性概率)模(线性概率)模型,型,Probit(概率单位)模型和(概率单位)模型和Logit模型。模型。一、一般的离散因变量模型一、一般的离散因变量模型王中昭制作王中昭制作1Tobit(线性概率)模型(线性概率)模型To
3、bit模型的形式如下,模型的形式如下, Yt = + Xt + t (1)其中其中t为随机误差项,为随机误差项,Xt为解释变量,为解释变量, 和和 为待估计的参数。为待估计的参数。Yt为二元选择变量。此为二元选择变量。此模型由模型由James Tobit提出,因此得名。如利提出,因此得名。如利息税、机动车的费改税问题等。设息税、机动车的费改税问题等。设如果是第二种选择如果是第一种选择 0 1tYkkXXXX.),.,(2121王中昭制作王中昭制作例如有如下数据例如有如下数据,其其X和和Y的散点图为的散点图为:obsXY13211235103361043810534016421074350849
4、0194830105101115230125640135450145781155941012300350400450500550600XY王中昭制作王中昭制作 对对Yt取期望,取期望, E(Yt) = + Xt (2) 下面研究下面研究Yt的分布。因为的分布。因为Yt只能取两个值只能取两个值0和和1,所以,所以Yt 服从二项分布。把服从二项分布。把Yt的分布记为的分布记为: pt = P (Yt = 1) 1 - pt = P ( Yt = 0) 则则: E(Yt) = 1P ( Yt = 1) + 0P ( Yt = 0) = pt = P ( Yt = 1)(3) 由(由(2)和()和(3
5、)式有)式有 pt = P ( Yt = 1) = +Xt (4) 其中其中Yt的样本值是的样本值是0或或1,而预测值,而预测值(拟合值拟合值)是概率。是概率。 因此模型因此模型(2)称为线性概率模型称为线性概率模型.王中昭制作王中昭制作 以以pt=- 0.2+0.05Xt 为例,说明为例,说明Xt 每增加一个单位,每增加一个单位,则采用第一种选择则采用第一种选择(Yt = 1)的概率增加的概率增加0.05。假设用。假设用这个模型进行预测,当预测值落在这个模型进行预测,当预测值落在 0,1 区间之区间之内(即内(即Xt取值在取值在4, 24 之内)时,则没有什么问题;之内)时,则没有什么问题;
6、但当预测值落在但当预测值落在0,1 区间之外时,则会暴露出该区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是模型的严重缺点。因为概率的取值范围是 0,1,所以此时必须强令预测值(概率值)相应等于所以此时必须强令预测值(概率值)相应等于0或或1(见下图)。(见下图)。王中昭制作王中昭制作 采用线性回归的方式来构建二元选择模型,会导致如下采用线性回归的方式来构建二元选择模型,会导致如下问题:问题: (1)、模型的随机误差项不能满足同方差的假设)、模型的随机误差项不能满足同方差的假设常数的方差为但的期望值为因此为取这两个值的概率分别而时当时当得由)(1 ()1 ()()()1 ()()v
7、ar(:0)1)()(1 ()(:1)0()() 1()1(:011:22222tttttttttttttttttttttttttttttttttttttttXXXXXXEEEXXXXEXYPXPXYPXPXXY,YXXY,YXY王中昭制作王中昭制作 因为线性概率模型的随机误差项的方差不是一个常数,因因为线性概率模型的随机误差项的方差不是一个常数,因此不能用此不能用OLS来估计模型,线性概率模型往往使用极大似然来估计模型,线性概率模型往往使用极大似然法估计参数,有关极大似然法的推导见书法估计参数,有关极大似然法的推导见书P238-239。 logistic回归参数的极大似然估计具有如下性质回归
8、参数的极大似然估计具有如下性质:一是极大一是极大似然估计为一致估计。二是极大似然估计是渐进有效的,当似然估计为一致估计。二是极大似然估计是渐进有效的,当样本容量较大时,极大似然估计的方差小于其它方法的方差。样本容量较大时,极大似然估计的方差小于其它方法的方差。三是极大似然估计为渐进的正态分布。三是极大似然估计为渐进的正态分布。 因此变量的显著性检验是采用因此变量的显著性检验是采用Z统计量。统计量。(看相关的书:赵卫亚著(看相关的书:赵卫亚著计量经济学计量经济学,机械工业出版社,机械工业出版社,2008年年9月,月,p188-189)。)。iSZii王中昭制作王中昭制作 (2)、线性概率模型要求
9、、线性概率模型要求Yt的取值落入的取值落入0,1内,但是模型内,但是模型参数估计后,参数估计后,. 1 , 0导致不合理结果外的实际值可能落入,XYtt(3)、在线性概率模型)、在线性概率模型 P(Yt =1) = + Xt中,模型假设中,模型假设Yt=1的概的概率随率随Xt的变化而线性变化,这个假设通常与实际情况不相符。的变化而线性变化,这个假设通常与实际情况不相符。以家庭购买汽车为例,当某个家庭的年收入以家庭购买汽车为例,当某个家庭的年收入X很低时,即便给予很低时,即便给予这个家庭一定幅度的增加收入,其购买汽车的概率也不会比原来这个家庭一定幅度的增加收入,其购买汽车的概率也不会比原来增加多
10、少,当某个家庭的年收入增加多少,当某个家庭的年收入X很高时,因本来其购买汽车的很高时,因本来其购买汽车的概率就很大,即便再给予这个家庭一定幅度的增加收入,其购买概率就很大,即便再给予这个家庭一定幅度的增加收入,其购买汽车的概率也不会比原来增加多少,通常情况是:当汽车的概率也不会比原来增加多少,通常情况是:当X很大或者很大或者很小时,很小时,P(Yt =1)的变化均较缓慢,而当的变化均较缓慢,而当X取其它值时,取其它值时, P(Yt =1)的变化较快,的变化较快, P(Yt =1)与与Xt不是线性关系,如下图,因此必须要不是线性关系,如下图,因此必须要寻求符合这样非线性关系的模型。寻求符合这样非
11、线性关系的模型。XP王中昭制作王中昭制作 基于线性概率模型上述缺点,希望能找到一种基于线性概率模型上述缺点,希望能找到一种变变 换换,使模型满足如下条件使模型满足如下条件: (1)使解释变量)使解释变量Xt所对应的所有预测值(概率值)所对应的所有预测值(概率值)都落在(都落在(0,1)之间。)之间。 (2)同时对于所有的)同时对于所有的Xt,当,当Xt增加时,希望增加时,希望Yt也单也单调增加或单调减少。调增加或单调减少。 显然累积概率分布函数显然累积概率分布函数F(Zt) 能满足这样的要求。能满足这样的要求。采用累积正态概率分布函数的模型称作采用累积正态概率分布函数的模型称作Probit模型
12、。模型。用正态分布的累积概率作为用正态分布的累积概率作为Probit模型的预测概率。模型的预测概率。另外另外logistic函数也能满足这样的要求。采用函数也能满足这样的要求。采用logistic函函数的模型称作数的模型称作logit模型(服从模型(服从Logistic分布)。分布)。 王中昭制作王中昭制作 仍假定:Yt= + Xt2Probit(概率单位)模型(概率单位)模型)5.(21)(22tYuttdueYFp而 即即Yt 服从正态分布服从正态分布,其累积概率分布函数曲线其累积概率分布函数曲线在在pt = 0.5附近的斜率最大。对应附近的斜率最大。对应Yt在实轴上在实轴上的值,相应概率
13、值永远大于的值,相应概率值永远大于0、小于、小于1。显然。显然Probit模型比模型比Tobit模型更合理。模型更合理。Probit模型需模型需要假定要假定Yt 服从正态分布。服从正态分布。王中昭制作王中昭制作 该模型是该模型是McFadden于于1973年首次提出。其采用的年首次提出。其采用的是是logistic概率分布函数。其形式是:概率分布函数。其形式是:3logit模型模型)6.(1111)()()(ttXYttteeXFYFp对于给定的对于给定的Xt,pt表示相应个体做出某种选表示相应个体做出某种选择的概率。择的概率。王中昭制作王中昭制作 Probit曲线和曲线和logit曲线很相似
14、,曲线很相似, logit曲线近似于自由度为曲线近似于自由度为4的的t分布曲线。分布曲线。 两条曲线都是在两条曲线都是在pt=0.5处有拐点,但处有拐点,但logit曲线在曲线在两个尾部要比两个尾部要比Probit曲线厚。而且曲线厚。而且logit曲线计算上也比较方便,曲线计算上也比较方便,所以所以Logit模型比模型比Probit模型更常用。模型更常用。 王中昭制作王中昭制作)8.()1( ),1(:111e ),7.(11tY-ttttttttttYtXYppLnppLnY,pppept因此再两边取对数得两边颠倒则其中其中pt=P( Yt=1),由上式知回归方程的因变量是对数的某,由上式知
15、回归方程的因变量是对数的某个具体选择的机会比个具体选择的机会比(概率比)。回归系数概率比)。回归系数是是“对数发生对数发生比率比率”。相应地。相应地, Exp () 是是“发生比率发生比率”,以以1 为临界值,为临界值,根据变量类型的不同有相应的解释。自变量的发生比率是根据变量类型的不同有相应的解释。自变量的发生比率是相对于参照组而言的。当发生比率大于相对于参照组而言的。当发生比率大于1 时时(系数为正时系数为正时),表明其对应的自变量表明其对应的自变量(相对于参照组而言相对于参照组而言) 对结果对结果(pt =P( Yt=1)出现的概率有积极影响,且值越大,积极影响出现的概率有积极影响,且值
16、越大,积极影响越强;当发生比率小于越强;当发生比率小于1 时时(系数为负时系数为负时),表明其对应自变表明其对应自变量对结果出现概率有消极影响,且值越小,消极影响越强。量对结果出现概率有消极影响,且值越小,消极影响越强。王中昭制作王中昭制作 logit模型的一个重要优点是把在模型的一个重要优点是把在 0,1 区间区间上预测概率的问题转化为在实数轴上预测一个事上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。件发生的机会比问题。logit累积概率分布函数的累积概率分布函数的斜率在这斜率在这pt =0.5时最大,在累积分布两个尾端的时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于斜
17、率逐渐减小。说明相对于pt =0.5附近的解释变附近的解释变量量Xt的变化对概率(的变化对概率(P(Yt=1)的变化影响较大,的变化影响较大,而相对于而相对于pt接近接近0和和1附近的附近的Xt值变化进一步对概值变化进一步对概率的变化影响较小率的变化影响较小(即原来取即原来取Y=1或或Y=0的概率变的概率变化不大)。化不大)。ttttXYppLn)1(王中昭制作王中昭制作 南开大学国际经济研究所南开大学国际经济研究所1999级研究生考试分数级研究生考试分数及录取情况见下页数据表(及录取情况见下页数据表(N = 97)。定义变量)。定义变量SCORE=考生考试分数;考生考试分数;Y :考生录取为
18、:考生录取为1,未录取,未录取为为0;虚拟变量;虚拟变量D1:应届生为:应届生为1,非应届生为,非应届生为0。数据文件为:二元离散模型例数据文件为:二元离散模型例1.dta。例例1王中昭制作王中昭制作obsYSCORED1obsYSCORED1obsYSCORED111401134033216702750214010350332168027303139213603321690273141387037033117002721513841380330171026706137903903281720266171378040032817302631813780410328174026119137614
19、203211750260010137104303211760256011136204403181770252012136214503180780252113136114603161790245114035914703080800243115035814803081810242016135614903040820241017035615003031830239118035515103031840235019035415202991850232020035405302971860228121035315402940870219122035005502931880219123034905602931
20、89021412403490570292090021012503481580291191020412603471590291192019802703471600287193018912803441610286194018812903391620286095018213003380630282196016613103381640282197012303203361650282033033406602780数数据据表表王中昭制作王中昭制作 得得Logit模型估计结果如下模型估计结果如下命令:命令:logit y score d1 因为因为D1的系数没有显著性。说明的系数没有显著性。说明“应届生应届
21、生”和和“非应非应届生届生”不是决定是否录取的重要因素。剔除不是决定是否录取的重要因素。剔除D1。得。得Logit模型估计结果如下:模型估计结果如下:王中昭制作王中昭制作 如何分析?每增加一分,录取的概率如何分析?每增加一分,录取的概率pt增加多少?增加多少?注意是注意是Z统计量,而不是统计量,而不是T统计量。统计量。)6794411. 07361.243(11)(tScoretteYF:pLogit模型为王中昭制作王中昭制作7 .358115 . 0 5 . 0)6794411. 07361.243(Scroeep,tScore即处有拐点因为在拐点求法0.2.4.6.81Pr(y)02040
22、6080100t王中昭制作王中昭制作 选取选取Probit模型:在估计模型:在估计Probit模型过程中,模型过程中,D1的系数也没有显著性。剔除的系数也没有显著性。剔除D1,Probit模型最终估计结果是:模型最终估计结果是:拐点坐标拐点坐标 (358.5, 0.5),说明,说明358.5分以上录取概率大。分以上录取概率大。王中昭制作王中昭制作两种估计模型的部分预测结果如下表,两种估计模型的部分预测结果如下表,Probit模型模型Logit模型模型scoreYpiYpi37110.9997610.9997636210.90216810.90216836210.90216810.9021683
23、6110.82377210.82377235900.5456800.5456835800.37843100.37843135610.13527610.13527635600.13527600.13527635500.07347200.07347235400.03864300.03864335400.03864300.03864335300.01996900.01996935000.00264700.00264734900.00134300.00134334900.00134300.00134334810.9997610.99976王中昭制作王中昭制作 例题见例题见P245,某商业银行从历史贷款
24、客户某商业银行从历史贷款客户中随机抽取中随机抽取78个样本,根据抽设计的指标个样本,根据抽设计的指标体系分别计算它们的商业信用支持度(记体系分别计算它们的商业信用支持度(记为为XY)、市场竞争地位等级(记为)、市场竞争地位等级(记为SC)和)和是否决定贷款(记是否决定贷款(记JG)。)。数据文件为:二数据文件为:二元离散模型例元离散模型例2.dta ,研究,研究JG与与XY和和SC的的关系。关系。例例2王中昭制作王中昭制作probit模型和模型和logit模型的估计结果模型的估计结果检验显示,两个模型差不多。总体拟合优度较好,检验显示,两个模型差不多。总体拟合优度较好,但是变量的显著性较差。但
25、是变量的显著性较差。实证分析实证分析:如果有一个新客户,把他的如果有一个新客户,把他的XY和和SC资资料代入到模型中,就可决定是否贷款。料代入到模型中,就可决定是否贷款。王中昭制作王中昭制作 例例3 关于测度哈萨克斯坦居民贫困程度的二关于测度哈萨克斯坦居民贫困程度的二元选择模型(作者:国际粮食政策研究所的元选择模型(作者:国际粮食政策研究所的Surech BABU和和heValerie RHOE,世界野生,世界野生生物基金的生物基金的William Reidhead) 自自1991年哈萨克斯坦脱离前苏联独立以来,哈萨年哈萨克斯坦脱离前苏联独立以来,哈萨克斯坦居民贫困程度加剧。克斯坦居民贫困程度
展开阅读全文