倾向值匹配模型-PSM模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《倾向值匹配模型-PSM模型课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 倾向 匹配 模型 PSM 课件
- 资源描述:
-
1、Q:为什么要使用PSM?A:解决样本选择偏误带来的内生性问题 例:上北大有助于提高收入吗?样本选择偏误:考上北大的孩子本身就很出色聪明、有毅力、能力强 解决方法:样本配对配对方法 同行业一维配对 同行业、规模相当二维配对 同行业、规模相当、股权构造相当、多维配对?PSM:把多个维度的信息浓缩成一个降维:多维到一维配对过程中的两个核心问题1 Q1:哪个样本更好一些?A1:Sample2较好:比较容易满足共同支撑假设common support assumption配对过程中的两个核心问题2 Q2:stu c1,c2,c3三人中,谁是stu PK的最正确配对对象?A2:stu c3是最正确配对对象
2、,比较容易满足平行假设balancing assumptionATTAverage Treatment Effect on the Treated平均处理效应的衡量 运用得分进展样本匹配并比较,估计出ATT值。ATT=EY(1)-Y(0)|T=1 Y(1):Stu PK 上北大后的年薪 Y(0):Stu PK 假设不上北大的年薪可观测数据可观测数据不可观测数据,不可观测数据,采用配对者的采用配对者的收入来代替收入来代替ATT=12W-9W=3W实例介绍实例介绍 研究问题:培训对工资的效应 根本思想:分析承受培训行为与不承受培训行为在工资表现上的差异。但是,现实可以观测到的是处理组承受培训的事实
3、,而如果处理组没有承受培训会怎么样是不可观测的,这种状态称为反事实。匹配法就是为了解决这种不可观测的事实的方法。实例介绍 分组:在倾向值匹配法中,根据处理指示变量将样本分为两个组。处理组,在本例中就是在NSW国家支持工作示范工程实施后承受培训的组;控制组,在本例中就是在NSW实施后不承受培训的组。研究目的:通过对处理组和对照组的匹配,在其他条件完全一样的情况下,通过承受培训的组处理组与不承受培训的组控制组在工资表现上的差异来判断承受培训的行为与工资之间的因果关系。变量定义变量变量定义定义treat接受培训(处理组)表示接受培训(处理组)表示1,没有接受培训(控制组)表示,没有接受培训(控制组)
4、表示0age年龄年龄educ受教育年数受教育年数black种族虚拟变量,黑人时,种族虚拟变量,黑人时,black=1hsip民族虚拟变量,西班牙人时,民族虚拟变量,西班牙人时,hsip=1marr婚姻状况虚拟变量,已婚,婚姻状况虚拟变量,已婚,marr=1re741974年实际工资年实际工资re751975年实际工资年实际工资变量定义re781978年实际工资年实际工资u74当在当在1974年失业,年失业,u74=1agesqage*ageeducsqeduc*educre74sqre74*re74re75sqre75*re75u74blcaku74*blcak倾向打分OLS回归结果工资的变化
5、到底是来自个体的异质性工资的变化到底是来自个体的异质性性还是培训?性还是培训?倾向打分 1.设定宏变量(1)设定宏变量breps表示重复抽样200次命令:global breps 200(2)设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black倾向打分 命令:pscore treat$x,pscore(mypscor
6、e)blockid(myblock)comsup numblo(5)level(0.05)logit 注:$表示引用宏变量pscore结果倾向值分布倾向值分布block中样本的分布block中的描述性统计运用得分进展样本匹配并比较方法一:最邻近方法方法一:最邻近方法nearest neighbor matchingnearest neighbor matching 含义:最邻近匹配法是最常用的一种匹配方法,它把控制组中找到的与处理组个体倾向得分差异最小的个体,作为自己的比较对象。优点:按处理个体找控制个体,所有处理个体都会配对成功,处理组的信息得以充分使用。缺点:由于不舍弃任何一个处理组,很可
7、能有些配对组的倾向得分差距很大,也将其配对,导致配对质量不高,而处理效应ATT的结果中也会包含这一差距,使得ATT准确度下降。方法一:最邻近方法方法一:最邻近方法nearest neighbor matchingnearest neighbor matching 命令 set seed 10101产生随机数种子 attnd re78 treat$x,comsup boot reps($breps)dots logit方法一:最邻近方法方法一:最邻近方法nearest neighbor matchingnearest neighbor matching方法二:半径匹配法方法二:半径匹配法radi
展开阅读全文