违背基本假设的情况课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《违背基本假设的情况课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 违背 基本 假设 情况 课件
- 资源描述:
-
1、第第4 4章章 违背基本假设的情况违背基本假设的情况 4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计4.3 多元加权最小二乘估计4.4 自相关性问题及其处理 4.5 异常值与强影响点 4.6 本章小结与评注 第四章第四章 违背基本假设的情况违背基本假设的情况),2,1,()(,2,1,)(ni,j j0 ,ij,i,cov n0,iE2jiiGauss-Markov条件 4.1 4.1 异方差性产生的背景和原因异方差性产生的背景和原因 一、异方差产生的原因一、异方差产生的原因 例例4.1 4.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额
2、,一个简单的消费模型为:yi=0+1xi+i,i=1,2,n低收入的家庭购买差异性比较小,高收入的家庭购买行为差异就很大。导致消费模型的随机项i具有不同的方差。4.1 4.1 异方差性产生的背景和原因异方差性产生的背景和原因 二、异方差性带来的问题二、异方差性带来的问题 当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 一、异方差性的检验一、异方差性的检验(一)残差图分析法(一)残差图分析法 图2.5(b)存在异方差4.2
3、4.2 一元加权最小二乘估计一元加权最小二乘估计 一、异方差性的检验一、异方差性的检验(二)等级相关系数法(二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 (二)等级相关系数法(二)等级相关系数法 第二步,取ei的绝对值,分别把xi和|ei|按递增(或递减)的次序分成等级,按下式计算出等级相关系数:niisdnnr122)1(61其中,n为
4、样本容量,di为对应于xi和|ei|的等级的差数。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 (二)等级相关系数法(二)等级相关系数法 第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数rs进行t检验。检验统计量为:如果tt/2(n-2)可认为异方差性问题不存在,如果tt/2(n-2),说明xi与|ei|之间存在系统关系,异方差性问题存在。212ssrrnt4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 例例4.3 4.3 设某地区的居民收入与储蓄额的历史统计数据如表4.1。(1)用普通最小二乘法建立储蓄y与居民收入x的回归方程,并画出残差散点
5、图;(2)诊断该问题是否存在异方差;序号 储蓄y(万元)居民收入x(万元)1 2 3 3126410590230087779210995438200 4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 序号储蓄y居民收入xxi等级残差ei|ei|ei|等级di126487771169.0169.016-15225210592102-26.626.63-1139099543-104.6104.67-4164131105084-110.5110.58-4165122109795-159.4159.415-101006107119126-253.4253.423-172897406127477
6、-25.125.1252585031349988.28.217499431142699-129.0129.0900105881552210-78.078.04636118981673011129.7129.71011129501766312102.7102.76636137791857513-145.5145.514-11148191963514-195.3195.319-525151222211631578.478.45101003123003820031-286.1286.1247492id4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 X40000300002000010000
7、0Unstandardized Residual6004002000-200-400-600图图4.1 残差图残差图4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 用用SPSSSPSS计算等级相关系数。计算等级相关系数。Correlations1.000.686.0003131.6861.000.000.3131Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)NABSEXSpearmans rhoABSEX4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 (2 2)计算等级相
8、关系数。)计算等级相关系数。6859.01558)131(31612sr076.56859.016859.02312t4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 Spearman等级相关系数可以反映非线性相关的情况,Pearson简单相关系数不能反映非线性相关的情况。例如x与y的取值如下,序号1 2 3 4 5 6 7 8 9 10 x1 2 3 4 5 6 7 8 9 10y1 4 9 16 25 36 49 64 81 1002iixy 容易计算出y与x的简单相关系数r=0.9746,而y与x的等级相关系数rs=1具有完全的曲线相关。4.2 4.2 一元加权最小二乘估计一元加
9、权最小二乘估计 二、一元加权最小二乘估计二、一元加权最小二乘估计消除异方差性的方法通常有:l 加权最小二乘法,l Box-Cox变换法,l 方差稳定性变换法加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 二、一元加权最小二乘估计二、一元加权最小二乘估计 )()(),(11210210niniiiiixyyyQ一元线性回归普通最小二乘法的残差平方和为:一元线性回归的加权最小二乘的离差平方和为:niiiiniiiiwxywyywQ12101210)()(),(4.2 4.2 一元加
10、权最小二乘估计一元加权最小二乘估计 加权最小二乘估计为:211110)()(niwiiwiniwiiwwwwwxxwyyxxwxy其中,iiiwxwwx1iiiwywwy1是自变量的加权平均;是因变量的加权平均。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 观测值的权数应该是观测值误差项方差的倒数,即21iiw在实际问题中,误差项的方差是未知的,常与自变量x的幂函数xm成比例,其中m是待定的未知参数。此时权函数为miixw14.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 三、寻找最优权函数三、寻找最优权函数利用SPSS软件可以确定幂指数m的最优取值。依次点选Analyze
11、-Regression-Weight Estimation进入估计权函数对话框,默认的幂指数m的取值为m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0。先将因变量y与自变量x选入各自的变量框,再把x选入Weight变量框,幂指数(Power)取默认值,计算结果如下(格式略有变动):4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 Log-likelihood Function=-224.258830 POWER value=-2.000Log-likelihood Function=-221.515008 POWER value=-1.500Log-lik
12、elihood Function=-218.832193 POWER value=-1.000Log-likelihood Function=-216.252339 POWER value=-.500Log-likelihood Function=-213.856272 POWER value=.000Log-likelihood Function=-211.773375 POWER value=.500Log-likelihood Function=-210.185972 POWER value=1.000Log-likelihood Function=-209.316127 POWER v
13、alue=1.500Log-likelihood Function=-209.379714 POWER value=2.000The Value of POWER Maximizing Log-likelihood Function=1.500Log-likelihood Function=-209.316127 4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 Multiple R .96744R Square .93595Adjusted R Square .93374Standard Error .12532 DF Sum of Squares Mean Square F Sig
14、Regression 1 6.6548981 6.6548981 423.741 0.000Residuals 29 .4554477 .0157051Analysis of Variance:Variable B SE B Beta T Sig TX .08793 .004272 .967443 20.585 .0000(Constant)-719.12 78.316 -9.182 .0000Variables in the Equation4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 幂指数m的最优取值为m=1.5。加权最小二乘的r2=0.9360,F值=423.741;普通最
15、小二乘的r2=0.912,F值=300.732。说明加权最小二乘估计的效果好于普通最小二乘的效果。4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 X400003000020000100000Unstandardized Residual6004002000-200-400-600图图4.2 加权最小二乘残差图残差图加权最小二乘残差图残差图4.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 iyixiwieiwe 序号小方差组126487771.2161E-06169211210592101.1314E-06-271439099541.0069E-06-105-664131105
16、089.2837E-07-111-745122109798.6927E-07-159-1246107119127.6917E-07-253-2217406127476.9485E-07-2548503134996.3760E-078359431142695.8669E-07-129-10510588155225.1710E-07-78-584.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 iyixiwieiwe 序号中等方差组11898167304.6212E-0713014612950176634.2599E-0710311613779185753.9501E-07-146-1351
17、4819196353.6346E-07-195-188151222211633.2481E-077880161702228802.8895E-07413409171578241272.6684E-07183176181654256042.4408E-07134122191400265002.3181E-07-195-211201829276702.1726E-07134115212200283002.1005E-074524314.2 4.2 一元加权最小二乘估计一元加权最小二乘估计 iyixiwieiwe 序号大方差组222017274302.2012E-073433242321052956
18、01.9676E-07250225241600281502.1173E-07-135-156252250321001.7388E-07180147262420325001.7068E-07317281272570352501.5110E-07234190281720335001.6309E-07-468-507291900360001.4640E-07-500-546302100362001.4519E-07-317-364312300382001.3394E-07-286-3404.3 4.3 多元加权最小二乘多元加权最小二乘 当误差项i存在异方差时,加权离差平方和为niippiiiiwxx
19、xywQ1222110)(nwww 21W W记 WyWyX XWXWXX X-1w)(加权最小二乘估计WLS的矩阵表达4.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 通常取权函数W为某个自变量xj(j=1,2,,p)的幂函数,即,在x1,x2,xp这p个自变量中取哪一个?这只需计算每个自变量xj与普通残差的等级相关系数,选取等级相关系数最大的自变量构造权函数。mjxW 4.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 例例4.4 4.4 续例3.2,研究北京市各经济开发区经济发展与招商投资的关系。因变量y为各开发区的销售收入(百万元),x1为截至1998年底各开发区累计招商
20、数目,x2为招商企业注册资本(百万元)。计算出普通残差的绝对值abse=|ei|与x1、x2的等级相关系数,re1=0.443,re2=0.721,因而选取x2构造权函数。4.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 Correlations1.000.443.721.098.002151515.4431.000.432.098.108151515.721.4321.000.002.108.151515Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)NCorrelation Coe
21、fficientSig.(2-tailed)NABSEX1X2Spearmans rhoABSEX1X24.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 仿照例4.3,用Weight Estimate估计幂指数m,得m的最优值为m=2。由于m=2是在默认范围-2,2的边界,因而应该扩大范围重新计算。取m从1到5,步长仍为0.5,得m的最优值为m=2.54.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 Multiple R .92163R Square .84941Adjusted R Square .82431Standard Error .03238 DF Sum of Sq
22、uares Mean Square F SigRegression 2 .07096521 .03548261 33.84 0.000Residuals 12 .01258145 .00104845Variable B SE B Beta T Sig TX1 1.696439 .404370 .587146 4.195 .0012X2 .470312 .149306 .440853 3.150 .0084(Constant)-266.9621 106.742 -2.501 .02794.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 加权最小二乘的R2=0.84941,F值=33.84;
23、普通最小二乘的R2=0.842,F值=31.96。加权最小二乘估计的拟合效果略好于普通最小二乘。加权最小二乘的回归方程为:=-266.96+1.696x1+0.4703x2普通最小二乘的回归方程为:=-327.039+2.036x1+0.468x2y y 4.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 方差稳定变换 4.3 4.3 多元加权最小二乘估计多元加权最小二乘估计 Box-Cox变换 0,ln0,1)(YYY4.4 4.4 自相关性问题及其处理自相关性问题及其处理 如果一个回归模型的随机误差项cov(i ,j)0则称随机误差项之间存在着自相关现象。这里的自相关现象不是指两个或
展开阅读全文