3+多元回归模型hf课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《3+多元回归模型hf课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 模型 hf 课件
- 资源描述:
-
1、第三章第三章 经典单方程计量经济学模型:经典单方程计量经济学模型:多元线性回归模型多元线性回归模型The Classical Single Equation Econometric Model:Multiple Linear Regression Model本章内容本章内容 3.1 多元线性回归模型概述多元线性回归模型概述 3.2 多元线性回归模型的参数估计多元线性回归模型的参数估计 3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验 3.4 多元线性回归模型的预测多元线性回归模型的预测 3.5 可化为线性的非线性模型可化为线性的非线性模型 3.6 受约束回归受约束回归3.1 3.1
2、 多元线性回归模型概述多元线性回归模型概述(Regression Analysis)一、多元线性回归模型一、多元线性回归模型二、多元线性回归模型的基本假设二、多元线性回归模型的基本假设一、多元线性回归模型一、多元线性回归模型 总体回归函数:总体回归函数:描述在给定解释变量描述在给定解释变量Xi条件下条件下被解释变量被解释变量Yi的条件均值。的条件均值。j称为称为偏回归系数偏回归系数(partial regression coefficients),表示在其他解释变量保持不变,表示在其他解释变量保持不变的情况下,的情况下,Xj每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化。的变化
3、。或者说或者说j给出了给出了Xj的单位变化对的单位变化对Y均值的均值的“直直接接”或或“净净”(不含其他变量)影响。(不含其他变量)影响。总体回归函数总体回归函数(PRF)(PRF)ikkiiikiiXXXXXYE221101),(总体回归模型总体回归模型(PRM)(PRM)i=1,2,n 总体回归模型:总体回归模型:是总体回归函数的是总体回归函数的随机表达形式随机表达形式说明:说明:k为解释变量的数目。为解释变量的数目。但习惯上,把常数项看成为虚变量的系数,该但习惯上,把常数项看成为虚变量的系数,该虚变量的样本观测值始终取虚变量的样本观测值始终取1 1。于是,模型中解释变量的数目为于是,模型
4、中解释变量的数目为(k+1+1)。iikkiiiXXXY22110总体回归模型的矩阵表示总体回归模型的矩阵表示121nnYYYY1)1(210kk121nnXY)1(212222111211111knnknnkkXXXXXXXXXX样本回归函数与样本回归模型样本回归函数与样本回归模型 从一次抽样中获得的总体回归函数的近似,称为从一次抽样中获得的总体回归函数的近似,称为样样本回归函数(本回归函数(sample regression function)。样本回归函数的随机形式,称为样本回归函数的随机形式,称为样本回归模型样本回归模型(sample regression model)。i=1,2,n
5、iikkiiieXXXY22110i=1,2,nikkiiiXXXY22110样本回归函数与样本回归模型的矩阵表示样本回归函数与样本回归模型的矩阵表示XYeXYk10neee21e二、多元线性回归模型的基本假设二、多元线性回归模型的基本假设对一元回归模型基本假设对一元回归模型基本假设的回忆与扩展的回忆与扩展 假设假设1:模型设定假设模型设定假设 正确性。正确性。The regression model is correctly specified.线性性。线性性。The regression model is linear in the parameters.iikkiiiXXXY22110
6、假设假设2:解释变量解释变量X假设假设 确定性。确定性。X values are fixed in repeated sampling.More technically,X is assumed to be nonstochastic.各解释变量各解释变量X之间之间不存在严格线性关系。不存在严格线性关系。There is no perfect multicollinearity among the explanatory variables.对于对于n k+1,rank(X)=k+1)1(212222111211111knnknnkkXXXXXXXXXX 假设假设3:X样本方差假设样本方差假设
7、 各解释变量的样本具有足够的变异性;各解释变量的样本具有足够的变异性;随着样本容量的无限增加,解释变量随着样本容量的无限增加,解释变量X的的样本方差趋于一有限常数。样本方差趋于一有限常数。nknknijijniijxxxxQnQXXnxnn11111212)(11xxx其中,或时,当 假设假设4:随机扰动项假设随机扰动项假设 0均值假设。均值假设。The conditional mean value of i is zero.由模型设定正确假设推断。由模型设定正确假设推断。同方差与无序列相关假设。同方差与无序列相关假设。Homoscedasticity,the conditional vari
8、ances of i are identical.是否满足需要检验。是否满足需要检验。()0,1,2,iiEXin()E X0IXX2)()(EVar15/100 假设假设5:X与随机项与随机项不相关。不相关。The covariances between Xi and i are zero.由确定性假设可以推断。由确定性假设可以推断。0XX)(EkjXXXCovkiij,10),(1 假设假设6:服从多维正态分布。服从多维正态分布。The s follow the normal distribution.)0(,21,NXXki),(2I0XN3.2 3.2 多元线性回归模型的估计多元线性回
9、归模型的估计 一、普通最小二乘估计一、普通最小二乘估计 二、参数估计量的性质二、参数估计量的性质 三、样本容量问题三、样本容量问题四、例题四、例题 补充:变量相对重要性比较补充:变量相对重要性比较说说 明明估计方法:估计方法:3大类方法:大类方法:OLS、ML或者或者MM 在经典模型中多应用在经典模型中多应用OLS 在非经典模型中多应用在非经典模型中多应用ML或者或者MM ML和和MM基本思路基本思路2章已介绍,本章略章已介绍,本章略一、普通最小二乘估计一、普通最小二乘估计(OLS)(OLS)kjniXYjii,2,1,0,2,1),(KikiiiiXXXY221102112)(niiinii
10、YYeQ2122110)(nikikiiiXXXY观测值观测值已知已知SRF形式形式 步骤:步骤:1 1、普通最小二乘估计及其矩阵表述、普通最小二乘估计及其矩阵表述残差平残差平方和方和kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110kjj,2,1,0,0000210QQQQkQMinnknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn212111211102112111111YXXX1)(条件?条件?YXX)X(由散式到矩阵:由散式到矩阵
11、:XXe=011121121110001in2iik1kknnkiieeXXXeX e=.XXXeX e X eX X=X YXY=XX+XeY=X+eXe因为样本回归函数为因为样本回归函数为 两边乘两边乘 有:有:因为因为 ,则正规方程为:,则正规方程为:2 2、正规方程组的另一种、正规方程组的另一种等价等价表达表达3 3、随机误差项、随机误差项 的方差的方差2的无偏估计的无偏估计 记住结论即可,证明不作要求!记住结论即可,证明不作要求!XYeMXXXXIXXXXXXXXXX)()()()(111e e M M MM为等幂矩阵为等幂矩阵)1()()()()(212121kntrtrtrEEX
12、XXXIXXXXIXXXXIee1)(2knEee12kneetr()为矩阵的迹,为矩阵的迹,满足交换律满足交换律Tr(AB)=tr(BA)二、参数估计量的性质二、参数估计量的性质说明说明 在满足基本假设的情况下,多元线性模型结构在满足基本假设的情况下,多元线性模型结构参数参数 的的普通最小二乘估计普通最小二乘估计具有具有线性性线性性、无偏无偏性性、有效性有效性。同时,随着样本容量增加,参数估计量具有同时,随着样本容量增加,参数估计量具有一一致性致性。利用矩阵表达,可以很方便地证明。利用矩阵表达,可以很方便地证明。注意证明过程中利用的基本假设。注意证明过程中利用的基本假设。理解其思路,记住结论
13、即可。理解其思路,记住结论即可。1、线性性、线性性利用假设利用假设5:5:E(X)=0XXXXXXXYXXX11)()()()()()(1EEEE2、无偏性、无偏性由估计量表达式直观得到由估计量表达式直观得到YXXX1)(3、有效性(最小方差性)、有效性(最小方差性)证明略证明略I2)(E三三、样本容量问题、样本容量问题1 1、最小样本容量最小样本容量 所谓所谓“最小样本容量最小样本容量”,即从最小二乘原理和,即从最小二乘原理和最大或然原理出发,欲得到参数估计量(不管其最大或然原理出发,欲得到参数估计量(不管其质量如何),所要求的样本容量的下限。质量如何),所要求的样本容量的下限。样本最小容量
14、,必须不少于模型中解释变量样本最小容量,必须不少于模型中解释变量的数目(包括常数项)的数目(包括常数项),即 n k+1+1为什么?为什么?2 2、满足基本要求的样本容量、满足基本要求的样本容量 从统计检验的角度从统计检验的角度:n30 时,Z检验才能应用;n-k8时,t分布较为稳定。一般经验认为一般经验认为:当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。模型的良好性质,只有在大样本下才能得到模型的良好性质,只有在大样本下才能得到理论上的证明。理论上的证明。四、例题四、例题教材例题:地区城镇居民消费模型教材例题:地区城镇居民消费模型 被解释变量:地区城镇居民人均消费被解释变量
15、:地区城镇居民人均消费Y 解释变量:解释变量:地区城镇居民人均可支配收入地区城镇居民人均可支配收入X1 前一年地区城镇居民人均消费前一年地区城镇居民人均消费X2 样本:样本:2006年,年,31个地区个地区数据数据地区 2006年消费支出 Y 2006年可支配收入 X1 2005年消费支出 X2 地区 2006年消费支出 Y 2006年可支配收入 X1 2005年消费支出 X2 北 京 14825.4 19977.5 13244.2 湖 北 7397.3 9802.7 6736.6 天 津 10548.1 14283.1 9653.3 湖 南 8169.3 10504.7 7505.0 河 北
16、 7343.5 10304.6 6699.7 广 东 12432.2 16015.6 11809.9 山 西 7170.9 10027.7 6342.6 广 西 6792.0 9898.8 7032.8 内蒙古 7666.6 10358.0 6928.6 海 南 7126.8 9395.1 5928.8 辽 宁 7987.5 10369.6 7369.3 重 庆 9398.7 11569.7 8623.3 吉 林 7352.6 9775.1 6794.7 四 川 7524.8 9350.1 6891.3 黑龙江 6655.4 9182.3 6178.0 贵 州 6848.4 9116.6 61
17、59.3 上 海 14761.8 20667.9 13773.4 云 南 7379.8 10069.9 6996.9 江 苏 9628.6 14084.3 8621.8 西 藏 6192.6 8941.1 8617.1 浙 江 13348.5 18265.1 12253.7 陕 西 7553.3 9267.7 6656.5 安 徽 7294.7 9771.1 6367.7 甘 肃 6974.2 8920.6 6529.2 福 建 9807.7 13753.3 8794.4 青 海 6530.1 9000.4 6245.3 江 西 6645.5 9551.1 6109.4 宁 夏 7205.6
18、9177.3 6404.3 山 东 8468.4 12192.2 7457.3 新 疆 6730.0 8871.3 6207.5 河 南 6685.2 9810.3 6038.0 变量间关系变量间关系6000800010000120001400016000500010000150002000025000X1Y600080001000012000140001600040006000800010000 12000 14000X2YOLSOLS估计结果估计结果37/100补充:补充:BetaBeta系数、系数、弹性弹性系数系数及偏相关系数及偏相关系数变量变量相对重要性相对重要性比较比较38/100
19、多元线性回归模型中,有时需要比较各个解释变多元线性回归模型中,有时需要比较各个解释变量的量的相对重要性相对重要性。因为偏回归系数因为偏回归系数的取值,受解释变量计量单位的取值,受解释变量计量单位影响。如果各解释变量的影响。如果各解释变量的计量单位不同计量单位不同,就不能直接,就不能直接应用偏回归系数应用偏回归系数比较。比较。因此,需要对偏回归系数加以调整。常用方法包因此,需要对偏回归系数加以调整。常用方法包括括 BetaBeta 系数系数、弹性系数弹性系数、偏偏相关系数相关系数。39/100BetaBeta 系数系数的计算如下:的计算如下:*/jjXYjjjXYSY SXSS(j=1,2,k)
20、*j表示表示jX变化一个标准差时,将使变化一个标准差时,将使Y变化多少标准差。变化多少标准差。它通过它通过解释变量的标准差解释变量的标准差与与被解释变量的标准差被解释变量的标准差的的比例比例对估计的偏回归系数进行对估计的偏回归系数进行调整调整,可用于直接比较多,可用于直接比较多元回归模型中各解释变量的相对重要性。元回归模型中各解释变量的相对重要性。40/100前例中,可知前例中,可知 122388.53294.52183.3YXXSSS 10.556 20.25。则。则 X1 及及 X2的的 Beta 系数:系数:1*110.766XYSS 2*220.229XYSS*1统计意义统计意义:解释
21、变量:解释变量 X1变化一个标准差时,将使变化一个标准差时,将使被解释变量被解释变量 Y 有有 0.70.76666 个标准差的变化。个标准差的变化。经济意义经济意义:20062006 年,年,我国各省区可支配收入我国各省区可支配收入变化一个变化一个标准差时,会使标准差时,会使消费消费支出支出变化变化 0.7050.705 个标准差。个标准差。可见,就该样本数据而言,可见,就该样本数据而言,消费支出对当期可支配收消费支出对当期可支配收入入变化变化的敏感程度,的敏感程度,大于大于对对前一期消费支出前一期消费支出变化变化的敏的敏感程度。感程度。41/100 弹性系数弹性系数及及平均弹性系数平均弹性
22、系数:/1 2,jjjjjjjjjXXdY YdYdXXdXYYjkXY 平均弹性系数平均弹性系数j表明,表明,在变量在变量平均值平均值周围周围,jX每变每变动动 1%,1%,将使将使Y变动?变动?%。其与解释变量的计量单位无。其与解释变量的计量单位无关,适宜进行多元回归模型中各解释变量相对重要关,适宜进行多元回归模型中各解释变量相对重要性的比较。性的比较。42/100在前例中,利用有关数据,计算平均弹性系数在前例中,利用有关数据,计算平均弹性系数 11111363.70.5560.7528401.5jXY 2227773.20.250.2318401.5XY 10.752表明在变量平均值周围
23、表明在变量平均值周围,可支配收入可支配收入(X1)每变动每变动 1%1%,将使,将使消费支出(消费支出(Y)变动变动 0.752%0.752%。可见,就该样本数据而言,可见,就该样本数据而言,消费支出对当期可支消费支出对当期可支配收入配收入变化变化的敏感程度,的敏感程度,大于大于对对前一期消费支出前一期消费支出变化变化的敏感程度。的敏感程度。43/100总结:比较各解释变量的相对重要性总结:比较各解释变量的相对重要性 偏回归系数偏回归系数 Beta 系数系数 弹性系数弹性系数 偏相关系数偏相关系数 当其它解释变当其它解释变量保持不变时,量保持不变时,某一解释变量某一解释变量变化一个单位变化一个
24、单位而使被解释变而使被解释变量平均改变的量平均改变的数值。数值。如计量单位不如计量单位不同,则不能直接同,则不能直接比较比较 kiSSyxjYXjjjj,2,122*表示表示jX变化变化一个标准差一个标准差时,将使时,将使Y变变化多少标准化多少标准差。差。可直接比较可直接比较 kjYXjj,2,1 表明在变量平均表明在变量平均值周围值周围,X每变每变动动 1%,将使将使Y变动?变动?%。与解释变量的计与解释变量的计量单位无任何关量单位无任何关系,适宜回答上系,适宜回答上述问题。述问题。在消除其它变量在消除其它变量影响的情况下影响的情况下,衡衡量多元回归模型量多元回归模型中某两个变量之中某两个变
25、量之间的相关程度。间的相关程度。用来确定多元回用来确定多元回归模型中不同变归模型中不同变量的相对重要性。量的相对重要性。21XYXr表示当表示当 X2不变时,不变时,Y 与与 X1的真实相关程度。的真实相关程度。3.3 3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model 一、拟合优度检验一、拟合优度检验 二、方程的显著性检验二、方程的显著性检验(F(F检验检验)三、变量的显著性检验三、变量的显著性检验(t(t检验检验)四、参数的置信区间四、参数的置信区间 一、拟合优度检验一、拟合
展开阅读全文