管理统计学-回归分析1课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理统计学-回归分析1课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 统计学 回归 分析 课件
- 资源描述:
-
1、线性回归模型线性回归模型1 1 回归分析概述回归分析概述一、线性回归模型的特征一、线性回归模型的特征二、线性回归模型的普遍性二、线性回归模型的普遍性三、线性回归模型的基本假设三、线性回归模型的基本假设一、线性回归模型的特征一、线性回归模型的特征1 1、线性回归模型的特征、线性回归模型的特征 一个例子一个例子 凯恩斯绝对收入假设消费理论:消费(C)是由收入(Y)唯一决定的,是收入的线性函数: C = + Y (2.2.1) 但实际上但实际上上述等式不能准确实现上述等式不能准确实现。 原因原因 消费除受收入影响外,还受其他因素的影响; 线性关系只是一个近似描述; 收入变量观测值的近似性:收入数据本
2、身并不绝对准确地反映收入水平。 因此因此,一个更符合实际的数学描述为一个更符合实际的数学描述为: C = + Y+ (2.2.2)其中: 是一个随机误差项,是其他影响因素的“综合体”。 线性回归模型的特征:线性回归模型的特征: 通过引入随机误差项,将变量之间的关系用一通过引入随机误差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学的方法来个线性随机方程来描述,并用随机数学的方法来估计方程中的参数;估计方程中的参数; 在线性回归模型中,被解释变量的特征由解释在线性回归模型中,被解释变量的特征由解释变量与随机误差项共同决定。变量与随机误差项共同决定。2 2、模型的理论方程中为什么必须包含
3、随机、模型的理论方程中为什么必须包含随机误差项?误差项? 从数学角度看,引入随机误差项,将变量从数学角度看,引入随机误差项,将变量之间的关系用一个线性随机方程来描述, 才能之间的关系用一个线性随机方程来描述, 才能用随机数学的方法来估计方程中的参数。用随机数学的方法来估计方程中的参数。 从经济学角度看, 客观经济现象是十分复从经济学角度看, 客观经济现象是十分复杂的,是很难用有限个变量、某一种确定的形杂的,是很难用有限个变量、某一种确定的形式来描述的,这就是设置随机误差项的原因。式来描述的,这就是设置随机误差项的原因。 (1)在解释变量中被忽略的因素的影响;)在解释变量中被忽略的因素的影响;
4、(2)变量观测值的观测误差的影响;)变量观测值的观测误差的影响;(3)模型关系的设定误差的影响;)模型关系的设定误差的影响;(4)其它随机因素的影响。)其它随机因素的影响。3 3、随机误差项主要包括哪些因素的影响?随机误差项主要包括哪些因素的影响?4. 单方程线性回归模型的一般形式 单单方方程程线线性性回回归归模模型型的的一一般般形形式式为为: iiiXXY22110ikikX i=1,2,n (2.1.3)其其中中,Y 称称被被解解释释变变量量,,21XXkX称称解解释释变变量量,k 为为解解释释变变量量的的数数目目,为为随随机机误误差差项项,i 为为观观测测值值下下标标,n 为为样样本本容
5、容量量, 012,k为为待待估估参参数数。二、线性回归模型的普遍性二、线性回归模型的普遍性 线性回归模型线性回归模型是计量经济学模型的主要形是计量经济学模型的主要形式,许多实际经济活动中经济变量间的复杂式,许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理,使之关系都可以通过一些简单的数学处理,使之化为数学上的线性关系。化为数学上的线性关系。1.1.线性的含义线性的含义对变量而言对变量而言对参数而言对参数而言 iiiXXY22110222110iiiXXY2.2.将非线性模型转化为线性模型的数学将非线性模型转化为线性模型的数学处理方法处理方法变量置换变量置换例如,例如,描述税收
6、与税率关系的拉弗曲线拉弗曲线:抛物线 s = a + b r + c r2 c0 s:税收; r:税率设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c0 变量置换仅用于变量非线性的情况。变量置换仅用于变量非线性的情况。 函数变换函数变换 例如例如,Cobb-Dauglas生产函数:幂函数 Q = AKLQ:产出量,K:投入的资本;L:投入的劳动 方程两边取对数: ln Q = ln A + ln K + ln L(3)(3)级数展开级数展开例如例如,不变替代弹性CES生产函数:方程两边取对数后,得到:对在=0处展开台劳级数,取关于的线性项,即得到一个
7、线性近似式。 QAKL()121LnQLnALnKL112()LnKL()12变量置换得到lnlnlnln(ln()YAmKmLmKL 12121 22ZXXX0112233结论:结论: 实际中的许多问题,都可以最终化为线性问题,实际中的许多问题,都可以最终化为线性问题,所以,线性回归模型有其普遍意义。所以,线性回归模型有其普遍意义。 即使对于无法采取任何变换方法使之变成线性即使对于无法采取任何变换方法使之变成线性的非线性模型,目前使用得较多的参数估计方的非线性模型,目前使用得较多的参数估计方法法非线性最小二乘法,其原理仍然是以线性非线性最小二乘法,其原理仍然是以线性估计方法为基础。估计方法为
8、基础。 线性模型理论方法在计量经济学模型理论方法的线性模型理论方法在计量经济学模型理论方法的基础。基础。Back:三、线性回归模型的基本假设三、线性回归模型的基本假设 对于线性回归模型,模型估计的任务是用回归对于线性回归模型,模型估计的任务是用回归分析的方法估计模型的参数。最常用的估计方分析的方法估计模型的参数。最常用的估计方法是普通最小二乘法。为保证参数估计量具有法是普通最小二乘法。为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。良好的性质,通常对模型提出若干基本假设。如果实际模型满足这些基本假设,普通最小二如果实际模型满足这些基本假设,普通最小二乘法就是一种适用的估计方法;乘法
9、就是一种适用的估计方法;如果实际模型如果实际模型不满足这些基本假设,普通最小二乘法就不再不满足这些基本假设,普通最小二乘法就不再适用,而要发展其它方法来估计模型。适用,而要发展其它方法来估计模型。 线性回归模型在上述意义上的基本假设线性回归模型在上述意义上的基本假设 (1)解释变量)解释变量X1,X2,Xk 是确定性变是确定性变量,不是随机变量;解释变量之间互不相关。量,不是随机变量;解释变量之间互不相关。 (2)随机误差项具有均值和同方差。即)随机误差项具有均值和同方差。即 E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n (5)随机误差项服从均值、同方差的正态)随机
10、误差项服从均值、同方差的正态分布。即分布。即 iN(0, 2 ) i=1,2, ,n(3)随机误差项在不同样本点之间是独立的)随机误差项在不同样本点之间是独立的,不存在序列相关。即,不存在序列相关。即 Cov(i, j)=0 ij i,j= 1,2, ,n(4)随机误差项与解释变量之间不相关。即)随机误差项与解释变量之间不相关。即 Cov(Xji, i)=0 j=1,2, ,k i=1,2, ,n 重要提示重要提示 几乎没有哪个实际问题能够同时满足所有基本假设;几乎没有哪个实际问题能够同时满足所有基本假设; 通过模型理论方法的发展,可以克服违背基本假设通过模型理论方法的发展,可以克服违背基本假
11、设带来的问题;带来的问题; 违背基本假设问题的处理构成了单方程线性模型的违背基本假设问题的处理构成了单方程线性模型的理论方法的主要内容:理论方法的主要内容: 异方差问题(违背同方差假设)异方差问题(违背同方差假设) 序列相关问题(违背序列不相关假设)序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设)共线性问题(违背解释变量不相关假设) 随机解释变量(违背解释变量确定性假设)随机解释变量(违背解释变量确定性假设)Back2 2 线性回归模型的参数估计线性回归模型的参数估计 -普通最小二乘法 假定变量假定变量yt与与k k 个变量个变量x xjtjt, , j j = 1,
12、= 1, , , k k ,存在线性关系。多元线性回归模型表,存在线性关系。多元线性回归模型表示为:示为:tKtktttuXXXy22110 其中其中y yt t是被解释变量(因变量),是被解释变量(因变量),x xjtjt 是解释变是解释变量(自变量),量(自变量),u ut t是随机误差项,是随机误差项, i i, , i i = 0, = 0, 1, 1, , , k k 是回归参数(通常未知)。这说明是回归参数(通常未知)。这说明x xjtjt, , j j = 1, = 1, , , k k, , 是是y yt t的重要解释变量。的重要解释变量。 u ut t代表众多影响代表众多影响
13、y yt t变化的微小因素。变化的微小因素。l模型描述模型描述ikikiiikiiiiuXXXYniXXXYn2211021,2, 1),(,得:样本观测值为的样本当给定一个容量为nknknnnkkkkuXXXYuXXXYuXXXY2211022222121021121211101即形式矩阵形式uuuXXXXXXXXXYYYnkknkknnn2121021222211121121111UXBYuuuXXXXXXXXXYYYnkknkknnnUBXY2121021222211121121111令2 2 线性回归模型的参数估计线性回归模型的参数估计 1. 普通最小二乘法普通最小二乘法(OLS) 最
14、小二乘最小二乘 法法(OLS)的原理是通过求残差的原理是通过求残差(误差项的估计值)平方和最小确定回(误差项的估计值)平方和最小确定回归参数估计值。这是求极值问题。用归参数估计值。这是求极值问题。用Q表示残差平方和,求其最小值条件下的表示残差平方和,求其最小值条件下的回归参数的估计值。回归参数的估计值。 nininiiXXYYYQkikiiiie1212121100000210kQQQQkikiiiikikiiiXXXYeXXXY2211022110iiiYYeminQ00001102110211101110XXXxYXXXXYXXXXYXXYkikikikiiikikiiiikikiiiki
15、kii得到下列方程组得到下列方程组求参数估计值的实质是求一个求参数估计值的实质是求一个k k+1+1元方程组元方程组正规方程正规方程变成矩阵形式ikikkiikiikiiiikikiiiikikiiYXXXXXXXYXXXXXXXYXXXnkii222110111222110221101ikiiiikkiikiikiikiiiikiiiYXYXYXXXXXXXXXXXXXXXnkii121022111221211YXXXBYXBXX1)(22111221121kikiikiikiikiiiiikiiiXXXXXXXXXXXXXXXnXXkB210ikiiiiYXYXYYX1uuuXXXXXXX
16、XXYYYnkknkknnnUBXY2121021222211121121111令最小二乘法的矩阵表示1002)()()()(), 0(2112212kneeYXXXBBXXYXBQBXXBYXBYYYXBBXYBXXBYXBBXYYYBXYXBYQBXYBXYeeBXYYYEyyQeBXYINUUXBYBXYniniiiie?为什么正规方程的结构正规方程的结构Y 被解释变量观测值被解释变量观测值 n x 1X 解释变量观测值(含虚拟变量解释变量观测值(含虚拟变量n x (k+1) )XX 设计矩阵(实对称设计矩阵(实对称(k+1) x (k+1)矩阵矩阵 )XY 正规方程右端正规方程右端 (
17、k+1) x 1 回归系数矩阵回归系数矩阵 (k+1) x 1 高斯乘数矩阵,高斯乘数矩阵, 设计矩阵的逆设计矩阵的逆 残差向量(残差向量( n x 1 ) 被解释变量的拟合(预测)向量被解释变量的拟合(预测)向量 n x 1B1)(XXeYYXXXBYXBXX1)(2.最小二乘估计量的性质最小二乘估计量的性质 线性(估计量都是被解释变量观测值的线性组合) 无偏性(估计量的数学期望=被估计的真值) 有效性(估计量的方差是所有线性无偏估计中最小的)1)1)线性线性YXXXB)(1因为因为X X的元素是非随机的,的元素是非随机的,( (X X X X) ) -1-1X X是一个常数矩阵,由上式知是
18、一个常数矩阵,由上式知是是Y Y的线性组合,为线性估计量。具有线性特性的线性组合,为线性估计量。具有线性特性B2) 2) 无偏特性无偏特性有无偏性。的线线性无偏估计量, 是B (3.12) B = E(u) XX)(X+ = u) + (X XX) E(X = Y XX) E(X = ) E( ,可得0 = E(u)利用1 -1 - 1 -BBBB3) 3) 有效性有效性)()()()()()()()()()()()()()()() )()()() )()(1111111111122)1()1(XXXXXXXXUUEXXXUUEXXXXXXUUXXXEBUXBXXXBUXBXXXEBYXXXB
19、YXXXEBBBBEBEBBEBEBCovxExExCovkk具有最小方差特性。具有最小方差特性。随机误差项的方差随机误差项的方差 的估计量的估计量22 M = M M2=MM = M 利用上述性质,残差平方和利用上述性质,残差平方和 e e = (M u) (M u) = u M M u= u M u= u I - X (X X )-1 X uE(e e) = E tru (I - X (X X )-1 X ) u = tr( I - X (X X )-1 X ) E(u u )=(n-K-1)12knee3. 3. 样本容量问题样本容量问题 样本是一个重要的实际问题,模型依赖于实际样本。样
20、本是一个重要的实际问题,模型依赖于实际样本。 获取样本需要成本,企图通过样本容量的确定减轻获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。收集数据的困难。 最小样本容量:满足基本要求的样本容量最小样本容量:满足基本要求的样本容量样本容量问题样本容量问题(XX)-1存在存在| XX |0 XX 为为k+1阶的满秩阵阶的满秩阵R(AB) min(R(A),R(B)R(X) k+1因此,必须有因此,必须有nk+1,此为最小样本容量,此为最小样本容量YXXXB1)(满足基本要求的样本容量满足基本要求的样本容量 一般经验认为:n 30或者n 3(k+1)才能满足模型估计的基本要求。n 3(k
21、+1)时,t分布才稳定,检验才较为有效3 3 线性回归模型的统计检验线性回归模型的统计检验1 1 拟合优度检验拟合优度检验2 2 方程的整体显著性方程的整体显著性3 3 参数的显著性检验参数的显著性检验 回归分析是要通过样本所估计的参数来代替总体的回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归。真实参数,或者说是用样本回归线代替总体回归。 尽管从统计性质上已知,如果有足够多的尽管从统计性质上已知,如果有足够多的重复重复 抽抽样,样,参数的估计值的期望(均值)就等于其总体的参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于
22、参数真值,但在一次抽样中,估计值不一定就等于该真值。该真值。 那么,在一次抽样中,参数的估计值与真值的差异那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。有多大,是否显著,这就需要进一步进行统计检验。 主要包括主要包括拟合优度检验、变量的显著性检验及模型拟合优度检验、变量的显著性检验及模型整体的显著性检验。整体的显著性检验。1.1.拟合优度检验拟合优度检验 拟合优度拟合优度指用指用 样本回归线对样本观察值的样本回归线对样本观察值的拟合程度拟合程度. .(1) 总离差平方和的分解总离差平方和的分解YX0*9Y*Y9YYYyiiYYyiiiiiYYeYYy
展开阅读全文