数理统计第四章回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数理统计第四章回归分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 第四 章回 分析 课件
- 资源描述:
-
1、第四章 回归分析数理统计篇数理统计篇变量之间的关系分成两大类变量之间的关系分成两大类 1 1)确定性的关系)确定性的关系-一些变量的值确定后另一些变量的值一些变量的值确定后另一些变量的值 也随之确定也随之确定2 2)相关关系)相关关系 -变量之间虽然存在一定的依赖关系,但变量之间虽然存在一定的依赖关系,但 这种关系没有达到能由其中一个或多个来准确地决定这种关系没有达到能由其中一个或多个来准确地决定 另一个的程度另一个的程度 回归分析是研究相关关系的一种有力工具回归分析是研究相关关系的一种有力工具 1 1)从一组观察数据出发,确定这些变量之间的回归方程;)从一组观察数据出发,确定这些变量之间的回
2、归方程;2 2)对回归方程进行假设检验;)对回归方程进行假设检验;3 3)利用回归方程进行预测和控制)利用回归方程进行预测和控制 我们主要讨论线性回归方程。许多实际问题可以取我们主要讨论线性回归方程。许多实际问题可以取这种模型做为真实模型的近似这种模型做为真实模型的近似 4.1 回归分析概述 在不确定性关系中作为影响因素的变量称为自变量或解释变量,记为X;受X取值影响的响应变量称为因变量,用Y表示;令E(Y|X=x)=f(x),由随机因素引起的偏差是=Y-f(x)X与Y的不确定性关系表示为 Y=E(Y|X=x)+=f(x)+满足E=0,D=DY=2 通常假定 N(0,2);根据回归函数的不同形
3、式,可分为 多元非线性回归一元非线性回归非线性回归多元线性回归一元线性回归线性回归 数据数据 满足满足 ),(iiyxnibxayiii,2,1,其中误差其中误差 表示表示 中不能由中不能由 来表示的部分来表示的部分我们自然假设其均值为零,即我们自然假设其均值为零,即 通常还假设通常还假设它满足它满足:iiyibxa 0)(iE(1 1);niVari,2,1,)(2(2 2)jiCovji,0),(这些假设被称为这些假设被称为Gauss-MarkovGauss-Markov假设,这里第一条假假设,这里第一条假设误差设误差 是等方差的是等方差的.第二条则要求不同次的观测第二条则要求不同次的观测
4、误差是不相关的误差是不相关的.i(1)式中未知数)式中未知数 、是待估计参数,估计他们的是待估计参数,估计他们的最基本方法是最小二乘法,设最基本方法是最小二乘法,设 与与 是用最小二乘是用最小二乘法获得的估计,即所谓的最小二乘估计,将它们代法获得的估计,即所谓的最小二乘估计,将它们代入一元线性回归模型并略去误差项入一元线性回归模型并略去误差项 ,即对给定的,即对给定的 ,得到方程:,得到方程:aba bxxbay称为称为 关于的(经验)关于的(经验)回归方程,其图形称为回归回归方程,其图形称为回归直线直线.yy若随机变量若随机变量 与多个普通变量与多个普通变量有关,则可建立数学模型:有关,则可
5、建立数学模型:12,ppx xx(1)ppxbxbby110(3)其中未知数其中未知数 是不依赖于是不依赖于的未知参数,的未知参数,是常数,是常数,称为回归系数,称为回归系数,为误差项,称(为误差项,称(3)式为多元线性(理论)回归)式为多元线性(理论)回归模型模型pbbb,10pxxx,210bpbb,1若进行若进行 次独立测量,得到样本:次独立测量,得到样本:n),(111211yxxxp),(21nnpnnyxxx,它们都满足(它们都满足(3)式,即就每个数据)式,即就每个数据有:有:),(21iipiiyxxxiippiixbxbby110ni,2,1(5)其中其中 为对应于第为对应于
6、第 组数据的随机误差组数据的随机误差ii假设假设 ,并且满足,并且满足Gauss-Markov假设:假设:0)(iE(1 1);niVari,2,1,)(2(2 2)jiCovji,0),(引进矩阵记号表达多元线性回归模型(引进矩阵记号表达多元线性回归模型(5)会很方)会很方便,记便,记npnnppxxxxxxxxxX212222111211111nyyyY21pbbbB10p21则多元线性回归模型(则多元线性回归模型(5)与)与Gauss-Markov假设假设一起可以记为一起可以记为 XBY0)(EICov2)(6)这里这里 为为 的设计矩阵的设计矩阵.为为 的观测向的观测向量量.为为 的未
7、知数参数向量,的未知数参数向量,随机误差向量随机误差向量 为其协方差阵,为其协方差阵,是是 阶单位矩阵。当误差阶单位矩阵。当误差服从正态分布服从正态分布 .X)1(pnY1nB1n1p)(CovIn),0(2IN),(21iipiiyxxxpbbb,10pbbb,10有了观测数据有了观测数据 后,同样可以用最小后,同样可以用最小二乘法获得参数二乘法获得参数 的最小二乘估计,记为的最小二乘估计,记为 ,得多元线性回归方程:,得多元线性回归方程:ppxbxbby110(7)同理,(同理,(7)式是否真正描述了)式是否真正描述了 与与 的客观存在的关系还需进一步检验的客观存在的关系还需进一步检验yp
8、xxx,21第二节第二节 参数估计参数估计一、一元线性回归的参数估计一、一元线性回归的参数估计 最小二乘估计是数理统计中估计未知参数的一种重最小二乘估计是数理统计中估计未知参数的一种重要方法,现用它来求一元线性回归模型要方法,现用它来求一元线性回归模型:bxay中未知数中未知数 ,的估计值的估计值.ab最小二乘法的基本思想是:对一组观察值最小二乘法的基本思想是:对一组观察值),(,),(),(2211nnyxyxyx要使误差要使误差)(iiibxay的平方和的平方和),(baQ2112)(niiiniibxaya bab),(baQ达到最小的达到最小的 与与 做为未知数做为未知数 ,的估计,称
9、的估计,称其其为最小二乘估计在数学上这就归结为求二元函数为最小二乘估计在数学上这就归结为求二元函数 的最小值问题具体做法如下:的最小值问题具体做法如下:将将 分别对分别对 ,求偏导数,令他们等于零,求偏导数,令他们等于零,得到方程组:得到方程组:),(baQabniiiiniiixbxaybQbxayaQ110)(20)(2即即(9)niiiniiniininiiiyxxbxayxbna112111称为正规方程组,记称为正规方程组,记niixnx11niiyny11ix由于由于 不完全相同,正规方程组的系数行列式不完全相同,正规方程组的系数行列式ixniiniiniixxxn12112112n
10、iiniixxn0)(12niixxn由克拉姆法则克制(由克拉姆法则克制(7)式有唯一解)式有唯一解xbyaxxyyxxbniiniii)()(121(10)xbyaxbay将将 代入线性回归方程代入线性回归方程则线性回归方程也可表示为:则线性回归方程也可表示为:)(xxbyy(11)(11)式给出了最小二乘估计的几何意义当给定)式给出了最小二乘估计的几何意义当给定样本观察值样本观察值 后,散点图中后,散点图中直线很多直线很多.选取点选取点 ,与诸直线的,与诸直线的偏差平方和最小的这条直线是一条通过散点图的几偏差平方和最小的这条直线是一条通过散点图的几何中心何中心 ,斜率为,斜率为 的直线,可
11、以证明,在某的直线,可以证明,在某些假设下,些假设下,与与 是所有线性无偏估计中最好的是所有线性无偏估计中最好的.),(,),(),(2211nnyxyxyx),(iiyxni,2,1),(yxba b 上述确定回归直线所依据的原则是是所有观测上述确定回归直线所依据的原则是是所有观测数据的偏差平方和达到最小按照这个理论确定数据的偏差平方和达到最小按照这个理论确定回归直线的方法称其为最小二乘法回归直线的方法称其为最小二乘法 为了应用方便,引进记号如下:为了应用方便,引进记号如下:niixxxxS12)(niiyyyyS12)(niixyyyxxS1)(niiniiniiiyxnyx1111这样,
12、这样,的估计可以写成的估计可以写成abxbybxnynaSSbniiniixxxy1111(12)例例1 为研究商品的价格与销售量之间的关系,现收为研究商品的价格与销售量之间的关系,现收集某商品在一个地区集某商品在一个地区10个时间段内的平均价格个时间段内的平均价格(单位:元)和销售总额(单位:元)和销售总额 (单位:万元),统计(单位:万元),统计资料如表资料如表1所示求关于的线性回归方程所示求关于的线性回归方程 xyxy表表 1 1时间段12345678910(元)12.08.011.513.015.014.08.510.511.513.3(万元)11.68.511.412.213.013
13、.28.910.511.312.0解:解:为求线性回归方程,计算得为求线性回归方程,计算得y1012)(iixxxxS961.451012124.22)(iiyyyySx73.11101101iix3.117101iix故故26.11101101iiyy6.112101iiy故故15.13521niiiyx101)(iixyyyxxS101101101101iiiiiiiyxyx352.316.1123.11710115.13522590.373.116821.026.116821.0 xbyaSSbxxxy回归方程:回归方程:xy6821.02590.3最小二乘估计的性质最小二乘估计的性质:
14、(1)与与 分别是未知数分别是未知数 与与 的无偏估计,的无偏估计,即即 ,;a babaaE)(bbE)((2)假设)假设 ,则,则 与与 都服从正态都服从正态分布,即:分布,即:),0(2Nia b)1(,(2xxSxnaNa)1,(2xxSbNb这里,这里,niixxxxS12)(i一元线性回归模型中,误差一元线性回归模型中,误差 的方差的方差 ,由于由于 ,很自然地想到用,很自然地想到用 与与 分别代替分别代替 与与 得到得到 的估计,记为的估计,记为 ,即:,即:i2)(10iiixbbya babii)(10iiixbbyni,2,1通常称之为残差用残差就可以构造通常称之为残差用残
展开阅读全文