第九章回归分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第九章回归分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 章回 分析 课件
- 资源描述:
-
1、1第九章第九章 回归分析回归分析n 一元线性回归分析一元线性回归分析n 多元线性回归分析简介多元线性回归分析简介 2 在现实问题中处于同一个过程中的一些变量往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两类.一类是确定性关系确定性关系,即数学上的函数关系.引引 言言 例如:n 在匀速直线运动中,当速度 给定时,路程 与 运动时间 的关系 .n 圆的面积 与半径 之间的关系 .vvSvtS vtS StSr2rS3 另一类是非确定性关系非确定性关系,又叫相关关系相关关系. 例如:n 小麦亩产量 与施肥量 ,小麦品种 ,浇水量之间的关系 .vSvtS Y1X2X3X变量之间的关系变量之间
2、的关系确定性关系确定性关系相 关 关 系相 关 关 系2rS 确定性关系确定性关系身高和体重身高和体重相关关系相关关系相关关系的特征是相关关系的特征是:变量之间的关系很难用一变量之间的关系很难用一种精确的方法表示出来种精确的方法表示出来.确定性关系确定性关系和和相关关系相关关系的联系的联系由于存在测量误差等原因由于存在测量误差等原因,确定性关系在实际确定性关系在实际问题中往往通过相关关系表示出来问题中往往通过相关关系表示出来;另一方面另一方面,当对当对事物内部规律了解得更加深刻时事物内部规律了解得更加深刻时,相关关系也有可相关关系也有可能转化为确定性关系能转化为确定性关系.回归分析回归分析处理
3、变量之间的相关关系的一处理变量之间的相关关系的一种数学方法种数学方法,它是最常用的数理统计方法它是最常用的数理统计方法.线性回归分析线性回归分析非线性回归分析非线性回归分析回回归归分分析析一元线性回归分析一元线性回归分析多元线性回归分析多元线性回归分析6n研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为回归分析回归分析.n只有一个自变量的回归分析叫做一元回归分析一元回归分析n多于一个自变量的回归分析叫做多元回归分析多元回归分析n自变量与因变量呈直线相关的回归称为线性回归线性回归n自变量与因量不呈直线相关的回归称为非线性回非线性回归归7 利用回归分析这种统计方法,可以从一个(
4、或几个)可控变量的取值去估计作为因变量的随机变量的取值.具体地说,回归分析主要包括三个方面的内容:n 提供建立有相关关系的变量之间的数学关系式(通常称之为经验公式经验公式)的一般方法;n 判别所建立的经验公式是否有效,并从影响随 机变量的诸变量中判别哪些变量的影响是显著 的,哪些是不显著的;n 利用所得的经验公式进行预测和控制预测和控制 .81 散点图与经验公式散点图与经验公式 在一元回归分析里,我们要考虑的是,随机变量 与一普通变量 之间的关系. 对有一定联系的两个变量:与 ,在观测中得到若干对数据的基础上,用什么方法来获得这两个变量之间(对)的经验公式呢?为说明问题,先看一个例子.1 一元
5、线性回归分析一元线性回归分析一一 一元线性回归模型一元线性回归模型YxxY1122( ,),(,),(,)nnx yxyxy例例1 在某种产品表面进行腐蚀刻线试验,得腐蚀时间在某种产品表面进行腐蚀刻线试验,得腐蚀时间 与与腐蚀深度腐蚀深度 相对应的一组数据如下表:相对应的一组数据如下表: xY时间5101520304050607090120深度610101316171923252946n我们希望由此找出两个变量之间的关系式我们希望由此找出两个变量之间的关系式.分别对应到平面上的分别对应到平面上的1111个点(如图个点(如图9-19-1),并称这张图),并称这张图为为散点图散点图. . 散点图给
6、了我们很多启示散点图给了我们很多启示.首先,这些点虽然是杂乱的首先,这些点虽然是杂乱的,但大体上分布在某条直线的周围,但大体上分布在某条直线的周围.也就是说,腐蚀时间与也就是说,腐蚀时间与腐蚀深度大致成线性关系:腐蚀深度大致成线性关系: (1.1)这里这里,在在 上加上加“”是为了区别于是为了区别于 的实际值的实际值 . 至此至此,在散点图的启示下在散点图的启示下,经验公式的形式已完全确经验公式的形式已完全确定定,即是线性的即是线性的.因此因此,只需要确定只需要确定 . 通常通常 称为称为回归回归系数系数,关系式关系式 称为称为回归直线回归直线.yYybxayba,ba,bxay., 2121
7、21观察结果观察结果的独立的独立处对处对分别是在分别是在设设的一组不完全相同的值的一组不完全相同的值对对YxxxYYYxxxxnnn.),( ,),(),(2211是一个样本是一个样本称称nnYxYxYx).,( ,),(),( 2211nnyxyxyx对应的样本值记为对应的样本值记为. )(xxY 的回归函数的回归函数关于关于利用样本来估计利用样本来估计bxax )( 一元线性回归问题一元线性回归问题.,),( 22的未知参数的未知参数都是不依赖于都是不依赖于的每一个值有的每一个值有假设对于假设对于xbabxaNYx 建立回归模型建立回归模型那么那么记记),(bxaY .,)., 0( ,2
8、2的未知参数的未知参数是不依赖于是不依赖于xbaNbxaY 一元线性回归模型一元线性回归模型的线性函数的线性函数x随机误差随机误差2 一元线性回归系数一元线性回归系数a,b的最小二乘估计的最小二乘估计n 要求出回归直线要求出回归直线,只需求出只需求出 .从散点图来看从散点图来看,要求出要求出 是不困难的,在散点图上画一条直线是不困难的,在散点图上画一条直线,使得直线总的来使得直线总的来看最看最“接近接近”全部点,问题是如何将这种思想精确化和数全部点,问题是如何将这种思想精确化和数量化量化.ba,ba,n 设给定设给定 个不全相同的点个不全相同的点 ,对平面上任一条直线对平面上任一条直线我们用数
9、量我们用数量 (1.3)来刻画点来刻画点 到直线到直线 的远近程度的远近程度.于是于是 (1.4)便定量地描述了直线距离这便定量地描述了直线距离这 个点的总的远近程度个点的总的远近程度.n),( ,),(),(2211nnyxyxyxbxayl:2)(iibxay),(iiyxl21()niiiyabxn 这个量是随着不同的直线而变化的这个量是随着不同的直线而变化的,也就是说也就是说,是随是随不同不同 而变化的而变化的,它是它是 的二元函数的二元函数,记为记为 (1.5)于是于是,要找一直线要找一直线,使得该直线总的来看最使得该直线总的来看最“接近接近”这个点的这个点的问问题题,就转化为求二元
10、函数就转化为求二元函数 的最小值问题,由于是个平的最小值问题,由于是个平之和之和,所以求所以求 最小值点的方法习惯上称为最小值点的方法习惯上称为最小二乘法最小二乘法.ba,ba,niiibxaybaQ12)(),(),(baQ),(baQn回归系数的最小二乘估计与最大似然估计有什么不同?n它们的结果是否相同? 的最小值点,通常利用微积分中的极值原理,即解方程组),(baQniiiiniiixbxaybQbxayaQ110)(20)(2整理得 niniiiiniininiiiyxxbxayxbna112111正规方程组正规方程组niiniiniixxxn1211niiniiniixxnxxn12
11、21120)()(故正规方程组有唯一的一组解.解得ab,的最小二乘估计值为xbyaxxyyxxbniiniii)()(121bxax )( xbax)( 的经验回归函数的经验回归函数关于关于 xYxbay 的经验回归方程的经验回归方程关于关于 xY回归方程回归方程回归直线回归直线,xbya 由于由于),(xxbyy ).,(yx几何中心几何中心回归直线通过散点图的回归直线通过散点图的,)( 12 niixxxxS记记,)(12 niiyyyyS, )(1 niiixyyyxxS,xxxySSb .)1(111bxnynaniinii 例例2 (续例续例1)设在例设在例1中的随机变量符合一元线性
12、回归模型的中的随机变量符合一元线性回归模型的条件条件,求关于的经验回归方程求关于的经验回归方程.解 :5455.13104510111367502xxS1139105102143988.181811xyS于是,可得的 估计值为ab,niniiixxxybxnynaSSb113461. 53043. 0510111214111)1(13043. 0从而回归方程为从而回归方程为 :xy3043. 03461. 53 参数参数 的估计的估计2定理一定理一在一元线性回归模型中, ,所以, . )2(22nSe2)2()( nSEe2)2()( nSEe其中 , 表示观测数据 与回归直线上对应点 的纵坐
13、标之差 的平方和. 称为剩余平方和剩余平方和. 称 为 处的残差残差,所以又称 为残差平方和残差平方和.2211()()nneiiiiiiSyyyabxiy),(iiyx)(iiyy eSeSiiyyix说明说明, ,由定理一可知, 的无偏估计为 .2222nSe4 的分布的分布2, ba定理定理二二 在一元线性回归模型中,(1)(2)(3)(4) 相互独立. ),(2xxSbNb)1( ,(22xxSxnaNa)(1 ,(220000 xxSxxnbxaNxbaY)2()2(2222nSneeSbY,三三 线性回归效果的显著性检验线性回归效果的显著性检验. 0: , 0: :10bHbH检验
14、假设n下面介绍三种常用的检验方法,它们本质上是相同的.t1 检验法检验法)2()(12ntxxbbtnii),2(, 00ntSbtbHxx此时为真时当给定显著性水平给定显著性水平 , 检验法则为检验法则为tn若若 ,则拒绝则拒绝 ,认为回归效果显著认为回归效果显著;n若若 ,则拒绝则拒绝 ,认为回归效果不显著认为回归效果不显著;)2(2ntt0H0H)2(2ntt2 检验法检验法Fn可以证明当 为真时,0H)2, 1 ()2(nFSSnFeRn若若 ,则拒绝则拒绝 ,认为回归效果显著认为回归效果显著;n若若 ,则拒绝则拒绝 ,认为回归效果不显著认为回归效果不显著;给定显著性水平给定显著性水平
展开阅读全文