回归分析方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《回归分析方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 方法 课件
- 资源描述:
-
1、1第五章第五章 回归分析方法回归分析方法 251 一元线性回归 一、什么叫回归分析一、什么叫回归分析 (一)两种不同类型的变量关系、函数与相关(一)两种不同类型的变量关系、函数与相关简单的说,回归分析就是一种处理变量与变量之间关系的简单的说,回归分析就是一种处理变量与变量之间关系的数学方法。数学方法。例:自由落体运动中,物体下落的举例例:自由落体运动中,物体下落的举例S与所需时间与所需时间t之间,有之间,有如下关系如下关系 21(0)2SgttT 3变量变量S的值随的值随t而定,这就是说,如果而定,这就是说,如果t去了固定值,去了固定值,那么那么S的值就完全确定了的值就完全确定了这种关系就是所
2、谓的函数关系或确定性关系这种关系就是所谓的函数关系或确定性关系回归分析方法是处理变量之间相关关系的有力工具,回归分析方法是处理变量之间相关关系的有力工具,它不仅提供建立变量间关系的数学表达式它不仅提供建立变量间关系的数学表达式经验公经验公式,而且利用概率统计知识进行了分析讨论,从而判式,而且利用概率统计知识进行了分析讨论,从而判断经验公式的正确性断经验公式的正确性4 二、回归分析所能解决的问题二、回归分析所能解决的问题 回归分析主要解决以下几方面的问题:回归分析主要解决以下几方面的问题: (1)确定几个特定变量之间是否存在相关关系,如果)确定几个特定变量之间是否存在相关关系,如果存在的话,找出
3、她们之间合适的数学表达式存在的话,找出她们之间合适的数学表达式 (2)根据一个或几个变量的值,预报或控制另一个变)根据一个或几个变量的值,预报或控制另一个变量的取值,并且要知道这种预报或控制的精确度量的取值,并且要知道这种预报或控制的精确度 (3)进行因素分析,确定因素的主次以及因素之间的)进行因素分析,确定因素的主次以及因素之间的相互关系等等相互关系等等5 一元线性回归分析,只要解决:一元线性回归分析,只要解决: (1)求变量)求变量x与与y之间的回归直线方程之间的回归直线方程 (2)判断变量)判断变量x和和y之间是否确为线性关系之间是否确为线性关系 (3)根据一个变量的值,预测或控制另一变
4、量的)根据一个变量的值,预测或控制另一变量的取值取值6 二、一元线性回归方程的确定二、一元线性回归方程的确定iy (1,2,.,)xyxyiN数学上判定直线合理的原则:如果直线与全部观测数据的离差平方和,比任何其它直线与全部观测数据的离差平方和更小,该直线就是代表 与 之间关系较为合理的一条直线,这条直线就是 和 之间的回归直线。7*, )(1,2,., )xy()iiiiiiiiiiiiya bxx y iNxya bxya bxyxyyyya bxy 设是平面上的一条任意直线,(是变量 , 的一组观测数据。那么,对于每一个 ,在直线上确可以确定一个的值, 与 处实际观测值 的差:就刻画了
5、与直线偏离度8xy1x( ,)iix y( ,)iix yyabx9*2211(1,2,.,)(1,2,.,)()()(1,2,.,),abQiiNNiiiiiiiy iNy iNQyyya bxQy iNQx y 全部观测值与直线上对于的的离差平方和则为:反映了全部观测值对直线的偏离程度,显然,离差平方和 越小,愈能较好地表示之间的关系。用最小二乘法原理,通过选择合适的系数 , ,使 最小1011_1111_22211_2()0(61)2()0(62)1()()(63)1()()(64)NiiiNiiiiNNNNiiiiiiiiiiNNiiiiiQyabxaQyabx xbxxyyx yxy
6、NxxxxNay bx Ni=1联合求解得:b=11_1111,(65)ab(66)bNNiiiixx yyNNyabx此处求得 , 后,回归方程为:便可以确定, 称为回归系数12 三、回归方程检验方法三、回归方程检验方法 (一)方差分析法(一)方差分析法回顾方差分析的基本特点:回顾方差分析的基本特点:把所给数据的总波动分解为两部分,一部分反映水平变化把所给数据的总波动分解为两部分,一部分反映水平变化引起的波动,另一部分反映由于存在试验误差而引起的波动。引起的波动,另一部分反映由于存在试验误差而引起的波动。然后把各因素水平变化引起的波动与试验误差引起的波动大小然后把各因素水平变化引起的波动与试
7、验误差引起的波动大小进行比较,而达到检验因素显著性的目的进行比较,而达到检验因素显著性的目的.13_22_22( ,)(1,2,.,)xyxy()()()()()iiiiiiyyiiiiiiix yiNxyxyabxyLyyyyyyyyyy_NNi=1i=1Ni=1i=1设为变量 , 间的一组观测数据,为观测点, 为 处的观测之,为这组观测数据求得的变量 , 间的回归方程,在回归问题中,观测数据总的波动情况,用各观测值 与总平均y之间的平方和即总变动平方和表示_2()()iiiyyyyNNi=1142_2()()(68)xyy(69)iiiQyyQUyyUQUNi=1Ni=1yy第一项是观测值
8、与回归直线的离差平方和,反映了误差的大小第二项反映了总变动中,由于 与 的线性关系而引起 变化的一部分,称为回归平方和第三项为零L15UQUQNN2UQfffffffyyyy总总总每一个变动平方和(即L 、 、 )都有一个“自由度”和它们对应,L 自由度称为总自由度,记做 。观测值个数1 11 三者之间仍然有:16aaF(2)2a0.050.01F(1,2)FFF FUNQNuQa可用 检验考察回归直线的显著性:U/f(1)计算F=Q/f( )对于选定的显著性水平 (或),从 分布上找出临界值F(3)比较 与 的大小。若 ,则回归方程有意义,反之则说明方程意义不大17 (二)相关系数检验法(二
9、)相关系数检验法_22_22_2_222_22()()()()()()()()1(611)()()iiiyyiiiiiiiiUyyUabxabxbxxLyyyyyyxxbyyyy NNi=1i=1Ni=1Ni=1NNi=1i=1NNi=1i=1由代入整理后可得18_2222_22_2_2()()1(612)()()()()iiiiiiixxyyrbyyyyxxrbyy NNi=1i=1NNi=1i=1Ni=1Ni=1令19_2_21 yx(),1,()iiiiyyyy rbxxNi=1Ni=1下面存在三种情形:() 与 有严格函数关系时xy1r xy1r 20_2yx,0,0yy rb( )
10、与 无任何依赖关系时xy0r xy0r 213yxr( ) 与 存在相关关系时0| |1xy10r xy01r22_21_22211yxr()()()()()()NiiiiNNiiiiixyxx yyxxyyxxrbyyxxyyll lNi=1Ni=1检验 与 是否相关的步骤:(1)按下式计算 :23,2fn23| | |xy| |xya fa fa fa frrrrrrr( )给定显著行水平 ,按自由度 ,由相关系数临界表中查处临界值。( )比较与的大小。若,认为 与 之间存在线性相关关系;若,认为 与 之间不存在线性相关关系。24n-2123456789100.05 0.010.9970.
11、9500.8780.8110.7540.7070.6660.6320.6020.5761.0000.9900.9590.9170.8740.8340.7980.7650.7350.708n-2111213141516171819200.05 0.010.5530.5320.5140.4790.4820.4680.4560.4440.4330.4130.6840.6610.6410.6230.6060.5900.5750.5610.5490.537n-2212223242526272829300.05 0.010.4130.4040.3960.3880.3810.3740.3670.3640.3
12、550.3490.5260.5150.5050.4960.4870.4780.4700.4630.4560.449相关系数临界值表25 四、预报与控制四、预报与控制当我们求得变量当我们求得变量x、y之间的回归直线方程后,之间的回归直线方程后,往往通过回归方程回答这样两方面的问题:往往通过回归方程回答这样两方面的问题:(1)对任何一个给定的观测点)对任何一个给定的观测点x0,推断,推断y0大致落的范围大致落的范围(2)若要求观测值)若要求观测值y在一定的范围在一定的范围y1yy2内取值,应将变内取值,应将变量控制在什么地方量控制在什么地方前者就是所谓的预报问题,后者称为控制问题。前者就是所谓的预
13、报问题,后者称为控制问题。260000002yxyyyyyQSN(一)预报问题一般来说,对于固定 处的观测值 ,其取值是以为中心而对称分布的。愈靠近的地方,出现的机会愈大,离愈元的地方,出现的机会少,而且 的取值范围与量有下述关系:2700000000000000322222yyyyyyyyyyySyySyySxxxyySySySyySSS落在范围内的可能性为99.7落在范围内的可能性为95落在范围内的可能性为68利用此关系,对于指定的 ,我们有95的把握说,在处的实际观测值 介于与之间即:这样,预报问题就得到了解决量称为剩余标准差。 用来衡量预报的精确度2801021111222221212
14、0122323yyyyyyyaSbxyaSbxyaSbxyaSbxyxxxxxyyy(二)控制问题控制问题只不过是预报的反问题。若要求观测值在范围内取值,则可从(或)及(或)中分别解出 、 ,只要将 的取值控制在 与 之间,我们就能以95(或99.7)的把握保证, 在 与范围内取值。29122(617)2(618)yyyabxSyabxS进行预报和控制,通常也采用图解法。其作法是:在散点图上作两条平行与回归直线的直线xy2yyabxSyabx1x2x1y2y2yyabxS0b xy2yyabxS2yyabxSyabx1x2x1y2y0b 301295xyyxx可以预测在 附近的一系列观测值中,
15、将落在这两条直线所夹成的带行趋于中,若要求在 与 范围内取值,则只需要图中虚线所示的对于关系,可在 轴上找到值的控制范围。31 五、应用举例五、应用举例例例61 在某产品表明腐蚀刻线,下表是试验在某产品表明腐蚀刻线,下表是试验活得的腐蚀时间(活得的腐蚀时间(x)与腐蚀深度()与腐蚀深度(y)间的一组)间的一组数据。试研究两变量(数据。试研究两变量(x,y)之间的关系。)之间的关系。腐蚀时间腐蚀时间x(秒)(秒)腐蚀深度腐蚀深度y()5 5 10 20 30 40 50 60 65 90 1204 6 8 13 16 17 19 25 25 29 4632ii作散点图,即(x ,y)图40302
16、010yx10 20 30 40 50 60 70 80 90 100 110 120 xy可见 与 之间无确定的函数关系,而表现为相关关系33_222111_222111_1111_211()()1()()1()()()()(619)(620)(621)NNNxxiiiiiiNNNyyiiiiiiNNNNxyiiiiiiiiiixyxxxyxyxxxx yyLxxxxNLyyyyNLxxyyx yxyNLay bxbLlLrULl l()求回归直线记34序号1234567891011xy2x2yxy55102030405060659012049546813161719252529462082
展开阅读全文