书签 分享 收藏 举报 版权申诉 / 25
上传文档赚钱

类型82一元线性回归模型及其应用课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:3622298
  • 上传时间:2022-09-27
  • 格式:PPTX
  • 页数:25
  • 大小:256.68KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《82一元线性回归模型及其应用课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    82 一元 线性 回归 模型 及其 应用 课件
    资源描述:

    1、8.2 一元线性回归模型及其应用函数关系确定性关系相关关系非确定性关系如身高与体重、水稻产量与施肥量回归分析:对具有相关关系的两个变量进行统计分析的方法线性回归分析:对具有线性相关关系的两个变量进行统计分析的方法(一)回顾:线性回归分析的步骤:温故知新1.画散点图4.用回归直线方程进行预报3.求回归直线方程 ybxa2.求,b a1221-,-niiiniix ynx ybxnx参考公式:(,)x y回归直线过样本点的中心.xbya(三)描述两个变量之间线性相关关系的强弱的相关系数r0.751,1,0.75,0 25,0.25,rrr 当,表明两个变量正相关很强;当表明两个变量负相关很强;当.

    2、表明两个变量相关性较弱。122122211121()()()()(niiinniiiiniiinniiiix ynxxyx yxnxynyyxxyyr例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。问题呈现:女大学生的身高与体重0.8

    3、4985.712yx解;1.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y学学身身高高172cm女172cm女大大生生体体重重y=0.849y=0.849172-85.712=60.316(kg)172-85.712=60.316(kg)3.回归方程:2.散点图;4.本例中,r=0.7980.75这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。0.84985.712yx探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的

    4、体重接近于60.316kg。因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。)iiyy(iiieyy=例如,编号为6的女大学生,计算随机误差的效应(残差)为:61(0.849 16585.712)6.627对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号21()niiiyy称为残差平方和,它代表了随机误差的效应。表示为:用残差估计随机误差()niiibyy21为残差平方和。Q(a,)Q(a,)iiieyyii对于样本点(x,y)的随机误差的估计值程称相应残差.2e残差R R2 2越大越大模型越模型越好好残差平方和越残差平方和越小精确度越高小精确度

    5、越高3.3.相关指数相关指数R R2 2 n n2 2i ii i2 2i=1i=1n n2 2i ii=1i=1(y-y)(y-y)R=1-R=1-(y-y)(y-y)引例引例:从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号编号1 12 23 34 45 56 67 78 8身高身高165165165165157157170170175175165165155155170170体重体重48485757505054546464616143435959残差残差(1)(1)求每个点求每个点(x(xi,i,y yi i)的残差的

    6、残差 (2)(2)画出残差的散点图画出残差的散点图(3)(3)求出相关指数求出相关指数R R2 2,说明身高在多大程度说明身高在多大程度上解释了体重的变化上解释了体重的变化.二二.探求新知探求新知 -6.373-6.373 2.6272.627 2.4192.419-4.618-4.618 1.1371.1376.6276.627-2.883-2.883 0.3820.382-8-8-6-6-4-4-2-22 24 46 68 8O O2 21 13 34 46 65 57 78 89 91010编号编号残差残差.R.R2 2=0.64,=0.64,表明女大学生的身高解释了表明女大学生的身高解

    7、释了64%64%的体重变的体重变化。化。残差点比较均匀地落在(以x轴为中心)水平带状区域内.模型较合适带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高残差图的制作及作用。坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。身高与体重残差图异常点 错误数据 模型问题 几点说明:第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。另外,残差点比较均匀地落在水平的带状区域

    8、中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。.43210-1-2-3-40 100 200 300 400 500 600 700 800 900 1000 454035302520151050-50 10 20 30 40 50 60 70 80 90 100 25002000150010005000-500-10000 10 20 30 40 50 60 70 80 90 100200150100500-50-100-1500 10 20 30 40 50 60 70 80 90 100 .()()分析下列残差图分析下列残差图,所选用

    9、的回归模型效果最好的是()所选用的回归模型效果最好的是()牛刀小试牛刀小试我们可以用相关指数R2来刻画回归的效果,其计算公式是22121()11()niiiniiyyRyy残差平方和。总偏差平方和如何衡量预报的精度?显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。练习:被害棉花 红铃红铃 虫喜高温高湿,适宜各虫虫喜高温高湿,适宜各虫态发育的温度为态发育的温度为 25 一一32 ,相对湿度为相对湿度为80一一100,低于,低于 20 和高于和高于35 卵不

    10、能孵化,相对卵不能孵化,相对湿度湿度60 以下成虫不产卵。冬季月以下成虫不产卵。冬季月平均气温低于一平均气温低于一48 时,红铃虫时,红铃虫就不能越冬而被冻死。就不能越冬而被冻死。创设情景创设情景 1953 1953年,年,1818省发生红铃虫大灾害,受灾省发生红铃虫大灾害,受灾面积面积300300万公顷,损失皮棉约二十万吨。万公顷,损失皮棉约二十万吨。因材施教因材施教温度温度xoC21232527293235产卵数产卵数y/个个711212466115325例例2 2 现收集了一只红铃虫的产卵数现收集了一只红铃虫的产卵数y y和温度和温度x xo oC C之间的之间的7 7组观测数据列组观测

    11、数据列于下表:于下表:(1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并预测温度为之间的回归方程;并预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了产卵数的变化?)你所建立的模型中温度在多大程度上解释了产卵数的变化?问题呈现:画散点图画散点图假设线性回归方程为假设线性回归方程为:选选 模模 型型分析和预测分析和预测当当x=28时,时,y=19.8728-463.73 93选变量选变量 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。合作探究合作探究050100150

    12、200250300350036912151821242730333639方案1当当x=28时,时,y=19.8728-463.73 93ybxa估计参数估计参数由计算器得:线性回归方程为由计算器得:线性回归方程为19.87463.73yx0残差残差编号12345671020304050607080-10-20-30-40-50-6090100 xy残差21723112521272429663211535325线性模型线性模型53.4617.72-12.02-48.76-46.5-57.1193.2819.87463.73yx271(,)()iiiQ a byy19818.919818.9 相关

    13、指数相关指数R R2 20.74640.7464所以,一次函数模型中温度解释了所以,一次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。比一比比一比函数模函数模型型相关指相关指数数R2残差平残差平方和方和线性回线性回归模型归模型二次函二次函数模型数模型指数函指数函数模型数模型最好的模型是哪个最好的模型是哪个?0.74640.74640.8020.8020.9850.9851981819818154481544814711471数学思想:数学思想:数学方法:数学方法:数形结合的思想,化归思想及整体思想数形结合的思想,化归思想及整体思想数形结合法,转化法,换元法数形结合法,转化法,换元

    14、法数学知识数学知识:建立回归模型及残差图分析的基本步骤建立回归模型及残差图分析的基本步骤不同模型拟合效果的比较方法:相关指数和残差的分析不同模型拟合效果的比较方法:相关指数和残差的分析非线性模型向线性模型的转换方法非线性模型向线性模型的转换方法课堂总结课堂总结、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果 越好、的取值越接近,模型拟合效果越好、以上答案都不对学以致用:2、对于相关指数,下列说法正确的是()2R2R2R2R2R2R残差点比较均匀地落在水平的带状区域内,模拟较合适;这样的带状区域的宽度越窄,模拟精确度越高.,表示回归效果越好越接近1112122niiniiiyyyyR小结学以致用:3、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲甲乙乙丙丙丁丁r0.820.820.780.780.690.690.850.85m106106115115124124103103则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁学以致用:4、已知两个变量x和y之间有线性相关性,次实验得到样本如下:6.13.920y3210 x()则y对x的线性回归方程是()相应于各样本点的残差(i=1,2,3,4)分别是,(3)画残差图.ie

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:82一元线性回归模型及其应用课件.pptx
    链接地址:https://www.163wenku.com/p-3622298.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库