书签 分享 收藏 举报 版权申诉 / 36
上传文档赚钱

类型31回归分析的基本思想及其初步应用优质课课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2532439
  • 上传时间:2022-05-01
  • 格式:PPTX
  • 页数:36
  • 大小:1.31MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《31回归分析的基本思想及其初步应用优质课课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    31 回归 分析 基本 思想 及其 初步 应用 优质课 课件
    资源描述:

    1、2022-4-22郑平正 制作3.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-3城阳一中城阳一中 毛世勤毛世勤2022-4-22郑平正 制作问题问题1:正方形的面积正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量某水田水稻产量y与施肥量与施肥量x之间是否之间是否 -有一个确定性的关系?有一个确定性的关系?例如:例如:在在 7 块并排、形状大小相同的试验田上块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下进行施肥量对水稻产量影

    2、响的试验,得到如下所示的一组数据:所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习、变量之间的两种关系复习、变量之间的两种关系2022-4-22郑平正 制作 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系. .1 1、定义:、定义: 1 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行对具有相关关系的两个变量进行统计分析的方法叫统计分析

    3、的方法叫回归分析回归分析. .2 2):): 新课新课 2022-4-22郑平正 制作2、现实生活中存在着大量的相关关系、现实生活中存在着大量的相关关系.2022-4-22郑平正 制作回归直线方程:回归直线方程:ybxa ,x y称为样本点的中心称为样本点的中心.()()()其其 中中nx - xy - yiii= 1b=n2x - xii= 1a = y -b x .nn11x =x ,y =y .iinni= 1i= 1niii=1n22ii=1x y -nxy=,x-nx 对两个变量进行的线性分析叫做对两个变量进行的线性分析叫做线性回归分析线性回归分析.2022-4-22郑平正 制作相关

    4、系数相关系数n1.计算公式计算公式n2相关系数的性质相关系数的性质n(1)|r|1n(2)|r|越接近于越接近于1,相关程度越大;,相关程度越大;|r|越接近越接近于于0,相关程度越小,相关程度越小()()()()niii=1nn22iii=1i=1x - xy - yr =x - xy - y2022-4-22郑平正 制作负相关负相关正相关正相关(一)回顾:数学(一)回顾:数学线性回归分线性回归分析的步骤析的步骤 : :温故知新温故知新1、画散点图、画散点图4、用回归直线方程进行预报、用回归直线方程进行预报3、求回归直线方程、求回归直线方程 ybxa2、求、求 , b a课前检测:课前检测:

    5、 假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费和所支出的维修费用用 y(万元),有如下的统计资料。(万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.0(1)画散点图并求回归方程)画散点图并求回归方程 ;()估计使用年限为()估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?ybxa1.23,0.08.ba1.230.08.yx使用年限为使用年限为10年时,维修费用是年时,维修费用是:12.38万元万元 2008年年5月,中共中央国务院关于加月,中共中央国务院关于加强青少年体育、增强青少年体质的意强青少年体

    6、育、增强青少年体质的意见指出城市超重和肥胖青少年的比例见指出城市超重和肥胖青少年的比例明显增加明显增加.“身高标准体重身高标准体重”该指标对该指标对于学生形成正确的身体形态观具有非于学生形成正确的身体形态观具有非常直观的教育作用常直观的教育作用. “身高标准体重身高标准体重”从何而来?我们怎样去研究从何而来?我们怎样去研究?创设情境:创设情境:例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重名女大学生,其身高和体重数据如表数据如表1-1所示。所示。编号12345678身高/cm165165 157 170 175 165 155 170体重/kg4857505464614

    7、359求求根据女大学生的身高预报她的体重的回归方程,根据女大学生的身高预报她的体重的回归方程,并预报一名身高为并预报一名身高为172cm的女大学生的体重。的女大学生的体重。问题呈现:女大学生的身高与体重问题呈现:女大学生的身高与体重0.84985.712yx解;解; 1.由于问题中要由于问题中要求根据身高预报体重,求根据身高预报体重,因此选取身高为解释因此选取身高为解释变量变量x,体重为预报变,体重为预报变量量y约为身身高高172cm 女172cm 女大大生生体体重重y = 0.849y = 0.849172 -85.712 = 60.316(kg)172 -85.712 = 60.316(k

    8、g)学3.3.回归方程:回归方程:2. 散点图;散点图;81iiixy821iixx y 72315218774165.2554.5探究:探究:身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原因吗?答:身高为答:身高为172cm的女大学生的体重不一定是的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于,但一般可以认为她的体重接近于60.316kg。例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号1

    9、2345678身高/cm165165 157 170 175 165 155 170体重/kg4857505464614359女大学生的身高与体重女大学生的身高与体重0.84985.712yx解;解; 1.由于问题中由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量高为自变量x,体,体重为因变量重为因变量y约身身高高172cm 女172cm 女大大生生体体重重y = 0.849y = 0.849172 -85.712 = 60.316(kg)172 -85.712 = 60.316(kg)学3.3.回归方程:回归方程:2. 散点图;散点图;81iiixy821

    10、iixx y 72315218774165.2554.50.84985.712yx2022-4-22郑平正 制作 从从散散点点图图中中还还看看到到,样样本本点点散散布布在在某某一一条条直直线线的的附附近近, ,而而不不是是在在一一条条直直线线上上,所所以以不不能能用用一一次次函函数数 y = bx+a y = bx+a来来描描述述它它们们之之间间的的关关系系. .这这时时我我们们把把身身高高和和体体重重的的关关系系用用下下面面的的线线性性回回归归模模型型 y = bx+a+e y = bx+a+e(3 3) ,来表示2 2这这里里a a和和b b为为模模型型的的未未知知参参数数,e,e是是y

    11、y与与bx + abx + a之之间间的的误误差差. .通通常常e e为为随随机机变变量量, ,称称为为随随机机误误差差, ,它它的的均均值值E e= 0,E e= 0,方方差差D e=D e= 0. 0.这这样样线线性性回回归归模模型型的的完完整整表表达达式式为为 : :2022-4-22郑平正 制作 2ybxae,E e0,D e. (4 4) 预报随机误差是引起的精度越高预报真实值用越小的方差随机误差中在线性回归模型.,4 2yabxe yy,. 值 与真实值 之间存在误差的原因之一 其大小 取决于随机误差的方差 ,12ab,ab, yy. 另一方面由于公式和中 和 为截距和斜率的估计值

    12、 它们与真实值和之间也存在误差 这种误差是引起预报值 与真实值 之间存在误差的另一个原因2022-4-22郑平正 制作产产生生随随机机误误差差项项e e的的原原思思考考: :因因是是什什么么? ? 实实际际上上, ,一一个个人人的的体体重重值值除除了了受受身身高高的的影影响响外外, ,还还受受其其他他许许多多因因素素的的影影响响. .例例如如饮饮食食习习惯惯、是是否否喜喜欢欢运运动动、度度量量误误差差等等. .另另外外, ,我我们们选选用用的的线线性性模模型型往往往往只只是是一一种种近近似似的的模模型型. .所所有有这这些些因因素素都都会会导导致致随随机机误误差差e e的的产产生生. .202

    13、2-4-22郑平正 制作,ey,?x在在线线性性回回归归模模型型中中 是是用用b +ab +a预预报报真真实实值值 的的随随机机误误差差 它它是是一一个个不不可可观观测测的的量量 那那么么应应该该怎怎样样研研究究随随机机误误差差 如如何何衡衡量量探探预预报报的的精精度度究究 ybxa 在在实实际际应应用用中中,我我们们用用回回归归方方程程 ybxa.ey(bxa),eyye.中中的的 估估计计(4 4)中中的的由由于于随随机机误误差差所所以以是是 的的估估计计量量 1122nniiix ,y, x ,y, x ,y,eybxa,i1,2,n.对对于于样样本本点点而而言言 相相应应它它们们的的随

    14、随机机误误差差为为2022-4-22郑平正 制作其其估估计计值值为为iiiiiiiieyyybxa,i1,2,n, ex ,y. ,称称为为相相应应于于点点(的的残残 ) 差差2022-4-22郑平正 制作思考:如何发现数据中的错误?如何衡量模型的拟合效果? 可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果. 表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据.382.0883.2627.6137.1618.4419.2627.2373.6e 5943616454505748kg/170155165175170157165165cm/87654321残差残差体重体重身高

    15、身高编号编号表3-22022-4-22郑平正 制作3.1-3我我们们可可以以利利用用图图形形来来分分析析残残差差特特性性 作作图图时时纵纵坐坐标标为为残残差差 横横坐坐标标可可以以选选为为样样本本编编号号 或或身身高高数数据据或或体体重重估估计计值值等等 这这样样作作出出的的图图形形称称为为残残差差图图 图图是是以以样样本本编编号号为为横横坐坐标标的的残残差差图图 .,.2022-4-22郑平正 制作 从图3.1-3中可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据

    16、采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.我们可以用我们可以用相关指数相关指数R2来刻画回归的效果,其计算公式是来刻画回归的效果,其计算公式是22121()11()niiiniiyyRyy残差平方和。总偏差平方和如何衡量预报的精度?如何衡量预报的精度?显然,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 如果某组数据可能采取几种不同回如果某组数据可能采取几种不同回归方程进行回归分析,则可

    17、以通过比归方程进行回归分析,则可以通过比较较R2的值来做出选择,即选取的值来做出选择,即选取R2较大较大的模型作为这组数据的模型。的模型作为这组数据的模型。2022-4-22郑平正 制作2 22 22 2 在在例例1 1中中,R,R 0.64,0.64,表表明明 女女大大学学生生的的身身高高解解释释了了64%64%的的体体重重变变化化 , ,或或者者说说 女女大大学学生生的的体体重重差差异异有有64%64%是是由由身身高高引引起起的的 .R.R 是是常常用用的的选选择择模模型型的的指指标标之之一一,在在实实际际应应用用中中应应该该尽尽量量选选择择R R 大大的的回回归归模模型型. .“”“”2

    18、022-4-22郑平正 制作一一般般地地, ,建建立立回回归归模模型型的的基基本本步步骤骤为为: :(1 1) 确确定定研研究究对对象象, , 明明确确哪哪个个变变量量是是解解释释变变量量, ,哪哪个个变变量量是是预预报报变变量量(2 2) 画画出出解解释释变变量量和和预预报报变变量量的的散散点点图图, ,观观察察它它们们之之间间的的关关系系(如如是是否否存存在在线线性性关关系系等等)(4 4) 按按一一定定规规则则( ( 如如最最小小二二乘乘法法) )估估计计回回归归方方程程中中的的参参数数(5 5) 得得出出结结果果后后分分析析残残差差图图是是否否有有异异常常( (如如个个别别数数据据对对

    19、应应残残差差过过大大, ,残残差差呈呈现现不不随随机机的的规规律律性性等等),),若若存存在在异异常常, ,则则检检查查数数据据是是否否有有误误, ,或或模模型型是是否否合合适适等等. .(3 3) 由由经经验验确确定定回回归归方方程程的的类类型型( (如如我我们们观观察察到到数数据据呈呈线线性性关关系系, ,则则选选用用线线性性回回归归方方程程)2022-4-22郑平正 制作(4 4) 按按一一定定规规则则( ( 如如最最小小二二乘乘法法) )估估计计回回归归方方程程中中的的参参数数(5 5) 得得出出结结果果后后分分析析残残差差图图是是否否有有异异常常( (如如个个别别数数据据对对应应残残

    20、差差过过大大, ,残残差差呈呈现现不不随随机机的的规规律律性性等等),),若若存存在在异异常常, ,则则检检查查数数据据是是否否有有误误, ,或或模模型型是是否否合合适适等等. .(3 3) 由由经经验验确确定定回回归归方方程程的的类类型型( (如如我我们们观观察察到到数数据据呈呈线线性性关关系系, ,则则选选用用线线性性回回归归方方程程)学以致用:学以致用:1、在对两个变量,进行线性回归分析时有、在对两个变量,进行线性回归分析时有下列步骤:下列步骤:对所求出的回归方程作出解释,收集数据(,)对所求出的回归方程作出解释,收集数据(,)求线性回归方程,求相关系数,根据所搜集的数据绘求线性回归方程

    21、,求相关系数,根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是()性相关结论,则在下列操作顺序中正确的是()ixiy2022-4-22郑平正 制作2. 有下列说法:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.用相关指数R2来刻画回归的效果, R2值越大,说明模型的拟合效果越好.比较两个模型的拟合效果,可以比较相关系数的大小,相关系数越大的模型,拟合效果越好.其中正确命题的个数是()A.0B.1C.2D.3C学以致用:学以致用:3、对于相关指数,下列说法正确的是(、对

    22、于相关指数,下列说法正确的是()2R2R2R、的取植越小,模型拟合效果越好、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值越接近,模型拟合效果越好、的取值越接近,模型拟合效果越好、以上答案都不对、以上答案都不对2R2R2R学以致用:学以致用:4、甲、乙、丙,丁四位同学各自对,两变量、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得的线性相关性做实验,并用回归分析方法分别求得相关系数相关系数r与残差平方和与残差平方和m如下表:如下表:甲甲乙丙丁r0.820.780.690.85m1061

    23、15124103则哪位同学的实验结果体现,两变量有更强的线性相关性则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁甲乙丙丁2022-4-22郑平正 制作x x0 01 12 23 3y ym m3 35.55.57 7D2022-4-22郑平正 制作6.一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm以下 D.身高在145.83 cm左右D 2022-4-22郑平正 制作7. 在研究身高

    24、和体重的关系时,求得相关指数 _,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.2R64.0学以致用:学以致用:8、 已知两个变量已知两个变量x和和y之间有线性相关性,次实之间有线性相关性,次实验得到样本如下:验得到样本如下:6.13.920y3210 x()则()则y对对x的线性回归方程是的线性回归方程是()相应于各样本点的残差()相应于各样本点的残差(i=1,2,3,4)分别是,分别是,残差平方和是残差平方和是ie课堂总结:课堂总结:1、线性回归分析的步骤、线性回归分析的步骤2、回归模型的建立、回归模型的建立3、随机误差的研究、随机误差的研究知识小节知识小节:数学思想小结数学思想小结:1、最小二乘法思想、最小二乘法思想2、函数与方程的思想、函数与方程的思想3、数形结合、数形结合

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:31回归分析的基本思想及其初步应用优质课课件.pptx
    链接地址:https://www.163wenku.com/p-2532439.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库