书签 分享 收藏 举报 版权申诉 / 35
上传文档赚钱

类型湖北省华中师大一附中2020年高二网课课件回归分析的基本思想及初步应用.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4506755
  • 上传时间:2022-12-15
  • 格式:PPT
  • 页数:35
  • 大小:4.06MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《湖北省华中师大一附中2020年高二网课课件回归分析的基本思想及初步应用.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    湖北省 华中师大 附中 2020 年高 二网课 课件 回归 分析 基本 思想 初步 应用
    资源描述:

    1、3.1 回归分析的基本思想及其初步应用数学数学 选修选修2-3 第三章第三章 统计案例统计案例问题1:现实生活中两个变量间的关系有哪些呢?函数关系是一种确定性关系相关关系是一种非确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.一、复习回顾两个变量的关系不相关相关关系函数关系线性相关非线性相关正相关(增)负相关(减)问题2:研究两个变量是否线性相关的的基本步骤是什么?问题3:求线性回归直线的基本方法是什么?画散点图求回归直线方程用回归直线方程进行预报最小二乘法求2221122?()()()nnybx aybxaybxa?L的最小值21?()niiiQyy?一、复习回顾),

    2、(11yx),(22yx),(iiyxiiyy?yx?ybx a?21?,niiia bQyx?是使取得最小值的的值?21,?niiixyxyxyQ?212 2 niiiiiyxyxyxyxyxyx?21122()()nniiiiiiyxyxyxyxyxnyx?一、复习回顾一、复习回顾1()()niiiyxyxyx?Q?niiixyxyxy1?niiniixynxyxy11?0?xynxnynxy?一、复习回顾一、复习回顾?221,niiiQyxyxnyx?21211222?xynyyyyxxxxniiniiinii?niiniiniiiniiniiiniiyyxxyyxxxxyyxxxxxy

    3、n1212212121122?与?,?无关0一、复习回顾一、复习回顾?niiniiixxyyxx121?xy?a?b?21,niiiQyx?取得最小值的的值?002121122niiniiiniixxyyxxxxxyn?满足:一、复习回顾一、复习回顾利用最小二乘法求回归直线的方程:一、复习回顾对于一组具有线性相关关系的数据?1122,nnx yxyxy?,设回归直线为?ybxa?,则:1122211()()?()nniiiiiinniiiixxyyx ynxybxxxnx?,?aybx?其中1111,nniiiixx yynn?,回归直线必经过样本中心点?,x y?112222221111()

    4、()nniiiiiinnnniiiiiiiixxyyx ynx yrxxyyxnxyny?r0时,表明两个变量正相关;r0.75时,认为两个变量有很强的线性相关关系如何刻画两个变量线性相关关系的强弱??0b?0b?一、复习回顾观察散点图或计算相关系数?练一练练一练【解析】由题设知,这组样本数据完全负相关,故其相关系数为1,故选AA1、在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线112yx?上,则这组样本数据的样本相关系数为 A?1 B0 C12 D1?练一练2、某饮料店的日销售收入

    5、y(单位:百元)与当天平均气温x(单位C?)之间有下列数据:x 2?1?0 1 2 y 5 4 2 2 1 甲、乙、丙、丁四位同学对上述数据进行了研究,分别得到了x与y之间的四个线性回归方程,其中正确的是 A?2.8yx?B?3yx?C?1.22.6yx?D?22.7yx?A?练一练3、某班五名学生的数学和物理成绩如下表:学生 学生成绩 A B C D E 数学成绩(分)89 77 74 67 63 物理成绩(分)78 66 71 64 61(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(精确到0.1)(3)利用(2)中的回归方程,分析该班数学成绩63分到89分的学生物理成绩

    6、的变化情况,并预测该班一名数学成绩是96分的学生的物理成绩 解:(1)散点图如图所示:(2)由已知得:8977746763745x?,7866716461685y?,521()2259049 121404iixx?51()()15 103(2)0 3(7)(4)(11)(7)249iiixx yy?249?0.6404b?,?680.67423.6ay bx?所以物理成绩y对数学成绩x的回归直线方程为?0.623.6yx?(3)由(2)知?0.60b?,该班数学成绩该班数学成绩63分到89分的学生物理成绩随数学成绩的增分的学生物理成绩随数学成绩的增加而增加,且数学成绩每增加一分,物理成绩平均增

    7、加加而增加,且数学成绩每增加一分,物理成绩平均增加0.6分;将将96x?代入回归方程?0.623.6yx?,得?81.281y?,所以可预测该班一名数学成,所以可预测该班一名数学成绩是96分的学生的物理成绩为分的学生的物理成绩为81分 思考:该班学生的数学成绩为96分时,其物理成绩一定是81分吗??122112490.93178404niiinniiiixxyyrxxyy?二、讲授新课二、讲授新课残差分析残差分析1线性回归模型与随机误差线性回归模型与随机误差2()0,()0ybx aeE eD e?称为线性回归模型,其中e是y与bx a?之间的误差,通常e为随机变量,称为随机误差,在回归模型中

    8、,x称为解释变量,y称为预报变量 用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型是什么)所引起的误差例如可能存在非线性的函数能更好地描述y与x的关系,但现在却用线性函数来表述,结果会产生误差;忽略了其它因素对变量y的影响例如在描述身高和体重的关系的模型中,体重不仅受身高的影响,还会受遗传因素、饮食习惯、成长环境等其它因素的影响,它们的影响都体现在随机误差中;观测误差例如测量工具或测量技术等原因,导致y的观测值产生误差产生随机误差的主要因素:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差?(),1,2,iiiiieyyybxa in?,?ie

    9、称为相应于点?,iix y的残差.我们把222111?()()nnniiiiiiiieyyybxa?叫做残差平方和.2残差分析(1)残差残差=真实值预报值;残差平方和越小,回归方程的拟合效果越好编号12345678身高/cm165165157170175165155170体重/kg4857505464614358残差_-6.3732.6272.419-4.6181.1376.627-2.8830.382?e女大学生身高体重原始数据和相应的残差数据表2残差分析(2)残差表:计算样本点对应的残差,可列出残差表计算样本点对应的残差,可列出残差表?0.84985.712yx?如:女大学生的身高的回归方

    10、程为:(3)残差图:可利用图形来分析残差特性作图时以 纵坐标为残差,横坐标为样本的编号,也可用其他测量值以编号为横坐标的残差图-8-6-4-202468012345678910编号残差2残差分析残差分析初步判断回归方程的拟合效果如残差比较均匀地落在水平的带状区域中,说明选用的模型比较合适带状区域宽度越窄,模型拟合效果越好,回归方程的预报精度越高;可以通过残差图发现原始数据中的可疑数据残差图的作用:(4)利用相关指数R2来刻画回归的效果?2211?1niiiniiyyRyy?2残差分析残差分析残差平方和总偏差平方和R2越大,表示残差平方和越小,即模型的拟合效果越好,R2越小,表示残差平方和越大,

    11、即模型的拟合效果越差,即R2越接近于1,表示回归的效果越好;在含有一个解释变量的线性回归模型中,恰好有R2等于r2;在线性回归模型中,R2表示解释变量对于预报变量的贡献率如R2=0.64,说明解释变量对预报变量的贡献率为64%,即解释变量解释了64%的预报变量的变化,或者说预报变量的差异有64%是由解释变量引起的,而随机误差则解释了36%的预报变量的变化,也就是预报变量另外36%的差异是由随机误差引起的;如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型贡献率R2贡献率1 R2例、一只红铃虫的产卵数y和温度x有关现收集了7

    12、组观测数据列于表中:试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时的产卵数目温度xoC21232527293235产卵数y/个7112124661153253非线性回归模型非线性回归模型050100150200250300350202224262830323436温度产卵数解:作散点图:从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似这些散点更像是集中在一条指数曲线或二次曲线的附近选变量解:选取气温为解释变量x,产卵数为预报变量y画散点图假设线性回归方程为:?=bx+a选 模 型分析和预测当x=28时,y=19.8728-463.73 93估计参数由计算器

    13、得:线性回归方程为y=19.87x-463.73相关指数R2=r20.8642=0.7464所以,可预测温度为28oC时产卵数目为93个050100150200250300350036912151821242730333639当x=28时,y=19.8728-463.73 93方法一:一次函数模型3非线性回归模型思考:x=29时,y=66,9366?模型好不好?问题2如何求c1、c2?y=c1x2+c2变换y=c1t+c2非线性关系线性关系问题3令t=x2问题选用y=c1x2+c2,还是y=c1x2+cx+c2?-200-1000100200300400-40-30-20-1001020304

    14、0产卵数气温方法二:二次函数模型3非线性回归模型解:平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a温度21232527293235温度的平方t44152962572984110241225产卵数y/个711212466115325作散点图,并由计算器算得:y和t之间的线性回归方程为y=0.367t202.543,将t=x2代入线性回归方程得:y=0.367x2-202.54,当x=28时,y=0.367282202.5485,且相关指数R2=0.802,所以,可预测温度为28oC时产卵数目为85个产卵数y/个050

    15、1001502002503003500150300450600750900105012001350t3非线性回归模型0.7464问题变换y=bx+a非线性关系线性关系21c xyc e?问题如何选取指数函数的底?产卵数-50050100150200250300350400450-10-50510152025303540气温两边取对数方法三:指数函数模型3非线性回归模型温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数y/个71121246611532500.40.81.21.622.42.80369121518212427303336

    16、39xz当x=28时,y 44,所以,可预测温度为28oC时产卵数目为44个由计算器算得:z关于x的线性回归方程为:z=0.272x-3.849,所以有且相关指数R20.98,0.2723.849 xye?解:对数变换:在中两边取自然对数得:令,则就转换为z=bx+a44333443lnln()lnlnlnlnlnc xc xyc ececc xec xc?43c xyc e?34ln,ln,zy acbc?43c xyc e?3非线性回归模型0.802函数模型相关指数R2线性回归模型0.7464二次函数模型0.802指数函数模型0.98(1)由上表显而易见,指数函数模型最好!思考:最好的模型

    17、是哪个?-10001002003004000510152025303540产卵数线性模型-200-1000100200300400-40-30-20-10010203040产卵数气温二次函数模型-50050100150200250300350400450-10-50510152025303540产卵数气温指数函数模型3非线性回归模型x21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968故指数函数模型的拟合效果比二次函数

    18、的模拟效果好.3非线性回归模型(1)0.2723.849(2)2?,0.367202.543.xyeyx?(2)另外由计算可得:则回归方程的残差计算公式分别为:(1)(1)0.2723.849(2)(2)2?,1,2,.,7;?0.367202.543,1,2,.,7.xiiiiiiiieyyyeieyyyxi?(1)?e(2)?e计算可得残差表:(1)(2)?1550.53815448.431QQ?计算可得残差平方和为:总结:1、比较两个模型拟合效果的方法?12?1,?,;yfx aygx babab?分别建立对应于两个模型的回归方程 与其中和分别是参数和的估计值?22122;RR分别计算两

    19、个模型的残差平方和或相关指数 和(3)比较两个模型的残差平方和或相关指数大小,残差平方和越小或相关指数R2越大的模型拟合效果越好.3非线性回归模型注:画出残差图,通过观察残差图是否有异常(如个别数据对应的残差过大、残差呈现不随机的规律、残差不是落在水平的带状区域等),也可以初步判断数据是否有误或模型是否合适总结:2、非线性回归问题的处理方法(2)求回归方程的步骤:确定研究对象:明确哪个变量是解释变量x,哪个变量是预报变量y;根据原始数据(x,y)画出散点图;根据散点图,选择恰当的拟合函数;求线性回归方程(若是非线性回归模型,作恰当的变换,将其转化成线性函数);在的基础上通过相应的变换,即可得非

    20、线性回归方程3非线性回归模型非线性回归模型(1)两个变量不呈线性相关关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型(1)二次函数型:2ybxa?,可令2tx?,原方程可化为ybta?;(2)指数型函数:bxyae?,可以两边同时取以e的对数,可得lnlnybxa?,再令lnzy?,lnaa?,原方程可化为zbxa?;(3)反比例函数:byax?,可令1tx?,原方程可化为yabt?;3非线性回归模型非线性回归模型总结:3、非线性相关问题中常见的几种线性变换三、应用举例三、应用举例例 1、有下列数据:x 1 2 3 y 3 5.99 12.01 下列四个函

    21、数中,模拟效果最好的是 A13 2xy?B2logyx?C3yx?D2yx?A【解析】将1,2,3x?分别代入四个函数中,易得选项A中函数对应的残差平方和321?()iiiyy?最小,所以正确答案为A 三、应用举例三、应用举例【解析】由残差的定义可得:?1(1)4(2)baba?,解得:?3b?例3、设某产品的广告费用x(万元)与销售额y(万元)具有线性相关关系,根据一组样本数据(,)(1,2,)iix yin?L,用最小二乘法建立的回归方程为?9.49.1yx?,则下列说法:相关系数0r?;若该产品的广告费用增加1万元,则销售额约增加9.4万元;若该产品的广告费用为6万元时,则其销售额为65

    22、.5万元;若由该组样本数据计算出的相关系数0.8r?,则说明该产品的销售额的差异有20%是由随机误差引起的 其中正确的个数为()A1 B2 C3 D4 3B例2、已知一系列样本点(,)(1,2,)iix yin?L的线性回归方程为?ybxa?,若样本点(1,1)与(2,4)的残差相同,则?b?三、应用举例三、应用举例例4、(201519)某公司为确定下一年度投入某种产品的宣传费,需 了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费ix和年销售量iy(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值 x y w 821()i

    23、ixx?821()iiww?81()()iiixxyy?81()()iiiww yy?46.6 563 6.8 289.8 1.6 1469 108.8 表中iiwx?,w=1881iiw?(1)根据散点图判断,yabx?与ycd x?哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利率z与x、y的关系为0.2zyx?根据(2)的结果回答下列问题:()年宣传费x=49时,年销售量及年利润的预报值是多少?()年宣传费x为何值时,年利率的预报值最大?三、应用举例三、应用举例【解析

    24、】(1)由散点图可以判断,ycdx?适宜作为年销售量y关于年宣传费x的回归方程类型(2)令wx?,先建立y关于w的线性回归方程,由于:?81821108.8?681.6iiiiiww yydww?,?563686.8100.6cydw?,所以y关于w的回归方程为?100.668yw?,因此y关于x的回归方程为?100.668.yx?(3)(i)由(2)知,当49x?时,年销售量y的预报值?100.66849=576.6y?,年利润z的预报值?576.6 0.24966.32.z?(ii)根据(2)的结果知,年利润z的预报值?0.2(100.668)13.620.12.zxxxx?所以当13.66.82x?,即46.24x?时,?z取得最大值,故年宣传费为46.24千元时,年利润的预报值最大 回归分析的基本思想知识结构图问题背景分析线性回归模型两个变量线性相关最小二乘法两个变量非线性相关非线性回归模型残差分析散点图应用2R转化

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:湖北省华中师大一附中2020年高二网课课件回归分析的基本思想及初步应用.ppt
    链接地址:https://www.163wenku.com/p-4506755.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库