书签 分享 收藏 举报 版权申诉 / 28
上传文档赚钱

类型人教A版高中数学选修23课件《31回归分析(二)》x.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4324084
  • 上传时间:2022-11-29
  • 格式:PPTX
  • 页数:28
  • 大小:361.20KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《人教A版高中数学选修23课件《31回归分析(二)》x.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    31回归分析二 人教 高中数学 选修 23 课件 31 回归 分析 下载 _人教A版_数学_高中
    资源描述:

    1、(鼎尚图文(鼎尚图文*整理制作)整理制作)3.1回回归归分分析析的的基基本本思思想想及及其其初初步步应应用用(二二)高高二二数数学学选选修修2-311/29/2022比数学3中“回归”增加的内容数数学学统统计计1.画画散散点点图图2.了了解解最最小小二二乘乘法法的的思思想想3.求求回回归归直直线线方方程程ybxa4.用用回回归归直直线线方方程程解解决决应应用用问问题题选修-统计案例5.引引入入线线性性回回归归模模型型ybxae6.了了解解模模型型中中随随机机误误差差项项e产产生生的的原原因因7.了了解解相相关关指指数数R2和和模模型型拟拟合合的的效效果果之之间间的的关关系系8.了了解解残残差差

    2、图图的的作作用用9.利利用用线线性性回回归归模模型型解解决决一一类类非非线线性性回回归归问问题题10.正正确确理理解解分分析析方方法法与与结结果果11/29/2022回回归归分分析析的的内内容容与与步步骤骤:统统计计检检验验通通过过后后,最最后后是是利利用用回回归归模模型型,根根据据自自变变量量去去估估计计、预预测测因因变变量量。回回归归分分析析通通过过一一个个变变量量或或一一些些变变量量的的变变化化解解释释另另一一变变量量的的变变化化。其其主主要要内内容容和和步步骤骤是是:首首先先根根据据理理论论和和对对问问题题的的分分析析判判断断,将将变变量量分分为为自自变变量量和和因因变变量量;其其次次

    3、,设设法法找找出出合合适适的的数数学学方方程程式式(即即回回归归模模型型)描描述述变变量量间间的的关关系系;由由于于涉涉及及到到的的变变量量具具有有不不确确定定性性,接接着着还还要要对对回回归归模模型型进进行行统统计计检检验验;11/29/2022例例1从从某某大大学学中中随随机机选选取取8名名女女大大学学生生,其其身身高高和和体体重重数数据据如如表表1-1所所示示。编号12345678身高/cm165165 157 170 175 165 155 170体重/kg4857505464614359求求根根据据一一名名女女大大学学生生的的身身高高预预报报她她的的体体重重的的回回归归方方程程,并并

    4、预预报报一一名名身身高高为为172cm的的女女大大学学生生的的体体重重。案案例例1:女女大大学学生生的的身身高高与与体体重重解解:1、选选取取身身高高为为自自变变量量x,体体重重为为因因变变量量y,作作散散点点图图:2、由由散散点点图图知知道道身身高高和和体体重重有有比比较较好好的的线线性性相相关关关关系系,因因此此可可以以用用线线性性回回归归方方程程刻刻画画它它们们之之间间的的关关系系。11/29/2022172.85849.0 xy分分析析:由由于于问问题题中中要要求求根根据据身身高高预预报报体体重重,因因此此选选取取身身高高为为自自变变量量,体体重重为为因因变变量量学学身身高高172cm

    5、女172cm女大大生生体体重重y=0.849y=0.849172-85.712=60.316(kg)172-85.712=60.316(kg)2 2.回回归归方方程程:1.散散点点图图;本本例例中中,r=0.7980.75这这表表明明体体重重与与身身高高有有很很强强的的线线性性相相关关关关系系,从从而而也也表表明明我我们们建建立立的的回回归归模模型型是是有有意意义义的的。11/29/2022探探究究:身身高高为为172cm的的女女大大学学生生的的体体重重一一定定是是60.316kg吗吗?如如果果不不是是,你你能能解解析析一一下下原原因因吗吗?答答:身身高高为为172cm的的女女大大学学生生的的

    6、体体重重不不一一定定是是60.316kg,但但一一般般可可以以认认为为她她的的体体重重接接近近于于60.316kg。即即,用用这这个个回回归归方方程程不不能能给给出出每每个个身身高高为为172cm的的女女大大学学生生的的体体重重的的预预测测值值,只只能能给给出出她她们们平平均均体体重重的的值值。11/29/2022例例1从从某某大大学学中中随随机机选选取取8名名女女大大学学生生,其其身身高高和和体体重重数数据据如如表表1-1所所示示。编号12345678身高/cm165165 157 170 175 165 155 170体重/kg4857505464614359求求根根据据一一名名女女大大学

    7、学生生的的身身高高预预报报她她的的体体重重的的回回归归方方程程,并并预预报报一一名名身身高高为为172cm的的女女大大学学生生的的体体重重。案案例例1:女女大大学学生生的的身身高高与与体体重重解解:1、选选取取身身高高为为自自变变量量x,体体重重为为因因变变量量y,作作散散点点图图:2、由由散散点点图图知知道道身身高高和和体体重重有有比比较较好好的的线线性性相相关关关关系系,因因此此可可以以用用线线性性回回归归方方程程刻刻画画它它们们之之间间的的关关系系。3、从从散散点点图图还还看看到到,样样本本点点散散布布在在某某一一条条直直线线的的附附近近,而而不不是是在在一一条条直直线线上上,所所以以不

    8、不能能用用一一次次函函数数y=bx+a描描述述它它们们关关系系。11/29/2022我我们们可可以以用用下下面面的的线线性性回回归归模模型型来来表表示示:y=bx+a+e,(3)其其中中a和和b为为模模型型的的未未知知参参数数,e称称为为随随机机误误差差。y=bx+a+e,E(e)=0,D(e)=(4)2.在在线线性性回回归归模模型型(4)中中,随随机机误误差差e的的方方差差越越小小,通通过过回回归归直直线线(5)2ybxa预预报报真真实实值值y的的精精度度越越高高。随随机机误误差差是是引引起起预预报报值值与与真真实实值值y之之间间的的误误差差的的原原因因之之一一,其其大大小小取取决决于于随随

    9、机机误误差差的的方方差差。y 另另一一方方面面,由由于于公公式式(1)和和(2)中中和和为为截截距距和和斜斜率率的的估估计计值值,它它们们与与真真实实值值a和和b之之间间也也存存在在误误差差,这这种种误误差差是是引引起起预预报报值值与与真真实实值值y之之间间误误差差的的另另一一个个原原因因。y ab11/29/2022思思考考:产产生生随随机机误误差差项项e的的原原因因是是什什么么?随随机机误误差差e e的的来来源源(可可以以推推广广到到一一般般):1、忽忽略略了了其其它它因因素素的的影影响响:影影响响身身高高y的的因因素素不不只只是是体体重重x,可可能能还还包包括括遗遗传传基基因因、饮饮食食

    10、习习惯惯、生生长长环环境境等等因因素素;2、用用线线性性回回归归模模型型近近似似真真实实模模型型所所引引起起的的误误差差;3、身身高高y的的观观测测误误差差。以以上上三三项项误误差差越越小小,说说明明我我们们的的回回归归模模型型的的拟拟合合效效果果越越好好。11/29/2022函函数数模模型型与与回回归归模模型型之之间间的的差差别别函数模型:abxy回归模型:eabxy可以提供选择模型的准则11/29/2022函函数数模模型型与与回回归归模模型型之之间间的的差差别别函数模型:abxy回归模型:eabxy线线性性回回归归模模型型y=bx+a+e增增加加了了随随机机误误差差项项e,因因变变量量y的

    11、的值值由由自自变变量量x和和随随机机误误差差项项e共共同同确确定定,即即自自变变量量x只只能能解解析析部部分分y的的变变化化。在在统统计计中中,我我们们也也把把自自变变量量x称称为为解解析析变变量量,因因变变量量y称称为为预预报报变变量量。所所以以,对对于于身身高高为为172cm的的女女大大学学生生,由由回回归归方方程程可可以以预预报报其其体体重重为为0.849 7285.71260.316()ykg11/29/2022思思考考:如如何何刻刻画画预预报报变变量量(体体重重)的的变变化化?这这个个变变化化在在多多大大程程度度上上与与解解析析变变量量(身身高高)有有关关?在在多多大大程程度度上上与

    12、与随随机机误误差差有有关关?假假设设身身高高和和随随机机误误差差的的不不同同不不会会对对体体重重产产生生任任何何影影响响,那那么么所所有有人人的的体体重重将将相相同同。在在体体重重不不受受任任何何变变量量影影响响的的假假设设下下,设设8名名女女大大学学生生的的体体重重都都是是她她们们的的平平均均值值,即即8个个人人的的体体重重都都为为54.5kg。54.554.554.554.554.554.554.554.5体重/kg170155165175170157165165身高/cm87654321编号54.5kg在在散散点点图图中中,所所有有的的点点应应该该落落在在同同一一条条水水平平直直线线上上

    13、,但但是是观观测测到到的的数数据据并并非非如如此此。这这就就意意味味着着预预报报变变量量(体体重重)的的值值受受解解析析变变量量(身身高高)或或随随机机误误差差的的影影响响。对对回回归归模模型型进进行行统统计计检检验验11/29/20225943616454505748体重/kg170155165175170157165165身高/cm87654321编号例例如如,编编号号为为6的的女女大大学学生生的的体体重重并并没没有有落落在在水水平平直直线线上上,她她的的体体重重为为61kg。解解析析变变量量(身身高高)和和随随机机误误差差共共同同把把这这名名学学生生的的体体重重从从54.5kg“推推”到

    14、到了了61kg,相相差差6.5kg,所所以以6.5kg是是解解析析变变量量和和随随机机误误差差的的组组合合效效应应。编编号号为为3的的女女大大学学生生的的体体重重并并也也没没有有落落在在水水平平直直线线上上,她她的的体体重重为为50kg。解解析析变变量量(身身高高)和和随随机机误误差差共共同同把把这这名名学学生生的的体体重重从从50kg“推推”到到了了54.5kg,相相差差-4.5kg,这这时时解解析析变变量量和和随随机机误误差差的的组组合合效效应应为为-4.5kg。用用这这种种方方法法可可以以对对所所有有预预报报变变量量计计算算组组合合效效应应。数数学学上上,把把每每个个效效应应(观观测测值

    15、值减减去去总总的的平平均均值值)的的平平方方加加起起来来,即即用用21()niiyy表表示示总总的的效效应应,称称为为总总偏偏差差平平方方和和。在在例例1中中,总总偏偏差差平平方方和和为为354。11/29/20225943616454505748体重/kg170155165175170157165165身高/cm87654321编号那那么么,在在这这个个总总的的效效应应(总总偏偏差差平平方方和和)中中,有有多多少少来来自自于于解解析析变变量量(身身高高)?有有多多少少来来自自于于随随机机误误差差?假假设设随随机机误误差差对对体体重重没没有有影影响响,也也就就是是说说,体体重重仅仅受受身身高高

    16、的的影影响响,那那么么散散点点图图中中所所有有的的点点将将完完全全落落在在回回归归直直线线上上。但但是是,在在图图中中,数数据据点点并并没没有有完完全全落落在在回回归归直直线线上上。这这些些点点散散布布在在回回归归直直线线附附近近,所所以以一一定定是是随随机机误误差差把把这这些些点点从从回回归归直直线线上上“推推”开开了了。在在例例1中中,残残差差平平方方和和约约为为128.361。因因此此,数数据据点点和和它它在在回回归归直直线线上上相相应应位位置置的的差差异异是是随随机机误误差差的的效效应应,称称为为残残差差。)iiyy(iiieyy=例例如如,编编号号为为6的的女女大大学学生生,计计算算

    17、随随机机误误差差的的效效应应(残残差差)为为:61(0.849 16585.712)6.627对对每每名名女女大大学学生生计计算算这这个个差差异异,然然后后分分别别将将所所得得的的值值平平方方后后加加起起来来,用用数数学学符符号号21()niiiyy称称为为残残差差平平方方和和,它它代代表表了了随随机机误误差差的的效效应应。表表示示为为:即即,(,)Q a b类类比比样样本本方方差差估估计计总总体体方方差差的的思思想想,可可以以用用作作为为的的估估计计量量,越越小小,预预报报精精度度越越高高。22111(,)(2)22nieQ a b nnn2211/29/2022由由于于解解析析变变量量和和

    18、随随机机误误差差的的总总效效应应(总总偏偏差差平平方方和和)为为354,而而随随机机误误差差的的效效应应为为128.361,所所以以解解析析变变量量的的效效应应为为解解析析变变量量和和随随机机误误差差的的总总效效应应(总总偏偏差差平平方方和和)=解解析析变变量量的的效效应应(回回归归平平方方和和)+随随机机误误差差的的效效应应(残残差差平平方方和和)354-128.361=225.639 这这个个值值称称为为回回归归平平方方和和。我我们们可可以以用用相相关关指指数数R2来来刻刻画画回回归归的的效效果果,其其计计算算公公式式是是22121()11()niiiniiyyRyy残差平方和。总偏差平方

    19、和2221121()()()nniiiiiniiyyyyRyy总偏差平方和残差平方和回归平方和总偏差平方和总偏差平方和11/29/2022离离差差平平方方和和的的分分解解(三个平方和的意义)1.总总偏偏差差平平方方和和(SST)q反反映映因因变变量量的的n个个观观察察值值与与其其均均值值的的总总离离差差2.回回归归平平方方和和(SSR)q反反映映自自变变量量x的的变变化化对对因因变变量量y取取值值变变化化的的影影响响,或或者者说说,是是由由于于x与与y之之间间的的线线性性关关系系引引起起的的y的的取取值值变变化化,也也称称为为可可解解释释的的平平方方和和3.残残差差平平方方和和(SSE)q反反

    20、映映除除x以以外外的的其其他他因因素素对对y取取值值的的影影响响,也也称称为为不不可可解解释释的的平平方方和和或或剩剩余余平平方方和和11/29/2022样样本本决决定定系系数数(判定系数)1.回回归归平平方方和和占占总总离离差差平平方方和和的的比比例例2221122111nniiiinniiiiyyyySSRRSSTyyyy11/29/2022显显然然,R2的的值值越越大大,说说明明残残差差平平方方和和越越小小,也也就就是是说说模模型型拟拟合合效效果果越越好好。在在线线性性回回归归模模型型中中,R2表表示示解解析析变变量量对对预预报报变变量量变变化化的的贡贡献献率率。R2越越接接近近1,表表

    21、示示回回归归的的效效果果越越好好(因因为为R2越越接接近近1,表表示示解解析析变变量量和和预预报报变变量量的的线线性性相相关关性性越越强强)。如如果果某某组组数数据据可可能能采采取取几几种种不不同同回回归归方方程程进进行行回回归归分分析析,则则可可以以通通过过比比较较R2的的值值来来做做出出选选择择,即即选选取取R2较较大大的的模模型型作作为为这这组组数数据据的的模模型型。总总的的来来说说:相相关关指指数数R2是是度度量量模模型型拟拟合合效效果果的的一一种种指指标标。在在线线性性模模型型中中,它它代代表表自自变变量量刻刻画画预预报报变变量量的的能能力力。我我们们可可以以用用相相关关指指数数R2

    22、来来刻刻画画回回归归的的效效果果,其其计计算算公公式式是是22121()11()niiiniiyyRyy残差平方和。总偏差平方和11/29/20221354总计0.36128.361残差变量0.64225.639随机误差比例平方和来源表表1-3从从表表3-1中中可可以以看看出出,解解析析变变量量对对总总效效应应约约贡贡献献了了64%,即即R20.64,可可以以叙叙述述为为“身身高高解解析析了了64%的的体体重重变变化化”,而而随随机机误误差差贡贡献献了了剩剩余余的的36%。所所以以,身身高高对对体体重重的的效效应应比比随随机机误误差差的的效效应应大大得得多多。我我们们可可以以用用相相关关指指数

    23、数R2来来刻刻画画回回归归的的效效果果,其其计计算算公公式式是是22121()11()niiiniiyyRyy残差平方和。总偏差平方和11/29/2022表表3-2列列出出了了女女大大学学生生身身高高和和体体重重的的原原始始数数据据以以及及相相应应的的残残差差数数据据。在在研研究究两两个个变变量量间间的的关关系系时时,首首先先要要根根据据散散点点图图来来粗粗略略判判断断它它们们是是否否线线性性相相关关,是是否否可可以以用用回回归归模模型型来来拟拟合合数数据据。残残差差分分析析与与残残差差图图的的定定义义:然然后后,我我们们可可以以通通过过残残差差来来判判断断模模型型拟拟合合的的效效果果,判判断

    24、断原原始始数数据据中中是是否否存存在在可可疑疑数数据据,这这方方面面的的分分析析工工作作称称为为残残差差分分析析。12,ne ee 编编号号12345678身身高高/cm165165157170175165155170体体重重/kg4857505464614359残残差差-6.3732.6272.419-4.6181.1376.627-2.8830.382我我们们可可以以利利用用图图形形来来分分析析残残差差特特性性,作作图图时时纵纵坐坐标标为为残残差差,横横坐坐标标可可以以选选为为样样本本编编号号,或或身身高高数数据据,或或体体重重估估计计值值等等,这这样样作作出出的的图图形形称称为为残残差差

    25、图图。11/29/2022残残差差图图的的制制作作及及作作用用。坐坐标标纵纵轴轴为为残残差差变变量量,横横轴轴可可以以有有不不同同的的选选择择;若若模模型型选选择择的的正正确确,残残差差图图中中的的点点应应该该分分布布在在以以横横轴轴为为心心的的带带形形区区域域;对对于于远远离离横横轴轴的的点点,要要特特别别注注意意。身高与体重残差图异常点错误数据模型问题几几点点说说明明:第第一一个个样样本本点点和和第第6个个样样本本点点的的残残差差比比较较大大,需需要要确确认认在在采采集集过过程程中中是是否否有有人人为为的的错错误误。如如果果数数据据采采集集有有错错误误,就就予予以以纠纠正正,然然后后再再重

    26、重新新利利用用线线性性回回归归模模型型拟拟合合数数据据;如如果果数数据据采采集集没没有有错错误误,则则需需要要寻寻找找其其他他的的原原因因。另另外外,残残差差点点比比较较均均匀匀地地落落在在水水平平的的带带状状区区域域中中,说说明明选选用用的的模模型型计计较较合合适适,这这样样的的带带状状区区域域的的宽宽度度越越窄窄,说说明明模模型型拟拟合合精精度度越越高高,回回归归方方程程的的预预报报精精度度越越高高。11/29/2022例例2、在在一一段段时时间间内内,某某中中商商品品的的价价格格x元元和和需需求求量量Y件件之之间间的的一一组组数数据据为为:求求出出Y对对的的回回归归直直线线方方程程,并并

    27、说说明明拟拟合合效效果果的的好好坏坏。价价格格x1416182022需需求求量量Y1210753解解:18,7.4,xy555221111660,327,620,iiiiiiixyx y7.4 1.15 1828.1.a1.1528.1.yx 回归直线方程为:51522155iiiiix yxybxx26205 18 7.41.15.16605 18 11/29/2022例例2、在在一一段段时时间间内内,某某中中商商品品的的价价格格x元元和和需需求求量量Y件件之之间间的的一一组组数数据据为为:求求出出Y对对的的回回归归直直线线方方程程,并并说说明明拟拟合合效效果果的的好好坏坏。价价格格x141

    28、6182022需需求求量量Y1210753列列出出残残差差表表为为521()iiiyy0.3,521()iiyy53.2,5221521()1()iiiiiyyRyy 0.994因因而而,拟拟合合效效果果较较好好。iiyyiyy00.3-0.4-0.10.24.62.6-0.4-2.4-4.411/29/2022用用身身高高预预报报体体重重时时,需需要要注注意意下下列列问问题题:1、回回归归方方程程只只适适用用于于我我们们所所研研究究的的样样本本的的总总体体;2、我我们们所所建建立立的的回回归归方方程程一一般般都都有有时时间间性性;3、样样本本采采集集的的范范围围会会影影响响回回归归方方程程的

    29、的适适用用范范围围;4、不不能能期期望望回回归归方方程程得得到到的的预预报报值值就就是是预预报报变变量量的的精精确确值值。事事实实上上,它它是是预预报报变变量量的的可可能能取取值值的的平平均均值值。这这些些问问题题也也使使用用于于其其他他问问题题。涉涉及及到到统统计计的的一一些些思思想想:模模型型适适用用的的总总体体;模模型型的的时时间间性性;样样本本的的取取值值范范围围对对模模型型的的影影响响;模模型型预预报报结结果果的的正正确确理理解解。小小结结11/29/2022一一般般地地,建建立立回回归归模模型型的的基基本本步步骤骤为为:(1)确确定定研研究究对对象象,明明确确哪哪个个变变量量是是解

    30、解析析变变量量,哪哪个个变变量量是是预预报报变变量量。(2)画画出出确确定定好好的的解解析析变变量量和和预预报报变变量量的的散散点点图图,观观察察它它们们之之间间的的关关系系(如如是是否否存存在在线线性性关关系系等等)。(3)由由经经验验确确定定回回归归方方程程的的类类型型(如如我我们们观观察察到到数数据据呈呈线线性性关关系系,则则选选用用线线性性回回归归方方程程y=bx+a).(4)按按一一定定规规则则估估计计回回归归方方程程中中的的参参数数(如如最最小小二二乘乘法法)。(5)得得出出结结果果后后分分析析残残差差图图是是否否有有异异常常(个个别别数数据据对对应应残残差差过过大大,或或残残差差呈呈现现不不随随机机的的规规律律性性,等等等等),过过存存在在异异常常,则则检检查查数数据据是是否否有有误误,或或模模型型是是否否合合适适等等。11/29/202211/29/202211/29/2022

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:人教A版高中数学选修23课件《31回归分析(二)》x.pptx
    链接地址:https://www.163wenku.com/p-4324084.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库