书签 分享 收藏 举报 版权申诉 / 41
上传文档赚钱

类型人教A版高中数学选修2-3 第三章3.1回归分析的基本思想及其初步应用 ppt课件(共41张PPT).pptx

  • 上传人(卖家):lilei2001
  • 文档编号:1148224
  • 上传时间:2021-03-05
  • 格式:PPTX
  • 页数:41
  • 大小:769.41KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《人教A版高中数学选修2-3 第三章3.1回归分析的基本思想及其初步应用 ppt课件(共41张PPT).pptx》由用户(lilei2001)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    人教A版高中数学选修2-3 第三章 3.1回归分析的基本思想及其初步应用 ppt课件共41张PPT 人教 高中数学 选修 第三 3.1 回归 分析 基本 思想 及其 初步 应用 ppt 课件 41 下载 _人教A版_数学_高中
    资源描述:

    1、导入新课导入新课 在在数学数学3中,我们对两个具有线性相关中,我们对两个具有线性相关 关系的变量利用回归分析的方法进行了研究,关系的变量利用回归分析的方法进行了研究, 其步骤为其步骤为: 画散点图画散点图 求回归直线方程求回归直线方程 用直线方程进行预报用直线方程进行预报 函数关系是一种确定性关系函数关系是一种确定性关系, ,而相关关系是一而相关关系是一 种非确定性关系种非确定性关系. .那么那么, ,这节课我们就学习对具有这节课我们就学习对具有 相关关系的两个变量进行统计分析的一种常用方相关关系的两个变量进行统计分析的一种常用方 法法回归分析回归分析. . 提问:“名师出高徒”这句彦语的意提

    2、问:“名师出高徒”这句彦语的意 思是什么?有名气的老师就一定能教出厉思是什么?有名气的老师就一定能教出厉 害的学生吗?这两者之间是否有关?害的学生吗?这两者之间是否有关? 1.1回归分析的基本思想回归分析的基本思想 及及 其初步应用其初步应用 通过典型案例的探究,进一步了解回通过典型案例的探究,进一步了解回 归分析的基本思想、方法及初步应用归分析的基本思想、方法及初步应用. 了解回归模型和函数模型的区别任了解回归模型和函数模型的区别任 何模型只能近似描述实际问题何模型只能近似描述实际问题 了解残差分析和指标了解残差分析和指标 的含义 的含义. 教学目标教学目标 知识目标知识目标 能力目标能力目

    3、标 具有初步应用回归分析的能力具有初步应用回归分析的能力. 情感目标情感目标 通过对回归分析的基本思想的学习,能通过对回归分析的基本思想的学习,能 够在现实生活中应用此思想够在现实生活中应用此思想. 教学重难点教学重难点 (1)了解线性回归模型与函数模型的差异)了解线性回归模型与函数模型的差异; (2)了解判断刻画模型拟合效果的方法)了解判断刻画模型拟合效果的方法 相关指数和残差分析相关指数和残差分析. 解释残差变量的含义,了解偏差平解释残差变量的含义,了解偏差平 方和分解的思想方和分解的思想. 探究探究 对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据 (x1,y1),(x2,y

    4、2),(xn,yn), 我们知道回归直线我们知道回归直线y=bx+a的斜率和截距的最的斜率和截距的最 小二乘估计分别为小二乘估计分别为 n ii i=1 n 2 i i=1 (x - x)(y -y) b =, (x - x) a = y -bx, 其中其中 nn ii i=1i=1 11 x =x ,y =y ,(x,y) nn 称为称为样本点的中心样本点的中心,你能推导出这两个,你能推导出这两个 计算公式吗?计算公式吗? 回归直线过回归直线过 样本点的中心样本点的中心 从已经学过的知识我们知道,斜距从已经学过的知识我们知道,斜距 和斜率和斜率 分别是使分别是使 a b iiii Q(,)=

    5、 y -y = y -(x +) 取最小时取最小时 的值的值.由于由于 , n 2 ii i=1 Q(,) =y -x -(y-x)+(y-x)- n 2 iiii i=1 2 y -x -(y-x) +2y -x -(y-x) (y-x)-+(y-x)- n ii i=1 n ii i=1 y -x -(y-x)(y-x-) = (y-x-)y -x -(y-x) 注注意意到到 nn ii i=1i=1 = (y-x-)y -x -n(y-x) = (y-x-)ny-nx-n(y-x)= 0, nn 2 iiii i=1i=1 2 =y -x -(y-x) +2y -x -(y-x)(y-x

    6、-) +n(y-x-) , 继续继续 n 22 ii i=1 Q(,) =y -x -(y-x) +n(y-x-),因因此此 22 nnn 22 iiii i=1i=1i=1 =(x -x) -2(x -x)(y -y)+(y -y) +n(y-x-) 2 nn 2 2 iiiin 2 i=1i=1 i nn 22 i=1 ii i=1i=1 2 n i i=1 (x -x)(y -y)(x -x)(y -y) =n(y-x-) +(x -x)- (x -x)(x -x) +(y -y) 继续继续 在上式中,后两项和在上式中,后两项和 无关,而前两无关,而前两 项为非负数,因此要使项为非负数,

    7、因此要使Q取得最小值,当且仅取得最小值,当且仅 当前两项的值均为当前两项的值均为0,即有,即有 n ii i=1 n 2 i i=1 (x -x)(y -y) = (x -x) 这正是我们所要推导的公式这正是我们所要推导的公式. , 从某大学中随机选取从某大学中随机选取8名女大学生,其身名女大学生,其身 高和体重数据如下表所示:高和体重数据如下表所示: 例题例题1 编编 号号 1 2 3 4 5 6 7 8 身高身高/cm 165 165 157 170 175 165 155 170 体重体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重求根据一

    8、名女大学生的身高预报她的体重 的回归方程,并预报一名身高为的回归方程,并预报一名身高为172cm的女大的女大 学生的体重学生的体重. 解答解答 第一步第一步:画散点图画散点图 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 第二步:求回归方程第二步:求回归方程 第三步第三步:代值计算代值计算 探究探究 身高为身高为 172c的女大的女大 学生的体重一学生的体重一 定是定是60.316kg 吗?如果不是吗?如果不是, 其原因是什么其原因是什么? 计算器得:计算器得: 故线性回归方程:故线性回归方程: 当当x=172时,时, 0.849.b -85.

    9、712,a 85.712.-0.849xy y 0.849 172-85.712 60.316(kg) 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 显然,身高显然,身高172cm的女大学生的体重不一的女大学生的体重不一 定是定是60.316kg,但一般可以认为她的体重在,但一般可以认为她的体重在 60.316kg左右,下图中的样本点和回归直线的左右,下图中的样本点和回归直线的 相互位置说明了这一点相互位置说明了这一点. 由于所有的样本点不共线由于所有的样本点不共线,而只是散布而只是散布 在某一条直线的附近在某一条直线的附近,所以身高和体重的关

    10、所以身高和体重的关 系可用线性回归模型系可用线性回归模型 y=bx+a+e 来表示来表示,这里这里a和和b为模型的未知参数为模型的未知参数,e 是是y与与bx+a之间的误差之间的误差.通常通常e为随机变量为随机变量, 称 为 随 机 误 差称 为 随 机 误 差 . 它 的 均 值它 的 均 值 E(e)=0 , 方 差方 差 D(e)= 20,这样线性回归的完整表达式为这样线性回归的完整表达式为 y=bx+a+e E(e)=0, D(e)= 2. 注意注意 存在误差的原因存在误差的原因 (1)随机误差,其大小取决于随机误差的方)随机误差,其大小取决于随机误差的方 差差. 在线性回归模型中,随

    11、机误差在线性回归模型中,随机误差e的方差的方差 2越越 小小 ,用,用bx+a预报真实值预报真实值y的精度越高的精度越高. (2) 和和 为斜率和截距的估计值,它们与为斜率和截距的估计值,它们与 真实值真实值a和和b之间也存在误差之间也存在误差. b a 要牢记!要牢记! 探究探究 在线性回归模型中,在线性回归模型中,e是用是用bx+a预报真实值预报真实值y 的随机误差,它是一个不可观测的量,那么应该的随机误差,它是一个不可观测的量,那么应该 怎样研究随机误差呢?怎样研究随机误差呢? 在实际应用中,我们用回归方程在实际应用中,我们用回归方程 a xb y 中的中的 估计估计bx+a. 由于随机

    12、误差由于随机误差e=y-(bx+a), 所以所以 是是e的估计值的估计值. 对于样本点对于样本点 (x1,y1),(x2,y2),(xn,yn) y y -ye 而言,它们的随机误差为而言,它们的随机误差为 ei=yi-bxi-a,i=1,2,n, 其估计值为其估计值为 n,1,2,.,2,.,i,i a xb y y y e iiii i e 称为相应于点称为相应于点(xi,yi)的的残差残差(residual). 要牢记!要牢记! 思考思考 如何发现数据中的错误?如何衡量模型如何发现数据中的错误?如何衡量模型 的拟合效果?的拟合效果? (1)可以利用残差图来分析残差特性;)可以利用残差图来

    13、分析残差特性; (2)可以利用)可以利用. nn 22 iii 2i=1i=1 nn 22 ii i=1i=1 (y -y )(y -y) R= 1-= (y -y)(y -y) 来刻画回归的效果来刻画回归的效果. 何为残差图?何为残差图? 残差图残差图 作图时纵作图时纵 坐标为残差,坐标为残差, 横坐标可以选横坐标可以选 为样本编号,为样本编号, 或身高数据,或身高数据, 或体重的估计或体重的估计 值等,这样作值等,这样作 出的图形称为出的图形称为 残差图残差图. 0 编号编号 1 2 3 4 5 6 7 10 20 30 40 50 60 70 80 -10 -20 -30 -40 -50

    14、 -60 90 100 要牢记!要牢记! 对对R R2 2的理解的理解 (1)在含有一个解释变量的线性模型中,)在含有一个解释变量的线性模型中, R2恰恰 好等于相关系数好等于相关系数r的平方的平方. (2)对于已经获取的样本数据,)对于已经获取的样本数据, R2表达式中的表达式中的 为确定的数为确定的数. 因此因此R2越大,意味着残差平方和越大,意味着残差平方和 越小,即模型的拟合效果越好;反之,越差越小,即模型的拟合效果越好;反之,越差. n 1i 2 i )y-(y n 1i 2 i )y-(y 要牢记!要牢记! 用身高预报体重时,需要注意以下问题用身高预报体重时,需要注意以下问题 (1

    15、)回归方程只适用于我们所研究的样本)回归方程只适用于我们所研究的样本 总体;总体; (2)我们所建立的回归方程一般都有时间)我们所建立的回归方程一般都有时间 性;性; (3)样本取值的范围会影响回归方程的适)样本取值的范围会影响回归方程的适 用范围;用范围; (4)不能期望回归方程得到的预报值就是)不能期望回归方程得到的预报值就是 预报变量的精确值预报变量的精确值. 建立回归模型的基本步骤建立回归模型的基本步骤: : (1)确定研究对象,明确哪个变量是解释变确定研究对象,明确哪个变量是解释变 量,哪个变量是预报变量;量,哪个变量是预报变量; (2)画出解释变量和预报变量的散点图,观画出解释变量

    16、和预报变量的散点图,观 察它们之间的关系;察它们之间的关系; (3)由经验确定回归方程的类型;由经验确定回归方程的类型; (4)按一定规则估计回归方程中的参数;按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常,若得出结果后分析残差图是否有异常,若 有异常,检查数据是否有误,或模型是否合适等有异常,检查数据是否有误,或模型是否合适等. . 要牢记!要牢记! 为了对为了对x、Y两个变量进行统计分析,现两个变量进行统计分析,现 有以下两种线性模型有以下两种线性模型 和和 试比较哪一个模型拟合的效果更好试比较哪一个模型拟合的效果更好. 例题例题2 关于关于X X与与Y Y有如下数

    17、据有如下数据: : x 2 4 5 6 8 y 30 40 60 50 70 y = 6.5x+17.5 y = 7x +17 分析:既可分别求出两种模型下的总偏差分析:既可分别求出两种模型下的总偏差 平方和、残差平方和、回归平方和,也可分别平方和、残差平方和、回归平方和,也可分别 求出两种模型下的相关指数,然后再进行比较,求出两种模型下的相关指数,然后再进行比较, 从而得出结论从而得出结论. 5 2 ii 2 i=1 15 2 i i=1 (y -y ) 155 R =1-=1-= 0.845 1000 (y -y) 2 2 R =1- 5 2 ii i=1 5 2 i i=1 (y -y

    18、) 180 =1-= 0.82 1000 (y -y) , 84.5%82%,所以甲选用的模型拟合效果较好,所以甲选用的模型拟合效果较好. 解答解答 课堂小结课堂小结 1.数学知识数学知识 (1)建立回归模型及残差图分析的基本步骤;)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法;)不同模型拟合效果的比较方法; (3)相关指数和残差的分析)相关指数和残差的分析. 2. 数学思想数学思想 数形结合的思想,化归思想及整体思想数形结合的思想,化归思想及整体思想. 3.数学方法数学方法 数形结合法,转化法,换元法数形结合法,转化法,换元法. 针对性练习针对性练习 1. 某校有学

    19、生某校有学生2000人,其中高三学生人,其中高三学生500人,人, 为了了解学生身体素质情况,采用按年级分层抽为了了解学生身体素质情况,采用按年级分层抽 样的方法,从该学生中抽取一个样的方法,从该学生中抽取一个200人的样本,人的样本, 则样本中高三学生的人数为则样本中高三学生的人数为_. 解析:本题考查抽样的方法解析:本题考查抽样的方法. 由已知抽样比由已知抽样比 200/2000=1/10,故样本中高三学生数为,故样本中高三学生数为500* (1/10)=50. 2.下表提供了某厂节能降耗技术改造后生产甲下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量产品过程中记录的产量x(吨

    20、)与相应的生产能耗(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据(吨标准煤)的几组对照数据. x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图;)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法)请根据上表提供的数据,用最小二乘法 求出求出y关于关于x的线性回归方程的线性回归方程 y = bx+a . (3)已知该厂技改前)已知该厂技改前100吨甲产品的生产能吨甲产品的生产能 耗为耗为90吨标准煤试根据(吨标准煤试根据(2)求出的线性回归)求出的线性回归 方程,预测生产方程,预测生产100吨甲产品的生产能耗比技改吨甲产品的生产能耗比技改 前降

    21、低多少吨标准煤?前降低多少吨标准煤? 解析:解析: (1)如下图如下图 0 1 2 3 4 5 6 7 012345 产量 能耗 66.54.5645342.53(2) y x i n 1i i 4.5 4 6543 x 3.5 4 4.5432.5 y 866543 i 2222 n 1i 2 x 2 66.5-4 4.5 3.566.5-63 b = 0.7 86-4 4.586-81 a=Y-bX=3.5-0.7 4.5=0.35 故线性回归方程为故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产根据回归方程的预测,现在生产100吨产品吨产品 消耗的标准煤的数量

    22、为消耗的标准煤的数量为0.7100+0.35=70.35. 1.选择选择 课堂练习课堂练习 (1)下列说法中正确的有)下列说法中正确的有:( ) 若若r0,则,则x增大时,增大时,y也相应增大也相应增大; 若若r0,表示两个相关变量正相关,表示两个相关变量正相关,x增大增大 时,时,y也相应增大,故也相应增大,故正确正确. r0,表示两个变,表示两个变 量负相关,量负相关,x增大时,增大时,y也相应减小,故也相应减小,故错误错误. |r|越接近越接近1,表示两个变量相关性越高,表示两个变量相关性越高,|r|=1表表 示两个变量有确定的关系(即函数关系),故示两个变量有确定的关系(即函数关系),

    23、故 正确正确. (2)对两个变量)对两个变量y与与x进行回归分析,分别选进行回归分析,分别选 择不同的模型,它们的相关系数择不同的模型,它们的相关系数r如下,其中拟合如下,其中拟合 效果最好的模型是(效果最好的模型是( ) A.模型模型的相关系数的相关系数r为为0.98 B.模型模型的相关系数的相关系数r为为0.80 C.模型模型的相关系数的相关系数r为为0.50 D.模型模型的相关系数的相关系数r为为0.25 解析解析:根据相关系数的定义和计算公式可知,根据相关系数的定义和计算公式可知, |r|1,且,且|r|越接近于越接近于1,相关程度越大,拟合效果,相关程度越大,拟合效果 越好;越好;|

    24、r|越接近于越接近于0,相关程度越小,拟合效果越弱,相关程度越小,拟合效果越弱. A (3)对有线性相关关系的两个变量建立的回)对有线性相关关系的两个变量建立的回 归直线方程归直线方程 中,回归系数中,回归系数 ( ) A.可以小于可以小于0 B.小于小于0 C.能等于能等于0 D.只能等于只能等于0 axby b 解析解析: 时,得时,得r=0,这时不具有线性,这时不具有线性 相关性,但相关性,但 能大于能大于0,也能小于,也能小于0. b0 b A 2.解答题解答题 (1)现随机抽取了我校)现随机抽取了我校10名学生在入学考名学生在入学考 试中的数学成绩(试中的数学成绩(x)与入学后的第一

    25、次考试中)与入学后的第一次考试中 的数学成绩(的数学成绩(y),数据如下:),数据如下: 学生号学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 试问这试问这10个学生的两次数学考试成绩是否具个学生的两次数学考试成绩是否具 有显著性线性相关关系?有显著性线性相关关系? 查表得自由度为查表得自由度为10-2=8相应的相关关系临相应的相关关系临 界值界值 由由 知,两次数学考试成绩知,两次数学考试成绩 有显著性的线性相关关系有显著性的线性相关关系. 10

    26、 1i 2 i 116584x 10 1i 2 i 47384y107.8x 68y 73796yx 10 1i ii 易得易得 则相关系数为则相关系数为 解答解答 22 73796 10 107.8 68 r0.7506 (116584 10 107.8 )(47384 10 68 ) 0.05 r0.6021 0.05 rr (2)观察两相关量得如下数据)观察两相关量得如下数据: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程求两变量间的回归方程. i 1 2 3 4 5 6 7 8 9 10 xi -1 -2 -3 -4 -5 5 3 4 2 1 yi -9 -7 -5 -3 -1 1 5 3 7 9 xiyi 9 14 15 12 5 5 15 12 14 9 解答解答 列表列表: 101010 2 2 ii ii i=1i=1i=1 x = 0,y = 0, =110,= 330,=110.yy xx 10 i i i=1 10 22 i i=1 -10 xy 110-10 0 b =1 110-10 0 -10 y x xx a = y-bx =0-b 0=0 y = x. 所求回归直线方程为所求回归直线方程为

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:人教A版高中数学选修2-3 第三章3.1回归分析的基本思想及其初步应用 ppt课件(共41张PPT).pptx
    链接地址:https://www.163wenku.com/p-1148224.html
    lilei2001
         内容提供者     

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库