书签 分享 收藏 举报 版权申诉 / 14
上传文档赚钱

类型(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc

  • 上传人(卖家):大布丁
  • 文档编号:1640465
  • 上传时间:2021-08-09
  • 格式:DOC
  • 页数:14
  • 大小:561KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc》由用户(大布丁)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    2021新教材 【2021新教材】人教B版高中数学选择性必修第二册第4章 4.3 4.3.1第2课时相关系数与非线性回 下载 _选择性必修 第二册_人教B版(2019)_数学_高中
    资源描述:

    1、第第 2 课时课时相关系数与非线性回归相关系数与非线性回归 学 习 目 标核 心 素 养 1了解两个变量间的线性相关系数 r,并能利用公式 求相关系数 r.(重点) 2 能利用相关系数 r 判断两个变量线性相关程度的大 小,从而判断回归直线方程拟合的效果(重点) 3掌握非线性回归转化为线性回归的方法,会求非 线性回归方程,并作出预测(难点) 1通过学习相关系数, 培养数学运算的素养 2借助非线性回归方程 的学习, 提升数据分析和 数学建模的素养. 据隆众资讯数据统计,20172019 年截止到 10 月底的数据显示,聚丙烯期 货价格及现货价格二者相关系数为 88.70%,其中 2017 年二者

    2、相关系数高达 90.86%,2018 年降至 83.97%,2019 年截止到 10 月底二者相关系数为 65.23%. 问题:什么是相关系数,如何计算,它有什么作用? 1相关系数 (1)定义:统计学里一般用 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2 n i1xiyin x y n i1x 2 in x 2 n i1y 2 in y 2 来衡量 y 与 x 的线性相关性强弱, 这里的 r 称为线性相关系数(简称为相关系 数) (2)性质 |r|1,且 y 与 x 正相关的充要条件是 r0,y 与 x 负相关的充要条件是 r 0; |r|越小,说明两个变量

    3、之间的线性相关性越弱,也就是得出的回归直线方 程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线 性相关性越强,也就是得出的回归直线方程越有价值; |r|1 的充要条件是成对数据构成的点都在回归直线上 2非线性回归方程 如果具有相关关系的两个变量 x,y 不是线性相关关系,那么称为非线性相 关关系,所得到的方程称为非线性回归方程(也简称为回归方程) 思考:如何猜测非线性回归方程的类型? 提示可以通过作出散点图,结合已学的函数模型进行猜测 1思考辨析(正确的打“”,错误的打“”) (1)若相关系数为 0,则说明两变量 x,y 之间没任何关系() (2)两个变量相关系数越大

    4、,说明它们的相关性越强() (3)求回归方程时,最好用相关系数判断一下,两变量相关性的强弱 () (4)非线性回归方程可借助线性回归方程求得() 答案(1)(2)(3)(4) 2甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并 用回归分析方法分别求得相关系数 r 如下表: 甲乙丙丁 r0.820.780.690.85 则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性() A甲B乙 C丙D丁 Dr 的绝对值越接近 1,相关性越强,故选 D. 3 在一项调查中有两个变量 x 和 y, 下图是由这两个变量近 8 年来的取值数 据得到的散点图,那么适宜作为 y 关于 x 的

    5、回归方程的函数类型是() AyabxBycd x Cymnx2Dypqcx(q0) B散点图呈曲线,排除 A 选项,且增长速度变慢,排除选项 C、D,故选 B. 4在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,4),(1,6), 则 y 与 x 的相关系数为_ 1法一: x 1.5, y1, 4 i1x 2 i22, 4 i1y 2 i56, 4 i1xiyi20, 相关系数 r 2041.51 2241.52564121. 法二:观察四个点,发现其在一条单调递减的直线上,故 y 与 x 的相关系数 为1. 相关系数的性质 【例 1】(1)在一组数据为(x1,y1),

    6、(x2,y2),(xn,yn)(n2,x1,x2, xn不全相等)的散点图中, 若这组样本数据的相关系数为1, 则所有的样本点(xi, yi)(i1,2,n)满足的方程可以是() Ay1 2x1 Byx1 Cyx1Dyx2 (2)设两个变量 x 和 y 之间具有线性相关关系, 它们的相关系数是 r, y 关于 x 的回归直线方程的回归系数为b ,回归截距是a ,那么必有( ) A.b 与 r 的符号相同 B.a 与 r 的符号相同 C.b 与 r 的符号相反 D.a 与 r 的符号相同 (1)A(2)A(1)这组样本数据的相关系数为1, 这一组数据(x1,y1),(x2,y2),(xn,yn)

    7、线性相关,且是负相关, 可排除 D,B,C,故选 A. (2)由公式可知b 与 r 的符号相同 线性相关强弱的判断方法: 1散点图(越接近直线,相关性越强); 2相关系数(绝对值越大,相关性越强) 跟进训练 1如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去 掉一个点使得余下的 5 个点所对应的数据的相关系数最大,则应当去掉的点是 () ADBE CFDA B因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越 强因为点 E 到直线的距离最远,所以去掉点 E,余下的 5 个点所对应的数据的 相关系数最大 相关系数的计算及应用 【例 2】假设关于某种设备的使用年限 x(单

    8、位:年)与所支出的维修费用 y(单位:万元)有如下统计资料: x23456 y2.23.85.56.57.0 已知 5 i1x 2 i90, 5 i1y 2 i140.8, 5 i1xiyi112.3, 798.9, 21.4. (1)计算 y 与 x 之间的相关系数(精确到 0.001),并求出回归直线方程; (2)根据回归方程,预测假设使用年限为 10 年时,维修费用约是多少万元? 解(1) x 23456 5 4, y 2.23.85.56.57.0 5 5. 5 i1xiyi5 x y 112.354512.3, 5 i1x 2 i5 x 29054210, 5 i1y 2 i5 y

    9、2140.812515.8, 所以 r 12.3 1015.8 12.3 158 12.3 2 79 12.3 1.48.90.987. 又b 5 i1xiyi5 x y 5 i1x 2 i5 x 2 112.3545 90542 1.23. a yb x 51.2340.08. 所以回归直线方程为y 1.23x0.08. (2)当 x10 时,y 1.23100.0812.38(万元), 即假设使用 10 年时,维修费用约为 12.38 万元 跟进训练 2某厂的生产原料耗费 x(单位:百万元)与销售额 y(单位:百万元)之间有 如下的对应关系: x2468 y30405070 (1)计算 x

    10、 与 y 之间的相关系数,并求其回归直线方程; (2)若实际销售额不少于 80 百万元,则原料耗费应该不少于多少? 解(1)画出(x,y)的散点图如图所示,由图可知 x,y 有线性关系 x 5, y47.5, 4 i1x 2 i120, 4 i1y 2 i9 900, 4 i1xiyi1 080, 故相关系数 r 4 i1xiyi4 x y 4 i1x 2 i4 x 2 4 i1y 2 i4 y 2 1 0804547.5 1204529 900447.520.982 7. b 4 i1xiyi4 x y 4 i1x 2 i4 x 2 1 0804547.5 120452 6.5, a yb

    11、x 47.56.5515. 故回归直线方程为y 6.5x15. (2)由回归直线方程知, 当y 80,即 6.5x1580 时, x10. 故原料耗费应不少于 10 百万元 非线性回归方程 探究问题 已知x和y之间的一组数据, 则下列四个函数中, 哪一个作为回归模型最好? x123 y35.9912.01 y32x 1;ylog2x;y4x;yx2. 提示作出散点图(图略),观察散点图中样本点的分布规律可判断样本点 分布在曲线 y32x 1 附近作为回归模型最好 【例 3】某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成每件产品的非原料成本 y(元)与生产该产品的数量 x(千件)

    12、有关,经统计得 到如下数据: x12345678 y1126144.53530.5282524 根据以上数据,绘制了散点图 观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 y ab x和指数函数模型 yce dx分别对两个变量的关系进行拟合已求得用指数函 数模型拟合的回归方程为y 96.54e0.2x,ln y 与 x 的相关系数 r10.94. 参考数据 其中 ui1 xi: 8 i1uiyi u u 2 8 i1u 2 i 8 i1yi 8 i1y 2 i0.616 185.5e 2 183.40.340.1151.5336022 385.561.40.135 (1)用反比

    13、例函数模型求 y 关于 x 的回归方程; (2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 0.01),并用其 估计产量为 10 千件时每件产品的非原料成本; (3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出)根 据市场调研数据,若该产品单价定为 100 元,则签订 9 千件订单的概率为 0.8, 签订 10 千件订单的概率为 0.2;若单价定为 90 元,则签订 10 千件订单的概率为 0.3,签订 11 千件订单的概率为 0.7.已知每件产品的原料成本为 10 元,根据(2) 的结果,企业要想获得更高利润,产品单价应选择 100 元还是 90 元,请说明理 由

    14、参考公式:对于一组数据(u1,1),(u2,2),(un,n),其回归直线 u 的斜率和截距的最小二乘估计分别为: n i1uiin u n i1u 2 in u 2 ,a u , 相关系数 r n i1uiin u n i1u 2 in u 2 n i1 2 in 2 思路点拨(1)首先可令 u1 x并将 ya b x转化为 yabu, 然后根据题目 所给数据以及线性回归方程的相关公式计算出b 以及a ,即可得出结果; (2)计算出反比例函数模型的相关系数 r 并通过对比即可得出结果; (3)可分别计算出单价为 100 元和 90 元时产品的利润,通过对比即可得出结 果 解(1)令 u1 x

    15、,则 ya b x可转化为 yabu,因为 y 360 8 45,所以 b 8 i1uiyi8 u y 8 i1u 2 i8 u 2 183.480.3445 1.5380.115 61 0.61100, 则a yb u 451000.3411, 所以y 11100u, 所以 y 关于 x 的回归方程为y 11100 x . (2)y 与1 x的相关系数为: r2 8 i1uiyin u y 8 i1u 2 i8 u 2 8 i1y 2 i8 y 2 61 0.616 185.50.99. 因为|r1|r2|,所以用反比例函数模型拟合效果更好, 当 x10 时,y100 10 1121(元),

    16、 所以当产量为 10 千件时,每件产品的非原料成本为 21 元 (3)当产品单价为 100 元, 设订单数为 x 千件, 因为签订 9 千件订单的概率 为 0.8,签订 10 千件订单的概率为 0.2, 所以 E(x)90.8100.29.2, 所以企业利润为 1009.29.2 100 9.2 21 626.8(千元) 当产品单价为 90 元,设订单数为 y 千件, 因为签订 10 千件订单的概率为 0.3,签订 11 千件订单的概率为 0.7, 所以 E(y)100.3110.710.7, 所以企业利润为 9010.710.7 100 10.721638.3(千元) 故企业要想获得更高利润

    17、,产品单价应选择 90 元 非线性回归问题有时并不给出经验公式, 这时我们可以画出已知数据的散点 图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选 一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性 回归分析问题,使之得到解决其一般步骤为: 跟进训练 3二手车经销商小王对其所经营的 A 型号二手汽车的使用年数 x 与销售价 格 y(单位:万元/辆)进行整理,得到如下数据: 使用年数 x234567 售价 y201286.44.43 zln y3.002.482.081.861.481.10 下面是 z 关于 x 的折线图: (1)由折线图可以看出,可

    18、以用线性回归模型拟合 z 与 x 的关系,请用相关系 数加以说明; (2)求 y 关于 x 的回归方程并预测某辆 A 型号二手车当使用年数为 9 年时售 价约为多少?(b,a 小数点后保留两位有效数字) (3)基于成本的考虑, 该型号二手车的售价不得低于 7 118 元,请根据(2)求出 的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年? 参考数据: 6 i1xiyi187.4, 6 i1xizi47.64, 6 i1x 2 i139, 6 i1 xi x 24.18, 6 i1 yi y 213.96, 6 i1 zi z 21.53, ln 1.460.38,ln 0.711

    19、 80.34. 参考公式:回归直线方程y b xa 中斜率和截距的最小二乘估计公式分别 为: b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 ,a yb x . r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2, x , y为样本平均值 解(1)由题意,计算 x 1 6(234567)4.5, z 1 6(32.482.081.861.481.10)2, 且 6 i1xizi47.64, 6 i1 xi x 24.18, 6 i1 zi z 21.53,所以 r n i1 xi x zi z n

    20、 i1 xi x 2 n i1 zi z 2 47.6464.52 4.181.53 6.36 6.395 40.99. 所以 z 与 x 的相关系数大约为0.99,说明 z 与 x 的线性相关程度很高 (2)利用最小二乘估计公式计算 b n i1xizin x z n i1x 2 in x 2 47.6464.52 13964.52 6.36 17.50.36, 所以a zb x 20.364.53.62, 所以 z 关于 x 的线性回归方程是z 0.36x3.62, 又 zln y,所以 y 关于 x 的回归方程是y e0.36x3.62. 令 x9,解得 ye 0.3693.621.46

    21、,即预测某辆 A 型号二手车当使用年数为 9 年时售价约 1.46 万元 (3)当 y0.711 8 时, e 0.36x3.620.711 8eln 0.711 8e0.34, 所以0.36x3.620.34,解得 x11,因此预测在收购该型号二手车时车 辆的使用年数不得超过 11 年 1判断变量的相关性通常有两种方式:一是散点图,二是相关系数 r,前者 只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强 弱 2只有当两变量间呈线性相关关系时,才可以求回归系数,得到回归直线 方程y b xa ;若两变量间的关系不是线性相关关系,应观察分析其散点图,找 出拟合函数,通过变量代

    22、换把非线性回归问题转化为线性回归问题 1两个变量之间的线性相关程度越低,其线性相关系数的数值() A越接近于1B越接近于 0 C越接近于 1D越小 B由相关系数的含义可得:两个变量之间的线性相关程度越低,其线性相 关系数的数值越接近于 0.故选 B. 2如图所示,给出了样本容量均为 7 的 A,B 两组样本数据的散点图,已 知 A 组样本数据的相关系数为 r1,B 组数据的相关系数为 r2,则() Ar1r2Br1r2 Cr1r2D无法判定 C根据 A, B 两组样本数据的散点图知, A 组样本数据几乎在一条直线上, 且成正相关,相关系数为 r1应最接近 1,B 组数据分散在一条直线附近,也成

    23、 正相关,相关系数为 r2,满足 r2r2,故选 C. 3对于线性相关系数 r,叙述正确的是() Ar(,),且 r 越大,相关程度越大 Br(,),且|r|越大,相关程度越大 Cr1,1,且 r 越大,相关程度越大 Dr1,1,且|r|越大,相关程度越大 D相关系数 r 是来衡量两个变量之间的线性相关程度的, 线性相关系数是 一个绝对值小于等于 1 的量,并且它的绝对值越大就说明相关程度越大故选 D. 4若回归直线方程中的回归系数b 0,则相关系数 r_. 0相关系数 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2与b n i1 xi x yi y n i1

    24、 xi x 2 的分子 相同,故 r0. 5根据统计,某蔬菜基地西红柿亩产量的增加量 y(百千克)与某种液体肥料 每亩使用量 x(千克)之间的对应数据的散点图如图所示 (1)依据数据的散点图可以看出, 可用线性回归模型拟合 y 与 x 的关系, 请计 算相关系数 r 并加以说明(若|r|0.75,则线性相关程度很高,可用线性回归模型 拟合); (2)求 y 关于 x 的回归方程,并预测液体肥料每亩使用量为 12 千克时,西红 柿亩产量的增加量 y 约为多少? 附:相关系数公式r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2 n i1xiyin x y n i1x

    25、 2 in x 2 n i1y 2 in y 2,参考数据: 0.30.55, 0.90.95. 回归方程y b xa 中斜率和截距的最小二乘估计公式分别为:b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 , a yb x . 解(1)由已知数据可得 x 24568 5 5, y 34445 5 4. 所以 5 i1 (xi x )(yi y)(3)(1)(1)00010316, 5 i1 xi x 2 32120212322 5, 5 i1 yi y 2 1202020212 2, 所以相关系数 r 5 i1 xi x yi y 5 i1 xi x 2 5 i1 yi y 2 6 2 5 2 9 100.95. 因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系 (2)b 5 i1 xi x yi y 5 i1 xi x 2 6 200.3. 那么a 450.32.5. 所以回归方程为y 0.3x2.5. 当 x12 时,y 0.3122.56.1, 即当液体肥料每亩使用量为 12 千克时,西红柿亩产量的增加量约为 6.1 百 千克

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc
    链接地址:https://www.163wenku.com/p-1640465.html
    大布丁
         内容提供者      个人认证 实名认证

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库