(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2021新教材)人教B版高中数学选择性必修第二册第4章 4.3 4.3.1 第2课时 相关系数与非线性回归讲义.doc》由用户(大布丁)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021新教材 【2021新教材】人教B版高中数学选择性必修第二册第4章 4.3 4.3.1第2课时相关系数与非线性回 下载 _选择性必修 第二册_人教B版(2019)_数学_高中
- 资源描述:
-
1、第第 2 课时课时相关系数与非线性回归相关系数与非线性回归 学 习 目 标核 心 素 养 1了解两个变量间的线性相关系数 r,并能利用公式 求相关系数 r.(重点) 2 能利用相关系数 r 判断两个变量线性相关程度的大 小,从而判断回归直线方程拟合的效果(重点) 3掌握非线性回归转化为线性回归的方法,会求非 线性回归方程,并作出预测(难点) 1通过学习相关系数, 培养数学运算的素养 2借助非线性回归方程 的学习, 提升数据分析和 数学建模的素养. 据隆众资讯数据统计,20172019 年截止到 10 月底的数据显示,聚丙烯期 货价格及现货价格二者相关系数为 88.70%,其中 2017 年二者
2、相关系数高达 90.86%,2018 年降至 83.97%,2019 年截止到 10 月底二者相关系数为 65.23%. 问题:什么是相关系数,如何计算,它有什么作用? 1相关系数 (1)定义:统计学里一般用 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2 n i1xiyin x y n i1x 2 in x 2 n i1y 2 in y 2 来衡量 y 与 x 的线性相关性强弱, 这里的 r 称为线性相关系数(简称为相关系 数) (2)性质 |r|1,且 y 与 x 正相关的充要条件是 r0,y 与 x 负相关的充要条件是 r 0; |r|越小,说明两个变量
3、之间的线性相关性越弱,也就是得出的回归直线方 程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线 性相关性越强,也就是得出的回归直线方程越有价值; |r|1 的充要条件是成对数据构成的点都在回归直线上 2非线性回归方程 如果具有相关关系的两个变量 x,y 不是线性相关关系,那么称为非线性相 关关系,所得到的方程称为非线性回归方程(也简称为回归方程) 思考:如何猜测非线性回归方程的类型? 提示可以通过作出散点图,结合已学的函数模型进行猜测 1思考辨析(正确的打“”,错误的打“”) (1)若相关系数为 0,则说明两变量 x,y 之间没任何关系() (2)两个变量相关系数越大
4、,说明它们的相关性越强() (3)求回归方程时,最好用相关系数判断一下,两变量相关性的强弱 () (4)非线性回归方程可借助线性回归方程求得() 答案(1)(2)(3)(4) 2甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并 用回归分析方法分别求得相关系数 r 如下表: 甲乙丙丁 r0.820.780.690.85 则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性() A甲B乙 C丙D丁 Dr 的绝对值越接近 1,相关性越强,故选 D. 3 在一项调查中有两个变量 x 和 y, 下图是由这两个变量近 8 年来的取值数 据得到的散点图,那么适宜作为 y 关于 x 的
5、回归方程的函数类型是() AyabxBycd x Cymnx2Dypqcx(q0) B散点图呈曲线,排除 A 选项,且增长速度变慢,排除选项 C、D,故选 B. 4在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,4),(1,6), 则 y 与 x 的相关系数为_ 1法一: x 1.5, y1, 4 i1x 2 i22, 4 i1y 2 i56, 4 i1xiyi20, 相关系数 r 2041.51 2241.52564121. 法二:观察四个点,发现其在一条单调递减的直线上,故 y 与 x 的相关系数 为1. 相关系数的性质 【例 1】(1)在一组数据为(x1,y1),
6、(x2,y2),(xn,yn)(n2,x1,x2, xn不全相等)的散点图中, 若这组样本数据的相关系数为1, 则所有的样本点(xi, yi)(i1,2,n)满足的方程可以是() Ay1 2x1 Byx1 Cyx1Dyx2 (2)设两个变量 x 和 y 之间具有线性相关关系, 它们的相关系数是 r, y 关于 x 的回归直线方程的回归系数为b ,回归截距是a ,那么必有( ) A.b 与 r 的符号相同 B.a 与 r 的符号相同 C.b 与 r 的符号相反 D.a 与 r 的符号相同 (1)A(2)A(1)这组样本数据的相关系数为1, 这一组数据(x1,y1),(x2,y2),(xn,yn)
7、线性相关,且是负相关, 可排除 D,B,C,故选 A. (2)由公式可知b 与 r 的符号相同 线性相关强弱的判断方法: 1散点图(越接近直线,相关性越强); 2相关系数(绝对值越大,相关性越强) 跟进训练 1如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去 掉一个点使得余下的 5 个点所对应的数据的相关系数最大,则应当去掉的点是 () ADBE CFDA B因为相关系数的绝对值越大,越接近 1,则说明两个变量的相关性越 强因为点 E 到直线的距离最远,所以去掉点 E,余下的 5 个点所对应的数据的 相关系数最大 相关系数的计算及应用 【例 2】假设关于某种设备的使用年限 x(单
8、位:年)与所支出的维修费用 y(单位:万元)有如下统计资料: x23456 y2.23.85.56.57.0 已知 5 i1x 2 i90, 5 i1y 2 i140.8, 5 i1xiyi112.3, 798.9, 21.4. (1)计算 y 与 x 之间的相关系数(精确到 0.001),并求出回归直线方程; (2)根据回归方程,预测假设使用年限为 10 年时,维修费用约是多少万元? 解(1) x 23456 5 4, y 2.23.85.56.57.0 5 5. 5 i1xiyi5 x y 112.354512.3, 5 i1x 2 i5 x 29054210, 5 i1y 2 i5 y
9、2140.812515.8, 所以 r 12.3 1015.8 12.3 158 12.3 2 79 12.3 1.48.90.987. 又b 5 i1xiyi5 x y 5 i1x 2 i5 x 2 112.3545 90542 1.23. a yb x 51.2340.08. 所以回归直线方程为y 1.23x0.08. (2)当 x10 时,y 1.23100.0812.38(万元), 即假设使用 10 年时,维修费用约为 12.38 万元 跟进训练 2某厂的生产原料耗费 x(单位:百万元)与销售额 y(单位:百万元)之间有 如下的对应关系: x2468 y30405070 (1)计算 x
10、 与 y 之间的相关系数,并求其回归直线方程; (2)若实际销售额不少于 80 百万元,则原料耗费应该不少于多少? 解(1)画出(x,y)的散点图如图所示,由图可知 x,y 有线性关系 x 5, y47.5, 4 i1x 2 i120, 4 i1y 2 i9 900, 4 i1xiyi1 080, 故相关系数 r 4 i1xiyi4 x y 4 i1x 2 i4 x 2 4 i1y 2 i4 y 2 1 0804547.5 1204529 900447.520.982 7. b 4 i1xiyi4 x y 4 i1x 2 i4 x 2 1 0804547.5 120452 6.5, a yb
11、x 47.56.5515. 故回归直线方程为y 6.5x15. (2)由回归直线方程知, 当y 80,即 6.5x1580 时, x10. 故原料耗费应不少于 10 百万元 非线性回归方程 探究问题 已知x和y之间的一组数据, 则下列四个函数中, 哪一个作为回归模型最好? x123 y35.9912.01 y32x 1;ylog2x;y4x;yx2. 提示作出散点图(图略),观察散点图中样本点的分布规律可判断样本点 分布在曲线 y32x 1 附近作为回归模型最好 【例 3】某企业新研发了一种产品,产品的成本由原料成本及非原料成本 组成每件产品的非原料成本 y(元)与生产该产品的数量 x(千件)
12、有关,经统计得 到如下数据: x12345678 y1126144.53530.5282524 根据以上数据,绘制了散点图 观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 y ab x和指数函数模型 yce dx分别对两个变量的关系进行拟合已求得用指数函 数模型拟合的回归方程为y 96.54e0.2x,ln y 与 x 的相关系数 r10.94. 参考数据 其中 ui1 xi: 8 i1uiyi u u 2 8 i1u 2 i 8 i1yi 8 i1y 2 i0.616 185.5e 2 183.40.340.1151.5336022 385.561.40.135 (1)用反比
展开阅读全文
链接地址:https://www.163wenku.com/p-1640465.html