第3讲 变量间的相关关系与统计案例 (《金版教程》2021高考科学复习创新方案-理数).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第3讲 变量间的相关关系与统计案例 (《金版教程》2021高考科学复习创新方案-理数).ppt》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 【金版教程 第3讲变量间的相关关系与统计案例 【金版教程2021高考科学复习创新方案-理数】 变量 相关 关系 统计 案例 教程 2021 高考 科学 复习 创新 方案 下载 _二轮专题_高考专区_数学_高中
- 资源描述:
-
1、金版教程金版教程20212021高考科学复习创新方案高考科学复习创新方案- -理数理数 (创新版)(创新版) 【精品课件精品课件】 第第3 3讲讲 变量间的相关关系与统计案变量间的相关关系与统计案 例例 第九章 统计与统计案例 考纲解读 1.会作两个相关变量的数据的散点图,会利用散点图认识变量 间的相关关系;根据最小二乘法求出回归直线方程(重点) 2了解独立性检验(只要求 22 列联表)的基本思想、方法及其初步应用 考向预测 从近三年高考情况来看,本讲是高考中的一个热点考查内 容预测 2021 年将会考查:回归直线方程的判断、求解及相关系数的意 义,并用其解决实际问题;独立性检验思想在实际问题
2、中的应用试题 以解答题的形式呈现,难度为中等此外,也可能出现在客观题中,此时 试题难度不大,属中、低档题型. 1 基础知识过关基础知识过关 PART ONE 1.相关关系与回归方程 (1)相关关系的分类 正相关: 从散点图上看, 点散布在从01 _到02 _的区 域内,如图 1; 负相关:从散点图上看,点散布在从03 _到04 _的区 域内,如图 2. 左下角 右上角 左上角 右下角 (2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在 05 _附近,则称这两个变量之间具有线性相关关系,这条直线叫 做06 _ (3)回归方程 最小二乘法:使得样本数据的点到回归直线的07 _ 最小的
3、方法叫做最小二乘法 一条直线 回归直线 距离的平方和 回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2, y2),(xn,yn),其回归方程为y b xa ,则b i1 n xi x yi y i1 n xi x 2 i1 n xiyin x y i1 n x2 in x 2 ,a y b x .其中,b 是回归方程的08 _,a 是在 y 轴上 的09 _, x 1 n n i1x i, y 1 n n i1y i,10 _称为样本点的中心 斜率 截距 ( x , y) 说明:回归直线y b xa 必过样本点的中心( x , y),这个结论既是检 验所求回归直线方程是否准
4、确的依据,也是求参数的一个依据 (4)样本相关系数 r i1 n xi x yi y i1 n xi x 2 i1 n yi y 2 ,用它来衡量两个变量间的线性相关关 系 当 r0 时,表明两个变量11 _; 当 r0.75 时,认为两个变量有很强的线性相关关系 正相关 负相关 越强 2残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差 为 eiyibxia, i1,2, , n, 其估计值为e iyiy iyib xia , i1,2, , n,e i称为相应于点(xi,yi)的残差 (2)残差平方和为 n i1 (y iy i) 2. (3)相
5、关指数:R2101 _. n i1 y iy i 2 n i1 y i y 2 3独立性检验 (1)分类变量:变量的不同“值”表示个体所属的01 _,像这 类变量称为分类变量 不同类别 (2)列联表:列出两个分类变量的02 _,称为列联表假设有两 个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数 列联表(称为 22 列联表)为 22 列联表 y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 构造一个随机变量 K203 _,其中 n 04 _为样本容量 频数表 nadbc2 abcdacbd abcd (3)独立性检验 利用随机变
6、量05 _来判断“两个分类变量06 _”的方法称 为独立性检验 K2 有关系 答案 (1) (2) (3) (4) (5) 答案答案 1概念辨析 (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系( ) (2)“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关 系( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值( ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2的观测值越 大( ) (5)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成绩有 关,某人数学成绩优秀,则他有 99%的可能物理优秀( ) 2小题热身 (1)设回归方程为
7、y 35x,则变量 x 增加一个单位时( ) Ay 平均增加 3 个单位 By 平均减少 5 个单位 Cy 平均增加 5 个单位 Dy 平均减少 3 个单位 解析 因为5 是斜率的估计值,说明 x 每增加一个单位,y 平均减少 5 个单位故选 B. 答案答案 解析解析 (2)在下列各图中,两个变量具有相关关系的图是( ) A B C D 解析 为函数关系;显然成正相关;显然成负相关;没有明 显相关性 答案答案 解析解析 (3)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的 二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了 100 位育龄 妇女,结果如表 非一线 一线 总计 愿
8、生 45 20 65 不愿生 13 22 35 总计 58 42 100 算得 K210045222013 2 58423565 9.616. 附表: P(K2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级 别有关” B在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级 别无关” C有 99%以上的把握认为“生育意愿与城市级别有关” D有 99%以上的把握认为“生育意愿与城市级别无关” 解析 因为 K29.6166.635,所以有 99%以上的
9、把握认为“生育意愿 与城市级别有关” 答案答案 解析解析 (4)已知变量 x, y 具有线性相关关系, 它们之间的一组数据如下表所示, 若 y 关于 x 的回归方程为y 1.3x1,则 m_. x 1 2 3 4 y 0.1 1.8 m 4 解析 由已知得 x 1 4(1234)2.5, y 1 4(0.11.8m4) 1 4(5.9m) 因为( x , y)在直线y 1.3x1 上, 所以 y 1.32.512.25, 所以1 4(5.9m)2.25,解得 m3.1. 3.1 解析解析 2 经典题型冲关经典题型冲关 PART TWO 1下列两变量中不存在相关关系的是( ) 人的身高与视力;曲
10、线上的点与该点的坐标之间的关系;某农 田的水稻产量与施肥量;某同学考试成绩与复习时间的投入量;匀速 行驶的汽车的行驶距离与时间;商品的销售额与广告费 A B C D 题型一题型一 相关关系的判断相关关系的判断 解析 根据相关关系的定义知,中两个变量不存在相关关系 答案答案 解析解析 2下列命题中正确的为( ) A线性相关系数 r 越大,两个变量的线性相关性越强 B线性相关系数 r 越小,两个变量的线性相关性越弱 C残差平方和越小的模型,模型拟合的效果越好 D用相关指数 R2来刻画回归效果,R2越小,说明模型的拟合效果越 好 解析 线性相关系数 r 的绝对值越接近于 1,两个变量的线性相关性越
11、强,故 A,B 错误;残差平方和越小,相关指数 R2越大,越接近于 1,拟 合效果越好,故 C 正确,D 错误 答案答案 解析解析 3对四组数据进行统计,获得如图所示的散点图,关于其相关系数的 比较,正确的是( ) Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3 答案答案 解析 易知题中图与图是正相关,图与图是负相关,且图 与图中的样本点集中分布在一条直线附近,则 r2r40r30 时,正相关;r0 时,正相关;b 0 时,y 与 x 正相关,当b 0 时,y 与 x 负相关,一定错误 解析解析 角度 1 线性回归方程及应用 1某汽车的使用年数 x 与所
12、支出的维修总费用 y 的统计数据如表: 使用年数 x/年 1 2 3 4 5 维修总费用 y/万元 0.5 1.2 2.2 3.3 4.5 根据上表可得 y 关于 x 的线性回归方程y b x0.69,若该汽车维修总 费用超过 10 万元就不再维修,直接报废,据此模型预测该汽车最多可使用 (不足 1 年按 1 年计算)( ) A8 年 B9 年 C10 年 D11 年 答案答案 题型二题型二 回归分析回归分析 解析 由y关于x的线性回归直线y b x0.69过样本点的中心(3,2.34), 得b 1.01,即线性回归方程为y 1.01x0.69,令y 1.01x0.6910,得 x10.6,所
13、以预测该汽车最多可使用 11 年故选 D. 解析解析 2(2019 东北三省三校三模)现代社会,“鼠标手”已成为常见病一 次实验中,10 名实验对象进行 160 分钟的连续鼠标点击游戏,每位实验对 象完成的游戏关卡一样,鼠标点击频率平均为 180 次/分钟,实验研究人员 测试了实验对象使用鼠标前后的握力变化,前臂表面肌电频率(sEMG)等指 标 (1)10 名实验对象实验前、后握力(单位:N)测试结果如下: 实验前:346,357,358,360,362,362,364,372,373,376. 实验后:313,321,322,324,330,332,334,343,350,361. 完成茎叶
14、图,并计算实验后握力平均值比实验前 握力的平均值下降了多少 N? (2)实验过程中测得时间 t(分)与 10 名实验对象前臂表面肌电频率 (sEMG)的中位数 y(Hz)的九组对应数据(t,y)为(0,87),(20,84),(40,86), (60,79),(80,78),(100,78),(120,76),(140,77),(160,75)建立 y 关于时间 t 的线性回归方程; (3)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(2)中 9 组数据分析,使用鼠标多少分钟就该进行休息了? 参考数据: 9 i1 (t it)(yi y )1800; 参考公式:回归方程y b ta
15、中斜率和截距的最小二乘估计公式分别 为:b n i1 t ityi y n i1 t it 2 ,a y b t 解 (1)根据题意得到茎叶图如下图所示: 解解 由图中数据可得 x 1 1 10(346357358360362362364 372373376)363, x 2 1 10(313321322324330332334343350361) 333, x 1 x236333330(N), 故实验前后握力的平均值下降了 30 N. 解解 (2)由题意得t1 9(020406080100120140160)80, y 1 9(878486797878767775)80, 9 i1 (t i
16、t) 2(080)2(2080)2(4080)2(6080)2(8080)2 (10080)2(12080)2(14080)2(16080)224000, 又 9 i1 (t it)(yi y )1800, b 9 i1 t ityi y 9 i1 t it 2 1800 24000 0.075, a y b t80(0.075)8086, y 关于时间 t 的线性回归方程为y 0.075t86. 解解 (3)九组数据中 40 分钟到 60 分钟 y 的下降幅度最大,提示 60 分钟时肌 肉已经进入疲劳状态,故使用鼠标 60 分钟就该休息了 解解 角度 2 非线性回归模型的应用 3(2019
17、莆田二模)某芯片公司为制定下一年的研发投入计划,需了解 年研发资金投入量 xi(单位:亿元)对年销售额 yi(单位:亿元)的影响该公 司对历史数据进行对比分析,建立了两个函数模型:yx2,y ex t,其中 ,t 均为常数,e 为自然对数的底数 现该公司收集了近 12 年的年研发 资金投入量 xi和年销售额 yi的数据, i1,2,12,并对这些数据作了初 步处理,得到了如下的散点图及一些 统计量的值 令 uix2,viln yi(i1,2,12),经计算得如下数据: x y i1 12 (xi x )2 i1 12 (yi y )2 u v 20 66 770 200 460 4.20 i1
18、 12 (ui u )2 i1 12 (ui u ) (yi y) i1 12 (vi v )2 i1 12 (xi x ) (v i v ) 3125000 21500 0.308 14 (1)设ui和yi的相关系数为 r1,xi和vi的相关系数为 r2,请从相关 系数的角度,选择一个拟合程度更好的模型; (2)根据(1)的选择及表中数据,建立 y 关于 x 的回归方程(系数精确到 0.01); 若下一年销售额 y 需达到 90 亿元,预测下一年的研发资金投入量 x 是多少亿元? 附:相关系数 r i1 n xi x yi y i1 n xi x 2 i1 n yi y 2 , 回归直线y
19、a b x 中斜率和截距的最小二乘估计公式分别为b i1 n xi x yi y i1 n xi x 2 ,a y b x ; 参考数据:308477, 909.4868,e4.499890. 解 (1)由题意,r1 i1 12 ui u yi y i1 12 ui u 2 i1 12 yi y 2 21500 3125000200 21500 25000 43 500.86, 解解 r2 i1 12 xi x v i v i1 12 xi x 2 i1 12 vi v 2 14 7700.308 14 770.2 10 110.91, 则|r1|r2|,因此从相关系数的角度,模型 yex t
20、 的拟合程度更好 解解 (2)先建立 v 关于 x 的线性回归方程, 由 yex t,得 ln ytx,即 vtx; 由于 i1 12 xi x vi v i1 12 xi x 2 14 7700.018, t v x4.200.018 203.84, 所以 v 关于 x 的线性回归方程为v 0.02x3.84, 所以 ln y 0.02x3.84, 则y e0.02x 3.84. 解解 下一年销售额 y 需达到 90 亿元,即 y90, 代入y e0.02x 3.84,得 90e0.02x3.84, 又 e4.499890,所以 4.49980.02x3.84, 所以 x4.49983.84
21、 0.02 32.99, 所以预测下一年的研发资金投入量约是 32.99 亿元 解解 1利用线性回归方程时的关注点 (1)正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键 (2)回归直线方程y b xa 必过样本点中心( x , y)见举例说明 1. (3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定 两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回 归方程来估计和预测 2非线性回归方程的求法 (1)根据原始数据(x,y)作出散点图 (2)根据散点图选择恰当的拟合函数 (3)作恰当的变换,将其转化成线性函数,求线性回归方程 (4)在(3)的基础上通过
22、相应变换,即可得非线性回归方程见举例说明 3. 1(2019 南宁二模)一汽车销售公司对开业 4 年来某种型号的汽车“五 一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资 料 日期 第 1 年 第 2 年 第 3 年 第 4 年 优惠金额 x(千元) 10 11 13 12 销售量 y(辆) 22 24 31 27 经过统计分析(利用散点图)可知 x,y 线性相关 (1)用最小二乘法求出 y 关于 x 的线性回归方程y b xa ; (2)若第 5 年优惠金额为 8.5 千元,估计第 5 年的销售量 y(辆)的值 参考公式:b i1 n xi x yi y i1 n xi x
展开阅读全文