考点24变量间的相关关系、统计案例教师版.pdf
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《考点24变量间的相关关系、统计案例教师版.pdf》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考点24 变量间的相关关系、统计案例教师版 考点 24 变量 相关 关系 统计 案例 教师版 下载 _一轮复习_高考专区_数学_高中
- 资源描述:
-
1、玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 考点 24变量间的相关关系、统计案例 玩前必备 1两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直 线叫做回归直线 2回归方程 (1)最小二乘法 求回归直线,使得样本
2、数据的点到它的距离的平方和最小的方法叫做最小二乘法 (2)回归方程 方程y b xa 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 a ,b 是待定参数 b n i1 xi x yi y n i1 xi x 2 n i1xiyin xy n i1x 2 in x2 , a y b x . 3回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法 (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中( x , y )称为样本点的中心 (3)相关系数 当 r0 时,表明两个变
3、量正相关; 当 r2.706 时,有 90%的把握判定变量 A,B 有关联; 当3.841 时,有 95%的把握判定变量 A,B 有关联; 当6.635 时,有 99%的把握判定变量 A,B 有关联 玩转典例 题型题型一一相关关系判断相关关系判断 例例 1变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量 U 与 V 相对应的一 组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示变量 Y 与 X 之间的线性相关系数,r2表示变量 V 与 U 之间的线性相关系数,则() Ar2r
4、10B0r2r1Cr200;对于变量 V 与 U 而言,V 随 U 的增大而减小,故 V 与 U 负相关,即 r20,所以有 r200 时,x 与 y 正相关,当b0 时,x 与 y 负相关,所以一定错误 玩转跟踪 1.(2020全国 1 卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:C)的关系, 在 20 个不同的温度条件下进行种子发芽实验,由实验数据( ,)(1,2,20) ii x yi 得到下面的散点图: 由此散点图,在 10C 至 40C 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程 类型的是() A.y abx B. 2 yabx C.exy
5、abD.lnyabx 【答案】D 【解析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y和温度x的回归方程类型的是lnyabx.故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题. 2(2015 湖北)已知变量 x 和 y 满足关系 y0.1x1,变量 y 与 z 正相关下列结论中正确的是() Ax 与 y 正相关,x 与 z 负相关Bx 与 y 正相关,x 与 z 正相关 Cx 与 y 负相关,x 与 z 负相关Dx 与 y 负相关,x 与 z 正相关 答案C 玩转数学培优题型篇安老师
6、培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 解析因为 y0.1x1,0.10),所以 z 0.1axab,0.1a0,所以 x 与 z 负相关故选 C 题型二题型二线性线性回归分析回归分析 例例 3已知 x,y 取值如下表: x014568 y1.31.85.66.17.49.3 从所得的散点图分析可知:y 与 x 线性相关,且y 0.95xa,则 a( ) A1.30B1.45C1.65D1.80 答案B 解析 x 014568 6 4, y 1.31.85.66.17.49.3 6 5.25, 又y 0.95xa 过
7、( x , y ),5.250.954a,得 a1.45. 例例 4(2014新课标)某地区 2007 年至 2013 年农村居民家庭人均纯收入y(单位:千元)的数据如表: 年份2007200820092010201120122013 年份代号t1234567 人均纯收 入y 2.93.33.64.44.85.25.9 ()求y关于t的线性回归方程; ()利用()中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并 预测该地区 2015 年农村居民家庭人均纯收入 附:回归直线的斜率和截距的最小二乘估计公式分别为: 1 2 1 ()() () n ii i
8、n i i ttyy b tt , a ybt 解:()由题意, 1 (1234567)4 7 t , 1 (2.93.33.64.44.85.25.9)4.3 7 y , ( 3)( 1.4)( 2)( 1)( 1)( 0.7)00.1 1 0.520.93 1.614 0.5 941014928 b , 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 4.30.542.3aybt y关于t的线性回归方程为0.52.3yt; ()由()知,0.50b ,故 2007 年至 2013 年该地区农村居民
9、家庭人均纯收入逐年增加,平均每年 增加 0.5 千元 将 2015 年的年份代号9t 代入0.52.3yt,得: 0.5 92.36.8y , 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元 例例 5(2015新课标)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元) 对年销售量y(单位:) t和年利润z(单位:千元)的影响,对近 8 年的年宣传费 i x和年销售量(1 i y i ,2, ,8)数据作了初步处理,得到下面的散点图及一些统计量的值 xyw 8 2 1 () i i xx 8 2 1 () i i ww 8 1 ()() ii i xxyy
10、 8 1 ()() ii i wwyy 46.65636.8289.81.61469108.8 表中 i i wx, 8 1 1 8 i i ww ()根据散点图判断,yabx与ycdx哪一个适宜作为年销售量y关于年宣传费x的回归方程类 型?(给出判断即可,不必说明理由) ()根据()的判断结果及表中数据,建立y关于x的回归方程; ()已知这种产品的年利润z与x、y的关系为0.2zyx根据()的结果回答下列问题: ( ) i年宣传费49x 时,年销售量及年利润的预报值是多少? ( )ii年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据 1 1 ()u v, 22 ().() nn u
11、 vu v,其回归线vu的斜率和截距的最小二乘估计分别为: 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 1 2 1 ()() () n ii i n i i uuvv uu , vu 解:()由散点图可以判断,ycdx适宜作为年销售量y关于年宣传费x的回归方程类型; ()令wx,先建立y关于w的线性回归方程,由于 108.8 68 1.6 d , 563686.8100.6cydw,所以y关于w的线性回归方程为100.668yw, 因此y关于x的回归方程为100.668yx, ()( ) i由()
12、知,当49x 时,年销售量y的预报值100.668 49576.6y , 年利润z的预报值576.60.24966.32z , ( )ii根据()的结果可知,年利润z的预报值0.2(100.668)13.620.12zxxxx , 当 13.6 6.8 2 x 时,即当46.24x 时,年利润的预报值最大 玩转跟踪 1已知 x 与 y 之间的一组数据: x0123 ym35.57 已求得关于 y 与 x 的线性回归方程y 2.1x0.85,则 m 的值为( ) A0.85B0.75C0.6D0.5 答案D 解析 x 0123 4 3 2, y m35.57 4 15.5m 4 , 把( x ,
13、y)代入线性回归方程, 15.5m 4 2.13 2 0.85,m0.5. 2.(2020全国 2 卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区 某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽取 20 个作 为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单 位:公顷)和这种野生动物的数量,并计算得 20 1 60 i i x , 20 1 1200 i i y , 20 2 1 )80 i i xx (, 20 2 1 )9000 i i yy (, 2
14、0 1 )800 i i i xyxy (. 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均 数乘以地块数); (2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到 0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动 物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数r= 1 22 11 ) ) n i ii
15、 ii nn ii xy x xy yyx ( ( ,1.414. 【答案】(1)12000;(2)0.94;(3)详见解析 【详解】(1)样区野生动物平均数为 20 1 11 120060 2020 i i y , 地块数为 200,该地区这种野生动物的估计值为2006012000 (2)样本( ,) ii x y(i=1,2,20)的相关系数为 20 1 2020 22 11 ()() 8002 2 0.94 380 9000 ()() ii i ii ii xxyy r xxyy (3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大
16、,从俄各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计. 题型题型三三独立性检验独立性检验分析分析 例例 6(2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 (1)记 A 表示事件“旧养殖法的箱产量低于 50 kg”,估计 A
17、 的概率; (2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关: 箱产量50 kg箱产量50 kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较 附: P(K2k0)0.0500.0100.001 k03.8416.63510.828 K2 nadbc2 abcdacbd. 解(1)旧养殖法的箱产量低于 50 kg 的频率为(0.0120.0140.0240.0340.040)50.62. 因此,事件 A 的概率估计值为 0.62. (2)根据箱产量的频率分布直方图得列联表如下: 箱产量6.635,故有 99%的把握认为箱产
18、量与养殖方法有关 (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在 50 kg 到 55 kg 之间,旧养殖法的 箱产量平均值(或中位数)在 45 kg 到 50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分 布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 玩转跟踪 1.(2020全国 3 卷)某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当天到某公园锻炼的 人次,
19、整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200(200,400(400,600 1(优)21625 2(良)51012 3(轻度污染)678 4(中度污染)720 (1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为 1 或 2,则称这天“空气质量好”;若某天的空气质量等级为 3 或 4,则称 这天“空气质量不好”根据所给数据,完成下面的 22 列联表,并根据列联表,判断是否有 95%的把握 认为一天中到该公园锻炼的人次与该市当天的空气质量有关
20、? 人次400人次400 空气质量好 空气质量不好 附: 2 2 () ()()()() n adbc K a b c d a c b d , P(K 2k) 0.0500.0100.001 k3.8416.63510.828 【答案】 (1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09; (2) 350;(3)有,理由见解析. 玩转数学培优题型篇安老师培优课堂 安老师高三玩转数学研讨群(721144129)旨在打造课外辅导专用讲义,更多资料关注公众号玩转高中数学研讨 【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为 2 162
21、5 0.43 100 ,等级为2的 概率为 5 10 12 0.27 100 ,等级为3的概率为 678 0.21 100 ,等级为4的概率为 720 0.09 100 ; (2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为 100 20300 35500 45 350 100 (3)22列联表如下: 人次400人次400 空气质量不好3337 空气质量好228 2 2 10033 8 37 22 5.8203.841 55 45 70 30 K , 因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 2.(2020新全国 1 山东)为加强环境保护,治理空气污染
展开阅读全文