2021年新课标(老高考)文数复习练习课件:11.3 变量间的相关关系与统计案例.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《2021年新课标(老高考)文数复习练习课件:11.3 变量间的相关关系与统计案例.pptx》由用户(小豆芽)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 新课 高考 复习 练习 课件 11.3 变量 相关 关系 统计 案例 下载 _二轮专题_高考专区_数学_高中
- 资源描述:
-
1、考点考点1 1 变量间的相关关系变量间的相关关系 1.(2020课标,5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关 系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图: 由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方 程类型的是( ) A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x 答案答案 D 本题考查回归方程及一次函数、二次函数、指数型函数、对数型函数的图象. 观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的
2、图象,故选D. 2.(2020课标,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为 调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样 的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植 物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2 =9 000,(xi-)(yi-)=800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量 的平均数乘地块数);
3、(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种 野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. 附:相关系数r=,1.414. 20 1i 20 1i 20 1i x 20 1i y 20 1i xy 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii x x y y x xy y 2 解析解析 (1)由已知得样本平均数=yi=60,从而该地区这种野生动物数量的估计值为60200=1 2 000. (2)样本(
4、xi,yi)(i=1,2,20)的相关系数 r=0.94. (3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植 物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保 持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量 更准确的估计. y 1 20 20 1i 20 1 2020 22 11 ( - )( - ) ( - )( - ) ii i ii ii x x y y x xy y 800 80 9 00
5、0 2 2 3 3.(2018课标,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据 2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13.5t;根据2010年 至2016年的数据(时间变量t的值依次为1,2,7)建立模型:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; y y (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解析解析 (1)利用模型,该地区201
6、8年的环境基础设施投资额的预测值为=-30.4+13.519=226.1 (亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这 说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化 趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于 一条直线的附近,这说明从2010年开始环境基础设施投资额的变
7、化规律呈线性增长趋势,利用2010 年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资 额的变化趋势,因此利用模型得到的预测值更可靠. (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元 的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可 靠. 以上给出了2种理由,答出其中任意一种或其他合理理由均可. y y y 4.(2016课标,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码17分别对应20082014
8、. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:yi=9.32,tiyi=40.17,=0.55,2.646. 7 1i 7 1i 7 2 1 ( - ) i i y y 7 参考公式:相关系数r=, 回归方程=+t中斜率和截距最小二乘估计公式分别为: =,=-. 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii t t y y t ty y y a b b 1 2 1 ( - )( - ) ( - ) n
9、ii i n i i t t y y t t a y bt 解析解析 (1)由折线图中数据和附注中参考数据得 =4,(ti-)2=28,=0.55, (ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.(4分) 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y 与t的关系.(6分) (2)由=1.331及(1)得=0.10,=-=1.331-0.1040.93. 所以y关于t的回归方程为=0.93+0.10t.(10分) 将2016年对应的t=9代入回归方程得:=0.93+0.109=1.83. 所以预测2016年
10、我国生活垃圾无害化处理量约为1.83亿吨.(12分) t 7 1i t 7 2 1 ( - ) i i y y 7 1i ty 7 1i t 7 1i 2.89 0.55 2 2.646 y 9.32 7 b 7 1 7 2 1 ( - )( - ) ( - ) ii i i i t t y y t t 2.89 28 a y bt y y 5.(2017课标,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产 线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的 尺寸: 经计算得=xi=9.97,s= =0.212,
11、 抽取次 序 1 2 3 4 5 6 7 8 零件尺 寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次 序 9 10 11 12 13 14 15 16 零件尺 寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 x 1 16 16 1i 16 2 1 1 ( - ) 16 i i x x 16 22 1 1 -16 16 i i xx? 16 2 1 ( -8.5) i i 18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16. (1)求(xi,i)(i
12、=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的 进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大 或变小); (2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的 生产过程可能出现了异常情况,需对当天的生产过程进行检查. (i)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的 均值与标准差.(精确到0.01) 附:样本(xi,yi)(i=1,2,n)的相关系数 r=.
13、 0.09. 16 1i x xx xx 1 22 11 ( - )( - ) ( - )( - ) n ii i nn ii ii x x y y x xy y 0.008 解析解析 本题考查统计问题中的相关系数及样本数据的均值与方差. (1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r= =-0.18. 由于|r|0,b0,b0 C.a0,b0 D.a0 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 y 答案答案 A 由题中数据知,b0, =, =, =b+a,a=-b. 又b0,故选A. x 345678 6 11 2 y 4.02.
14、5-0.50.5-2.0-3.0 6 1 4 1 4 11 2 1 4 11 2 4.(2015课标,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千 元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2, 8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (wi-)2 (xi-)(yi- ) (wi-)(yi- ) 46.6 563 6.8 289.8 1.6 1 469 108.8 xyw 8 1i x 8 1i w 8 1i x y 8 1i w y 表中wi=,=wi. (1
15、)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类 型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为 =,=- . i xw 1 8 8 1i x 1 2 1 ( - )( - ) ( -
16、 ) n ii i n i i u u v v u u v u 解析解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2 分) (2)令w=,先建立y关于w的线性回归方程. 由于=68, =- =563-686.8=100.6, 所以y关于w的线性回归方程为=100.6+68w, 因此y关于x的回归方程为=100.6+68.(6分) (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润z的预报值 =576.60.2-49=66.32.(9分) (ii)根据(2)的结果知,年利润z的预报值 =0.2(100.6
17、+68)-x=-x+13.6+20.12. 所以当=6.8,即x=46.24时,取得最大值. x x d 8 1 8 2 1 (- )( - ) (- ) ii i i i w w y y w w 108.8 1.6 c y dw y y x y 49 z z xx x 13.6 2 z 故年宣传费为46.24千元时,年利润的预报值最大.(12分) 5.(2014课标,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下 表: (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,
18、并预 测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: =,=-. 年 份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收 入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 b 1 2 1 ( - )( - ) ( - ) n ii i n i i t t y y t t a y bt 解析解析 (1)由所给数据计算得 =(1+2+3+4+5+6+7)=4, =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti-)2=9+4+1+0+1+4
19、+9=28, (ti-)(yi-)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14, =0.5, =-=4.3-0.54=2.3,所求回归方程为=0.5t+2.3. (2)由(1)知,=0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0. 5千元. 将2015年的年份代号t=9代入(1)中的回归方程,得=0.59+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. t 1 7 y 1 7 7 1i t 7 1i ty b 7 1 7 2 1 ( - )( - ) ( - )
20、 ii i i i t t y y t t 14 28 a y bt y b y 考点考点2 2 独立性检验独立性检验 1.(2020课标,18,12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某 公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200 (200,400 (400,600 1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染) 7 2 0 人次400 人次400 空气质量好 空气质量不好 (1)分别估计该市一天的空气质量等级为1,2,3,4的概率; (2)求一天中到该公园锻炼的平均人次的
21、估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称 这天“空气质量不好”.根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把 握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 附:K2=, . 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表: (2)一天中到该公园锻炼的平均人次的估计值为(10020+30035+50045)=350. (3)根据所给数据,可得22
22、列联表: 根据列联表得K2=5.820. 由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 空气质量等级 1 2 3 4 概率的估计值 0.43 0.27 0.21 0.09 人次400 人次400 空气质量好 33 37 空气质量不好 22 8 1 100 2 100 (33 8-22 37) 55 45 70 30 2.(2020新高考,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调 研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表: (1)估计事件“该市一天空气中PM2.5浓度不超
23、过75,且SO2浓度不超过150”的概率; (2)根据所给数据,完成下面的22列联表: SO2 PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 SO2 PM2.5 0,150 (150,475 0,75 (75,115 (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关. 附:K2=, . 2 (-) ()()()() n ad bc ab cd ac bd 解析解析 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过15
展开阅读全文