(2022高考数学一轮复习(步步高))第九章 §9.2 变量间的相关关系、统计案例.docx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2022高考数学一轮复习(步步高))第九章 §9.2 变量间的相关关系、统计案例.docx》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022高考数学一轮复习步步高 【2022高考数学一轮复习步步高】第九章 §9.2变量间的相关关系、统计案例 2022 高考 数学 一轮 复习 步步高 第九 9.2 变量 相关 关系 统计 案例 下载 _一轮复习_高考专区_数学_高中
- 资源描述:
-
1、9.2变量间的相关关系、统计案例变量间的相关关系、统计案例 考试要求1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立 性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及其简单应用 1相关关系与回归方程 (1)相关关系的分类 正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它 称为正相关 负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (2)线性相关关系 如果散点图中点的分布从整体上看大致在
2、一条直线附近,就称这两个变量之间具有线性相关 关系,这条直线叫做回归直线 (3)回归方程 最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法 回归方程 方程y b xa 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回 归方程,其中a ,b 是待定参数 错误错误! (4)回归分析 定义:对具有相关关系的两个变量进行统计分析的一种常用方法 样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中( x , y )称为样本 点的中心 相关系数 当 r0 时,表明两个变量正相关; 当 r0
3、 时,表明两个变量负相关 r 的绝对值越接近于 1,表明两个变量的线性相关性越强r 的绝对值越接近于 0,表明两个 变量之间几乎不存在线性相关关系 通常|r|大于 0.75 时, 认为两个变量有很强的线性相关性 2独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量 (2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它们 的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为 22 列联表 y1y2总计 x1abab x2cdcd 总计acbdabcd 构造一个随机变量 K2 nadbc2 ab
4、cdacbd,其中 nabcd 为样本容量 (3)独立性检验:利用随机变量 K2来判断“两个分类变量有关系”的方法称为独立性检验 微思考 1变量的相关关系与变量的函数关系有什么区别? 提示相同点:两者均是指两个变量的关系 不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系 函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系 2线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确? 提示(1)不一定都有实际意义回归分析是对具有相关关系的两个变量进行统计分析的方 法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回 归方程毫无意义
5、(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值 题组一思考辨析 1判断下列结论是否正确(请在括号中打“”或“”) (1)散点图是判断两个变量相关关系的一种重要方法和手段() (2)回归直线y b xa 至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点() (3)相关系数的绝对值越接近 1,样本数据的线性相关程度越强() (4)若事件 X,Y 关系越密切,则由观测数据计算得到的 K2的观测值越小() 题组二教材改编 2下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的是() 答案D 解析观察散点图可知,只有 D 选项的散点图表示的是变量 x 与 y
6、之间具有负的线性相关关 系 3下面是 22 列联表: y1y2总计 x1a2173 x2222547 总计b46120 则表中 a,b 的值分别为() A94,72B52,50 C52,74D74,52 答案C 解析a2173,a52. 又 a22b,b74. 4已知 x,y 的对应取值如下表,从散点图可以看出 y 与 x 线性相关,且线性回归方程为y 0.95xa ,则a 等于() x0134 y2.24.34.86.7 A.3.25B2.6C2.2D0 答案B 解析回归直线过点(2,4.5), 4.50.952a , a 2.6. 题组三易错自纠 5在统计中,由一组样本数据(x1,y1),
7、(x2,y2),(xn,yn)利用最小二乘法得到两个变量 的回归方程为y b xa ,那么下列说法不正确的是() A相关系数 r 不可能等于 1 B回归直线y b xa 必经过点( x , y ) C回归直线y b xa 表示最接近 y 与 x 之间真实关系的一条直线 D相关系数为 r,且|r|越接近 1,样本数据的线性相关程度越强;|r|越接近 0,样本数据的线 性相关程度越弱 答案A 解析相关系数的取值范围是|r|1, 故 A 错; 回归直线y b xa 必过样本点的中心, 即点( x , y ),故 B 正确;回归直线y b xa 是利用最小二乘法求解出的直线方程,接近真实关系, 故 C
8、 正确;相关系数 r 的绝对值越接近 1,表示样本数据的线性相关程度越强,越接近 0, 样本数据的线性相关程度越弱,故 D 正确 6随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构 用简单随机抽样的方法从不同地区调查了 100 位育龄妇女,结果如下表 非一线城市一线城市总计 愿生452065 不愿生132235 总计5842100 由 K2 nadbc2 abcdacbd, 得 K210045222013 2 58423565 9.616. 参照下表: P(K2k0)0.10.050.010.001 k02.7063.8416.63510.828 正确的结论是()
9、 A在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别有关” B在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别无关” C有 99%以上的把握认为“生育意愿与城市级别有关” D有 99%以上的把握认为“生育意愿与城市级别无关” 答案C 题型一 相关关系的判断 1(2021昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下: 月份123456 人均销售额658347 利润率(%)12.610.418.53.08.116.3 根据表中数据,下列说法正确的是() A利润率与人均销售额成正相关关系 B利润率与人均销售额成负相关关系 C利润率与人均销
10、售额成正比例函数关系 D利润率与人均销售额成反比例函数关系 答案A 解析由统计表可得利润率与人均销售额不是正比例关系, 也不是反比例关系, 排除 C 和 D; 其属于正相关关系,A 正确,B 错误 2对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是() Ar2r40r3r1Br4r20r1r3 Cr4r20r3r1Dr2r40r10, r30, 图(2)与图(4)是负相关, 故 r20, r40, 且图(1)与图(2)的样本点集中在一条直线附近,因此 r2r40r3r1,故选 A. 3在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不
11、全相等)的散点图 中,若所有样本点(xi,yi)(i1,2,n)都在直线 y1 2x1 上,则这组样本数据的样本相 关系数为() A1B0 C1 2 D1 答案A 4已知变量 x 和 y 满足关系y 0.1x1,变量 y 与 z 正相关下列结论中正确的是() Ax 与 y 正相关,x 与 z 负相关 Bx 与 y 正相关,x 与 z 正相关 Cx 与 y 负相关,x 与 z 负相关 Dx 与 y 负相关,x 与 z 正相关 答案C 解析因为y 0.1x1, 0.10), 所以z 0.1b xb a ,0.1b 0 时,两个变量正相关;当 r0 时,两个变量正相关;当b 0 时,两个变量负相关
12、题型二 回归分析 命题点 1线性回归分析 例 1 (2020福州模拟)随着我国中医学的发展,药用昆虫的使用愈来愈多每年春暖以后至寒 冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫已知一只药用昆虫的产卵数 y(单位: 个)与一定范围内的温度 x(单位:)有关,于是科研人员在 3 月份的 31 天中随机挑选了 5 天 进行研究,现收集了该种药用昆虫的 5 组观测数据如下表: 日期2 日7 日15 日22 日30 日 温度 x/101113128 产卵数 y/个2325302616 科研人员确定的研究方案是:先从这 5 组数据中任选 2 组,用剩下的 3 组数据建立 y 关于 x 的线性回归方程,再
13、对被选取的 2 组数据进行检验 (1)若选取的是 3 月 2 日与 30 日这 2 组的数据, 请根据 3 月 7 日、 15 日和 22 日这 3 组的数据, 求出 y 关于 x 的线性回归方程; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 个,则认为得到 的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 解(1)由已知数据得 x 12, y 27, 错误错误!(xi x )(yi y )5,错误错误!(xi x )22, 所以b 错误错误!5 2,a y 5 2 x 275 2123. 所以 y 关于 x 的线性回归方程为y 5 2x3. (2
14、)由(1)知,y 关于 x 的线性回归方程为y 5 2x3. 当 x10 时,y 5 210322,|2223|2, 当 x8 时,y 5 28317,|1716|6.635. 又 P(K26.635)0.01. 所以有 99%的把握认为“该校学生的每周平均体育运动时间是否优秀与年级有关” 思维升华 独立性检验的一般步骤 (1)根据样本数据制成 22 列联表 (2)根据公式 K2 nadbc2 abacbdcd计算 K 2的观测值 k. (3)比较 k 与临界值的大小关系,作统计推断 跟踪训练 2 (2020全国)某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当 天到某公园锻炼
15、的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200(200,400(400,600 1(优)21625 2(良)51012 3(轻度污染)678 4(中度污染)720 (1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代 表); (3)若某天的空气质量等级为 1 或 2,则称这天“空气质量好”;若某天的空气质量等级为 3 或 4,则称这天“空气质量不好”根据所给数据,完成下面的 22 列联表,并根据列联表, 判断是否有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气
展开阅读全文