(2022高考数学一轮复习(步步高))创新引领 微课 提炼信息-数据分析与模型建构.doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2022高考数学一轮复习(步步高))创新引领 微课 提炼信息-数据分析与模型建构.doc》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022高考数学一轮复习步步高 【2022高考数学一轮复习步步高】创新引领 微课 提炼信息数据分析与模型建构 2022 高考 数学 一轮 复习 步步高 创新 引领 提炼 信息 数据 分析 模型 下载 _一轮复习_高考专区_数学_高中
- 资源描述:
-
1、提炼信息提炼信息数据分析与模型建构数据分析与模型建构 微点聚焦突破 概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、 分析数据、处理数据、得出有用的结论几个复杂过程如果数据处理不当则会陷 入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据, 然后根据统计思想对数据进行相关处理、运算,下面就如何从概率统计综合问题 中迅速提取数据,并作出正确处理及模型构建提供典例展示 类型一频率分布直方图、条形图数据处理及模型建构 【例 1】 (2016全国卷)某公司计划购买 2 台机器,该种机器使用三年后即被 淘汰机器有一易损零件,在购进机器时,可以额外购买这种零件作为备
2、件,每 个 200 元在机器使用期间,如果备件不足再购买,则每个 500 元现需决策在 购买机器时应同时购买几个易损零件, 为此搜集并整理了 100 台这种机器在三年 使用期内更换的易损零件数,得下面柱状图: 以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的 概率,记 X 表示 2 台机器三年内共需更换的易损零件数,n 表示购买 2 台机器的 同时购买的易损零件数 (1)求 X 的分布列; (2)若要求 P(Xn)0.5,确定 n 的最小值; (3)以购买易损零件所需费用的期望值为决策依据,在 n19 与 n20 之中选其 一,应选用哪个? 解(1)由柱状图并以频率代替
3、概率可得,一台机器在三年内需更换的易损零件 数为 8,9,10,11 的概率分别为 0.2,0.4,0.2,0.2.可知 X 的所有可能取值为 16、17、18、19、20、21、22, P(X16)0.20.20.04; P(X17)20.20.40.16; P(X18)20.20.20.40.40.24; P(X19)20.20.220.40.20.24; P(X20)20.20.40.20.20.2; P(X21)20.20.20.08; P(X22)0.20.20.04; 所以 X 的分布列为 X16171819202122 P0.040.160.240.240.20.080.04 (
4、2)由(1)知 P(X18)0.44,P(X19)0.68,故 n 的最小值为 19. (3)记 Y 表示 2 台机器在购买易损零件上所需的费用(单位:元) 当 n 19 时 , E(Y) 192000.68 (19200 500)0.2 (19200 2500)0.08(192003500)0.044 040. 当 n20 时, E(Y)202000.88(20200500)0.08(202002500)0.04 4 080. 可知当 n19 时所需费用的期望值小于 n20 时所需费用的期望值,故应选 n 19. 思维升华频率分布直方图、条形图、柱状图等是考查数据收集和整理的常用依 据,掌握
5、图中常见数据的提取方法,将频率看作概率是解决这类问题的关键 【训练 1】 某市某中学的环保社团参照国家环境标准制定了该市空气质量指数 与空气质量等级对应关系,如下表(假设该区域空气质量指数不会超过 300) 空气质量 指数 (0,50(50, 100 (100, 150 (150, 200(200, 250 (250, 300 空气质量 等级 1 级优2 级良 3 级轻度 污染 4 级中度 污染 5 级重度 污染 6 级严重 污染 该社团将该市在 2020 年 100 天的空气质量指数监测数据作为样本,绘制的频率 分布直方图如图,把该直方图所得频率估计为概率 (1)请估算 2020 年(以 3
6、65 天计算)全年该市空气质量优良的天数(未满一天按一天 计算); (2)该市将于 2020 年 12 月 25、26、27 日举办一场国际会议,若这三天中某天出 现 5 级重度污染,则该天需要净化空气费用 10 万元,出现 6 级严重污染,则该 天需要净化空气费用 20 万元,假设每天的空气质量等级相互独立,记这三天净 化空气总费用为 X 万元,求 X 的分布列及数学期望 解(1)由直方图可得 2020 年(以 365 天计算)全年该市空气质量优良的天数为 (0.0020.004)503650.3365109.5110. (2)由题可知,X 的所有可能取值为 0,10,20,30,40,50
7、,60, 则 P(X0) 4 5 3 64 125, P(X10)C13 1 10 4 5 2 24 125, P(X20)C23 1 10 2 4 5 1 C13 1 10 4 5 2 108 500 27 125, P(X30) 1 10 3 C13 1 10 C12 1 10 4 5 49 1 000, P(X40)C23 1 10 2 1 10C 2 3 1 10 2 4 5 27 1 000, P(X50)C23 1 10 2 1 10 3 1 000, P(X60) 1 10 3 1 1 000, X 的分布列为 X0102030405060 P 64 125 24 125 27
8、125 49 1 000 27 1 000 3 1 000 1 1 000 E(X)0 64 12510 24 12520 27 12530 49 1 00040 27 1 00050 3 1 000 60 1 1 0009(万元) 类型二茎叶图数据分析及模型建构 【例 2】 (2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了 完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第 二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘 制了如图所示的茎叶图: (1)根据
9、茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间 超过 m 和不超过 m 的工人数填入下面的列联表: 超过 m不超过 m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异? 附:K2 n(adbc)2 (ab)(cd)(ac)(bd), P(K2k0)0.0500.0100.001 k03.8416.63510.828 解(1)第一种生产方式时间集中在区间80,90,且平均工作时间 x 184. 第二种生产方式的时间集中在区间70,80),且平均工作时间
10、x 274.7. x 1x 2,所以第一种生产方式完成任务的平均时间大于第二种, 第二种生产方式的效率更高 (2)由茎叶图数据得到 m80. 由此填写列联表如下: 超过 m不超过 m总计 第一种生产方 式 15520 第二种生产方 式 51520 总计202040 (3)根据(2)中的列联表计算 K2 n(adbc)2 (ab)(cd)(ac)(bd) 40(151555)2 20202020 106.635, 所 以有 99%的把握认为两种生产方式的效率有差异 思维升华茎叶图提供了具体的数据, 找准各组数据共同的茎及各自的叶是处理 此类问题的关键如果所有数据过大,在计算平均数时,可以将所有数
11、据同时减 去一个数字再计算,减去一个数后方差不变,另外除了要掌握各类数据的计算方 法以外,还要能从提供的数据的趋势分析预测结果茎叶图数据很具体,常联系 古典概型进行考查 【训练 2】 甲、乙两名运动员参加“选拔测试赛”,在相同条件下,两人 6 次 测试的成绩(单位:分)记录如下: 甲867792727884 乙788288829590 (1)用茎叶图表示这两组数据,现要从中选派一名运动员参加比赛,你认为选派 谁参赛更好?说明理由(不用计算) (2)若将频率视为概率,对运动员甲在今后 3 次测试中的成绩进行预测,记这 3 次测试的成绩高于 85 分的次数为 X, 求 X 的分布列和数学期望 E(
12、X)及方差 D(X) 解(1)茎叶图如图: 由图可知乙的平均水平比甲高,故选派乙参赛更好 (2)由题意得,甲运动员每次测试的成绩高于 85 分的概率是1 3,3 次测试的成绩高 于 85 分的次数 X 服从二项分布,即 XB 3,1 3 ,X 所有可能的取值为 0,1,2, 3, 所以 P(X0)C03 1 3 0 2 3 3 8 27, P(X1)C13 1 3 1 2 3 2 4 9, P(X2)C23 1 3 2 2 3 1 2 9, P(X3)C33 1 3 3 2 3 0 1 27, X 的分布列为 X0123 P 8 27 4 9 2 9 1 27 E(X)31 31,D(X)3
13、1 3 2 3 2 3. 类型三表格数据的提取、处理及模型建构 【例 3】 (2020山东名校联考)甲、乙两家外卖公司,其送餐员的日工资方案如 下:甲公司,底薪 80 元,每单送餐员抽成 4 元;乙公司,无底薪,40 单以内(含 40 单)的部分送餐员每单抽成 6 元, 超出 40 单的部分送餐员每单抽成 7 元 假设 同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐 员,并分别记录其 50 天的送餐单数,得到如下频数表: 甲公司送餐员送餐单数频数表 送餐单数3839404142 天数101510105 乙公司送餐员送餐单数频数表 送餐单数3839404142 天数5101
14、0205 (1)现从记录甲公司的 50 天送餐单数中随机抽取 3 天的送餐单数,求这 3 天送餐 单数都不小于 40 的概率 (2)若将频率视为概率,回答下列两个问题: 记乙公司送餐员日工资为 X(单位:元),求 X 的分布列和数学期望 E(X); 小王打算到甲、 乙两家公司中的一家应聘送餐员, 如果仅从日工资的角度考虑, 请利用所学的统计学知识为小王做出选择,并说明理由 解(1)设抽取的 3 天送餐单数都不小于 40 为事件 M,甲公司记录的 50 天中, 有 1010525 天送餐单数不小于 40, 则 P(M)C 3 25 C350 23 196. (2)设乙公司送餐员的送餐单数为 a,
15、 当 a38 时,X386228, 当 a39 时,X396234, 当 a40 时,X406240, 当 a41 时,X40617247, 当 a42 时,X40627254, 所以 X 的所有可能取值为 228,234,240,247,254. 故 X 的分布列为 X228234240247254 P 1 10 1 5 1 5 2 5 1 10 所以 E(X)228 1 10234 1 5240 1 5247 2 5254 1 10241.8. 依题意,甲公司送餐员的日平均送餐单数为 380.2390.3400.2410.2420.139.7, 所以甲公司送餐员的日平均工资为 80439.
16、7238.8 元 由得乙公司送餐员的日平均工资为 241.8 元 因为 238.8241.8,所以推荐小王去乙公司应聘 思维升华处理表格数据的关键是搞清表格中各行、各列数的意义,解决问题的 关键是以频率视为概率,用样本估计总体 【训练 3】 (2019全国卷)某行业主管部门为了解本行业中小企业的生产情况, 随机调查了 100 个企业, 得到这些企业第一季度相对于前一年第一季度产值增长 率 y 的频数分布表 y 的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80) 企业数22453147 (1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负
17、增长的企业 比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区 间的中点值为代表)(精确到 0.01)附: 748.602. 解(1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低 于 40%的企业频率为147 100 0.21. 产值负增长的企业频率为 2 1000.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例 为 21%,产值负增长的企业比例为 2%. (2)100 个企业的产值增长率平均数为 y 1 100(0.1020.10240.30530.50140.707)0.30, s2 1 100 5
18、i1ni(yiy )2 1 100(0.40) 22(0.20)22402530.202140.40270.029 6, s 0.029 60.02 740.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为 0.30,0.17. 类型四折线图中的数据分析及模型建构 【例 4】(2020广州调研)某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜 根 据过去 50 周的资料显示,该地周光照量 X(小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不超过 70 小时的有 35 周,超过 70 小时的有 10 周 根据统计, 该基地的西红柿增加量 y(千克)与
19、使用某种液体肥料的质量 x(千 克)之间的关系为如图所示的折线图 (1)依据折线图,是否可用线性回归模型拟合 y 与 x 的关系?请计算相关系数 r 并加以说明(精确到 0.01)(若|r|0.75,则线性相关程度很高,可用线性回归模 型拟合) (2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制 仪,但每周光照控制仪运行台数受周光照量 X 限制,并有如下关系: 周光照量 X (单位:小时)30X5050X70X70 光照控制仪最多可运行台数321 若某台光照控制仪运行,则该台光照控制仪周利润为 3 000 元;若某台光照控制 仪未运行,则该台光照控制仪周亏损 1 000
20、元以频率作为概率,商家欲使周总 利润的均值达到最大,应安装光照控制仪多少台? 附:相关系数公式 r n i1 (xix )(yiy ) n i1 (xix )2 n i1 (yiy )2 , 参考数据: 0.30.55, 0.90.95. 解(1)由已知数据可得x 24568 5 5, y 34445 5 4. 因为 5 i1 (xix )(yiy )(3)(1)000316, 5 i1 (xix )2 (3)2(1)20212322 5, 5 i1 (yiy )2 (1)202020212 2. 所以相关系数 r 5 i1 (xix )(yiy ) 5 i1 (xix )2 5 i1 (yi
21、y )2 6 2 5 2 9 100.95. 因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系 (2)记商家周总利润为 Y 元,由条件可知至少需安装 1 台,最多安装 3 台光照控 制仪 安装 1 台光照控制仪可获得周总利润 3 000 元 安装 2 台光照控制仪的情形: 当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y3 0001 0002 000(元),P(Y2 000)10 500.2, 当30X70时, 2台光照控制仪都运行, 此时周总利润Y23 0006 000(元), P(Y6 000)40 500.8, 故 Y 的分布列为 Y2 0006 000 P0.
22、20.8 所以 E(Y)2 0000.26 0000.85 200(元) 安装 3 台光照控制仪的情形: 当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y13 00021 0001 000(元), P(Y1 000)10 500.2, 当 50X70 时, 有 2 台光照控制仪运行, 此时周总利润 Y23 00011 000 5 000(元), P(Y5 000)35 500.7, 当 30X50 时,3 台光照控制仪都运行,周总利润 Y33 0009 000(元), P(Y9 000) 5 500.1, 故 Y 的分布列为 Y1 0005 0009 000 P0.20.70.1
23、所以 E(Y)1 0000.25 0000.79 0000.14 600(元) 综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪 思维升华1.折线图中拐点处的坐标是我们提取数据的关键点,注意横坐标、纵 坐标的意义即可 2“最小二乘法”求回归方程,计算是这类问题的难点,需要根据题目中提供 的数据进行分析,从而求解回归方程y b xa ,其中求b 是问题的关键,计算出b 后,可以将样本点的中心(x ,y )代入方程求解出a . 【训练 4】 (2018全国卷)如图是某地区 2000 年至 2016 年环境基础设施投资 额 y(单位:亿元)的折线图 为了预测该地区 2018 年的
24、环境基础设施投资额,建立了 y 与时间变量 t 的两个 线性回归模型根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2, 17)建立模型:y 30.413.5t;根据 2010 年至 2016 年的数据(时间变量 t 的 值依次为 1,2,7)建立模型:y 9917.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 解(1)利用模型, 该地区 2018 年的环境基础设施投资额的预测值为y 30.4 13.519226.1(亿元) 利用模型,该地区 2018 年的环境基础设施投资额
25、的预测值为 y 9917.59256.5(亿元) (2)利用模型得到的预测值更可靠 理由如下: ()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y30.413.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型 不能很好地描述环境基础设施投资额的趋势.2010 年相对 2009 年的环境基础设 施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近, 这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至2016年的数据建立的线性模型y 9917.5t可以较好地描述2010年以
展开阅读全文