(2022高考数学一轮复习(步步高))第2节 用样本估计总体.doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2022高考数学一轮复习(步步高))第2节 用样本估计总体.doc》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022高考数学一轮复习步步高 【2022高考数学一轮复习步步高】第2节 用样本估计总体 2022 高考 数学 一轮 复习 步步高 样本 估计 总体 下载 _一轮复习_高考专区_数学_高中
- 资源描述:
-
1、第第 2 节节用样本估计总体用样本估计总体 考试要求1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频 率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和 作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标 准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样 本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 知 识 梳 理 1.频率分布直方图 (1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距极差 组数; 第二步
2、:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图) 横轴表示样本数据,纵轴表示频率 组距,每个小矩形的面积表示样本落在该组内的频 率. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小, 相应的频率分布折线图就会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线. 3.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指
3、中间的一列数,叶是从茎的 旁边生长出来的数. 4.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间 两个数据的平均数)叫做这组数据的中位数. (3)平均数:把a1a2an n 称为 a1,a2,an这 n 个数的平均数. (4)标准差与方差:设一组数据 x1,x2,x3,xn的平均数为x ,则这组数据的 标准差和方差分别是 s 1 n(x 1x )2(x2x )2(xnx )2, s21 n(x 1x )2(x2x )2(xnx )2. 常用结论与微点提醒 1.频率分布直方图与众数
4、、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形 的面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为x ,那么 mx1a,mx2a,mx3a,mxn a 的平均数是 mx a. (2)数据 x1,x2,xn的方差为 s2. 数据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2. 诊 断 自 测 1.判断下列结论正误(在括号内打“”或“”) (1)
5、平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.() (2)一组数据的方差越大,说明这组数据越集中.() (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.() (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写, 相同的数据可以只记一次.() 解析(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积组距频率 组距频率. (4)错误.茎相同的数据,相同的数据叶要重复记录,故(4)错误. 答案(1)(2)(3)(4) 2.(老教材必修 3P100T2(1)改
6、编)一个容量为 32 的样本,已知某组样本的频率为 0.25,则该组样本的频数为() A.4B.8C.12D.16 解析设频数为 n,则 n 320.25,n32 1 48. 答案B 3.(老教材必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图 如图所示,则这组数据的中位数和平均数分别是() A.91.5 和 91.5B.91.5 和 92 C.91 和 91.5D.92 和 92 解析这组数据由小到大排列为 87,89,90,91,92,93,94,96, 中位数是9192 2 91.5, 平均数x 8789909192939496 8 91.5. 答案A 4.(一题多解)
7、(2019全国卷)西游记三国演义水浒传和红楼梦 是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅 读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或红楼梦 的学生共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游记且阅 读过红楼梦的学生共有 60 位,则该校阅读过西游记的学生人数与该校 学生总数比值的估计值为() A.0.5B.0.6C.0.7D.0.8 解析法一设调查的 100 位学生中阅读过西游记的学生人数为 x,则 x 806090,解得 x70, 所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为 70 1000.7. 故选 C.
8、法二用 Venn 图表示调查的 100 位学生中阅读过西游记和红楼梦的人 数之间的关系如图: 易知调查的 100 位学生中阅读过西游记的学生人数为 70,所以该校阅读过 西游记的学生人数与该校学生总数比值的估计值为 70 1000.7.故选 C. 答案C 5.(多选题)(2020山东新高考模拟)为了解户籍、 性别对生育二胎选择倾向的影响, 某地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择 不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对 应比例,则下列叙述中正确
9、的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.倾向选择生育二胎的人员中,男性人数与女性人数相同 D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 解析由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员 中,男性人数为 6060%36,女性人数为 4060%24,不相同. 答案ABD 6.(2019江苏卷)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_. 解析这组数据的平均数为 8,故方差为 s21 6(68) 2(78)2(88)2(8 8)2
10、(98)2(108)25 3. 答案 5 3 考点一统计图表及应用多维探究 角度 1扇形图 【例 11】 (一题多解)(2018全国卷)某地区经过一年的新农村建设,农村的 经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况, 统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正确的是() A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析法一设新农村建设前经济收入为 a,则新农村建设后经济收入为 2a,则
11、由饼图可得新农村建设前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a. 新农村建设后种植收入为 0.74a,其他收入为 0.1a,养殖收入为 0.6a,养殖收入 与第三产业收入的总和为 1.16a,所以新农村建设后,种植收入减少是错误的. 法二因为 0.6p2,因此 D 正确. 设男生、女生两组数据的平均数分别为x 男,x 女,标准差分别为 s男,s女. 观察茎叶图,男生数据分布偏下,女生数据分布偏上,可知x 男x 女,B 正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, s 男s女,C 错误, 因此符合茎叶图所给数据的结论是 ABD. 答案ABD 规律方法1
12、.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重 心”下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 角度 4频率分布直方图 【例 14】某大学艺术专业 400 名学生参加某次测评, 根据男女学生人数比例, 使用分层抽样的方法从中随机抽取了 100 名学生,记录他们的分数,将数据分成 7 组:20,30),30,40),80,90.并整理得到如下频率分布直方图: (1)从
13、总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率; (2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间40,50)内 的人数; (3)已知样本中有一半男生的分数不小于 70, 且样本中分数不小于 70 的男女生人 数相等.试估计总体中男生和女生人数的比例. 解(1)根据频率分布直方图可知,样本中分数不小于 70 的频率为(0.02 0.04)100.6,所以样本中分数小于 70 的频率为 10.60.4. 所以从总体的 400 名学生中随机抽取一人,其分数小于 70 的概率估计值为 0.4. (2)根据题意,样本中分数不小于 50 的频率为 (0.010
14、.020.040.02)100.9, 故样本中分数小于 50 的频率为 0.1, 故分数在区间40,50)内的人数为 1000.155. 所以总体中分数在区间40,50)内的人数估计为 400 5 10020. (3)由题意可知,样本中分数不小于 70 的学生人数为(0.020.04)1010060. 所以样本中分数不小于 70 的男生人数为 601 230. 所以样本中的男生人数为 30260, 女生人数为 1006040, 男生和女生人数的比例为 604032. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为 32. 规律方法1.频率分布直方图的性质. (1)小长方形的面积组距频率
15、 组距频率; (2)各小长方形的面积之和等于 1; (3)小长方形的高频率 组矩,所有小长方形的高的和为 1 组距. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系. 【训练 1】 (1)(多选题)(角度 1)改革开放四十年以来,北京市居民生活发生了翻 天覆地的变化.随着经济快速增长、居民收入稳步提升,消费结构逐步优化升级, 生活品质显著提高,美好生活蓝图正在快速构建.北京市城镇居民人均消费支出 从 1998 年的 7 500 元增长到 2017 年的 40 000 元.1998 年与 2017 年北京市城镇居 民消费结构对比如图所示: 则下列叙述正确的是() A.2017 年北京
16、市城镇居民食品支出占比同 1998 年相比大幅度降低 B.2017 年北京市城镇居民人均教育文化娱乐类支出同 1998 年相比有所减少 C.2017 年北京市城镇居民医疗保健支出占比同 1998 年相比提高约 60% D.2017 年北京市城镇居民人均交通和通信类支出突破 5 000 元,大约是 1998 年 的 14 倍 (2)(角度 2)下图是 2017 年 111 月汽油、柴油价格走势图(单位:元/吨),据此下 列说法错误的是() A.从 1 月到 11 月,三种油里面柴油的价格波动最大 B.从 7 月份开始,汽油、柴油的价格都在上涨,而且柴油价格涨速最快 C.92#汽油与 95#汽油价
17、格成正相关 D.2 月份以后,汽油、柴油的价格同时上涨或同时下跌 解析(1)由 1998 年与 2017 年北京市城镇居民消费结构对比图,知:在 A 中, 2017 年北京市城镇居民食品支出占比同 1998 年相比大幅度降低,故 A 正确;在 B 中,2017 年北京市城镇居民人均教育文化娱乐类支出:11%40 0004 400 元,1998 年北京市城镇居民人均教育文化娱乐类支出:14%7 5001 050 元, 故 2017 年北京市城镇居民人均教育文化娱乐类支出同 1998 年相比明显增加, 故 B 错误;在 C 中,2017 年北京市城镇居民医疗保健支出占比同 1998 年相比提高 约
18、8%5% 5% 100%60%,故 C 正确;在 D 中,2017 年北京市城镇居民人均交 通和通信类支出为 40 00013%5 200(元), 1998 年北京市城镇居民人均交通和 通信类支出为 7 5005%375(元),5 200 375 14,所以 2017 年北京市城镇居民人 均交通和通信类支出大约是 1998 年的 14 倍,故 D 正确. (2)由价格折线图,不难发现 4 月份到 5 月份汽油价格上涨,而柴油价格下跌. 答案(1)ACD(2)D (3)(角度 3) (2020长春质量监测)已知某班级部分同学一次测验的成绩统计如图, 则其中位数和众数分别为() A.95,94B.
19、92,86 C.99,86D.95,91 解析由茎叶图可知,此组数据由小到大排列依次为 76,79,81,83,86,86, 87,91,92,94,95,96,98,99,101,103,114,共 17 个,故 92 为中位数, 出现次数最多的为众数,故众数为 86.故选 B. 答案B (4)(角度 4)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查 了 40 个用户,根据用户对产品的满意评分,得到 A 地区用户满意度评分的频率 分布直方图和 B 地区用户满意度评分的频率分布表. A 地区用户满意度评分的频率分布直方图 图 B 地区用户满意度评分的频率分布表 满意度评分
20、分组 50,60)60,70)70,80)80,90)90,100 频数2814106 (1)在图中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较 两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可); B 地区用户满意度评分的频率分布直方图 图 (2)根据用户满意度评分,将用户和满意度分为三个等级: 满意度评分低于 70 分70 分到 89 分不低于 90 分 满意度等级不满意满意非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 解(1)作出频率分布直方图如图: 通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分 的
21、平均值高于A地区用户满意度评分的平均值; B地区用户满意度评分比较集中, 而 A 地区用户满意度评分比较分散. (2)A 地区用户的满意度等级为不满意的概率大. 记 CA表示事件:“A 地区用户的满意度等级为不满意”; CB表示事件:“B 地区用户的满意度等级为不满意”. 由直方图得 P(CA)的估计值为(0.010.020.03)100.6, P(CB)的估计值为(0.0050.02)100.25. 所以 A 地区用户的满意度等级为不满意的概率大. 考点二样本的数字特征 【例 2】(1)(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分, 评定该选手的成绩时,从 9 个原始评
展开阅读全文