(2022高考数学一轮复习(步步高))第九章 §9.1 随机抽样、用样本估计总体.docx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2022高考数学一轮复习(步步高))第九章 §9.1 随机抽样、用样本估计总体.docx》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022高考数学一轮复习步步高 【2022高考数学一轮复习步步高】第九章 §9.1随机抽样、用样本估计总体 2022 高考 数学 一轮 复习 步步高 第九 9.1 随机 抽样 样本 估计 总体 下载 _一轮复习_高考专区_数学_高中
- 资源描述:
-
1、9.1随机抽样、用样本估计总体随机抽样、用样本估计总体 考试要求1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本, 了解分层抽样和系统抽样的方法.2.会用样本的频率分布估计总体分布,会用样本的基本数字 特征估计总体的基本数字特征,理解用样本估计总体的思想 1随机抽样 (1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为 样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫 做简单随机抽样 (2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层 独立地抽取一定数量的个体,将各
2、层取出的个体合在一起作为样本,这种抽样方法是一种分 层抽样 2用样本的频率分布估计总体分布 (1)在频率分布直方图中, 纵轴表示频率/组距, 数据落在各小组内的频率用各小长方形的面积 表示各小长方形的面积的总和等于 1. (2)频率分布折线图和总体密度曲线 频率分布折线图: 连接频率分布直方图中各小长方形上端的中点, 就得到频率分布折线图 总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折 线图会越来越接近于一条光滑曲线,即总体密度曲线 (3)茎叶图 茎是指中间的一列数,叶是从茎的旁边生长出来的数 3用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数
3、最多的数 (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数, 则中间两数的平均数是中位数 (3)平均数: x x1x2xn n ,反映了一组数据的平均水平 (4)标准差:是样本数据到平均数的一种平均距离,s 1 nx 1 x 2x2 x 2xn x 2 . (5)方差:s21 n(x 1 x )2(x2 x )2(xn x )2(xn是样本数据,n 是样本容量, x 是 样本平均数) 微思考 1三种抽样方法有什么共同点和联系? 提示(1)抽样过程中每个个体被抽取的机会均等 (2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽 样
4、或系统抽样 2平均数、标准差与方差反映了数据的哪些特征? 提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况, 即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定 题组一思考辨析 1判断下列结论是否正确(请在括号中打“”或“”) (1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关() (2)分层抽样中,每个个体被抽到的可能性与层数及分层有关() (3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论() (4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变() 题组二教材改编 2某公司有员工 500 人
5、,其中不到 35 岁的有 125 人,3549 岁的有 280 人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取 人数为() A33,34,33B25,56,19 C20,40,30D30,50,20 答案B 解析设在不到 35 岁的员工中抽取 x 人,则100 500 x 125,所以 x25,同理可得这三个年龄段 抽取人数分别为 25,56,19. 3某射击小组有 20 人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和 中位数分别是() 环数5678910 人数127631 A7,7B8,7.5 C7,7.5D8
6、,6 答案C 解析从表中数据可知 7 环有 7 人,人数最多,所以众数是 7; 中位数是将数据从小到大排列,第 10 个与第 11 个数据的平均数,第 10 个数是 7,第 11 个 数是 8,所以中位数是78 2 7.5. 4如图是 100 位居民月均用水量的频率分布直方图,则月均用水量在2,2.5)范围内的居民有 _人 答案25 解析0.50.510025. 题组三易错自纠 5已知一组数据的频率分布直方图如图,则众数是_,平均数是_ 答案6567 解析因为最高小长方形中点的横坐标为 65, 所以众数为 65; 平均数 x (550.030650.040750.015850.010950.0
7、05)1067. 6若数据 x1,x2,x3,xn的平均数 x 5,方差 s22,则数据 3x11,3x21,3x31, 3xn1 的平均数和方差分别为_ 答案16,18 解析x1,x2,x3,xn的平均数为 5, x1x2x3xn n 5, 3x13x23x33xn n 135116, x1,x2,x3,xn的方差为 2, 3x11,3x21,3x31,3xn1 的方差是 32218. 题型一 抽样方法 1(2020吉安模拟)总体由编号为 00,01,02,48,49 的 50 个个体组成,利用下面的随机数 表选取 6 个个体, 选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开
8、始从左到右依次选 取两个数字,则选出的第 3 个个体的编号为() 附:第 6 行至第 9 行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A33B16C38D20 答案D 解析按随机数法, 从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数 字,超出 49 及重复的不选,则编号依次
9、为 33,16,20,38,49,32,则选出的第 3 个个体的编 号为 20,故选 D. 2用简单随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一 个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是() A. 1 10, 1 10 B. 3 10, 1 5 C.1 5, 3 10 D. 3 10, 3 10 答案A 解析在抽样过程中, 个体a每一次被抽中的概率是相等的, 因为总体容量为10, 故个体a“第 一次被抽到”的可能性与“第二次被抽到”的可能性均为 1 10.故选 A. 3为了调查城市 PM2.5的情况,按地域把 48 个城市分成大型、中
10、型、小型三组,相应的城 市数分别为 24,16,8.若用分层抽样的方法抽取 12 个城市,则应抽取的中型城市数为() A3B4C5D6 答案B 解析根据分层抽样的特点可知,抽样比为12 48 1 4,则应抽取的中型城市数为 16 1 44. 思维升华 (1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特 点:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回的抽样.(2)分层 抽样适用于总体中个体差异较大的情况. 题型二 统计图表及应用 命题点 1扇形图 例 1 (2018全国)某地区经过一年的新农村建设, 农村的经济收入增加了一倍, 实现翻番 为 更好地了解该地
11、区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入 构成比例,得到如下饼图: 则下面结论中不正确的是() A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案A 解析设新农村建设前,农村的经济收入为 a,则新农村建设后,农村的经济收入为 2a.新农 村建设前后,各项收入的对比如下表: 新农村建设前新农村建设后新农村建设后变化情况结论 种植收入60%a37%2a74%a增加A 错 其他收入4%a5%2a10%a增加了一倍以上B 对 养殖收入30%a30%2a
12、60%a增加了一倍C 对 养殖收入第 三产业收入 (30% 6%)a 36%a (30% 28%)2a 116%a 超过经济收入 2a 的一半D 对 故选 A. 命题点 2折线图 例 2 下面两个图是 2020 年 6 月 25 日由国家卫健委发布的全国疫情累计趋势图, 每图下面横 向标注日期,纵向标注累计数量现存确诊为存量数据,计算方法为:累计确诊数累计死 亡数累计治愈数 则下列对新冠肺炎叙述错误的是() A自 1 月 20 日以来一个月内,全国累计确诊病例属于快速增长时期 B自 4 月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制 C自 6 月 16 日至 24 日以来,全国每日现
13、存确诊病例平缓增加 D自 6 月 16 日至 24 日以来,全国每日现存确诊病例逐步减少 答案D 解析由图 1 可知 A,B 均正确;由图 2 数据计算得 16 日的现存确诊病例为 84 86779 926 4 645296,同理可计算 18,20,22,24 日现存确诊分别为 346,383,441,473. 命题点 3茎叶图 例 3 如图所示的茎叶图记录了甲,乙两组各 5 名工人某日的产量数据(单位:件)若这两组 数据的中位数相等,且平均数也相等,则 x 和 y 的值分别为() A3,5B5,5C3,7D5,7 答案A 解析甲组数据的中位数为 65,由甲,乙两组数据的中位数相等,得 y5.
14、又甲、乙两组数 据的平均数相等, 1 5(5665627470 x) 1 5(5961676578),x3.故选 A. 命题点 4频率分布直方图 例 4 (2020天津)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组: 5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则 在被抽取的零件中,直径落在区间5.43,5.47内的个数为() A10B18C20D36 答案B 解析因为直径落在区间5.43,5.47内的频率为 0.02(6.255.00)0.225, 所以个数为 0.2258018. 思维升
15、华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系 (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相 等时间间隔下数据的趋势 (3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分 布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于 记录和表示其缺点是当样本容量较大时,作图较烦琐 (4)准确理解频率分布直方图的数据特点: 频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据 是各组的频率,不要和条形图混淆 频率分布直方图中各小长方形的面积之和为 1,这是解
16、题的关键,常利用频率分布直方图 估计总体分布 跟踪训练 (1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想 了解同学们对假期学习方式的满意程度,收集如图 1 所示的数据;教务处通过分层抽样的方 法抽取 4%的同学进行满意度调查,得到的数据如图 2.下列说法错误的是() A样本容量为 240 B若 m50,则本次自主学习学生的满意度不低于四成 C总体中对方式二满意的学生约为 300 人 D样本中对方式一满意的学生为 24 人 答案B 解析选项 A,样本容量为 6 0004%240,该选项正确;选项 B,根据题意得自主学习的 满意率为6003001 250 6 000 0.
17、3580.4,该选项错误;选项 C,样本可以估计总体,但会有一 定的误差,总体中对方式二满意人数约为 1 50020%300,该选项正确;选项 D,样本中 对方式一满意人数为 2 0004%30%24,该选项正确 (2)(2021贵阳模拟)某网站为了了解某“跑团”每月跑步的平均里程, 收集并整理了 2019 年 1 月至 2019 年 11 月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的 折线图根据折线图,下列结论正确的是() A月跑步平均里程的中位数为 6 月份对应的里程数 B月跑步平均里程逐月增加 C月跑步平均里程高峰期大致在 8,9 月份 D1 月至 5 月的月跑步
18、平均里程相对于 6 月至 11 月波动性更小,变化比较平稳 答案D 解析由折线图可知月跑步平均里程比 6 月份高的只有 9,10,11,共 3 个月,比 6 月份低的有 1,2,3,4,5,7,8,共 7 个月,故 6 月份对应里程数不是中位数,因此 A 不正确 ; 月跑步平均里程在 1 月到 2 月,6 月到 7 月,7 月到 8 月,10 月到 11 月都是减少的,故不是 逐月增加,因此 B 不正确; 月跑步平均里程高峰期大致在 9,10,11 三个月,8 月份是相对较低的,因此 C 不正确; 从折线图来看, 1 月至 5 月的跑步平均里程相对于 6 月至 11 月, 波动性更小, 变化比
展开阅读全文