1、第第 2 节节用样本估计总体用样本估计总体 考试要求1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频 率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和 作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标 准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样 本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 知 识 梳 理 1.频率分布直方图 (1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距极差 组数; 第二步
2、:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图) 横轴表示样本数据,纵轴表示频率 组距,每个小矩形的面积表示样本落在该组内的频 率. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小, 相应的频率分布折线图就会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线. 3.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指
3、中间的一列数,叶是从茎的 旁边生长出来的数. 4.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间 两个数据的平均数)叫做这组数据的中位数. (3)平均数:把a1a2an n 称为 a1,a2,an这 n 个数的平均数. (4)标准差与方差:设一组数据 x1,x2,x3,xn的平均数为x ,则这组数据的 标准差和方差分别是 s 1 n(x 1x )2(x2x )2(xnx )2, s21 n(x 1x )2(x2x )2(xnx )2. 常用结论与微点提醒 1.频率分布直方图与众数
4、、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形 的面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为x ,那么 mx1a,mx2a,mx3a,mxn a 的平均数是 mx a. (2)数据 x1,x2,xn的方差为 s2. 数据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2. 诊 断 自 测 1.判断下列结论正误(在括号内打“”或“”) (1)
5、平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.() (2)一组数据的方差越大,说明这组数据越集中.() (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.() (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写, 相同的数据可以只记一次.() 解析(1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积组距频率 组距频率. (4)错误.茎相同的数据,相同的数据叶要重复记录,故(4)错误. 答案(1)(2)(3)(4) 2.(老教材必修 3P100T2(1)改
6、编)一个容量为 32 的样本,已知某组样本的频率为 0.25,则该组样本的频数为() A.4B.8C.12D.16 解析设频数为 n,则 n 320.25,n32 1 48. 答案B 3.(老教材必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图 如图所示,则这组数据的中位数和平均数分别是() A.91.5 和 91.5B.91.5 和 92 C.91 和 91.5D.92 和 92 解析这组数据由小到大排列为 87,89,90,91,92,93,94,96, 中位数是9192 2 91.5, 平均数x 8789909192939496 8 91.5. 答案A 4.(一题多解)
7、(2019全国卷)西游记三国演义水浒传和红楼梦 是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅 读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或红楼梦 的学生共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游记且阅 读过红楼梦的学生共有 60 位,则该校阅读过西游记的学生人数与该校 学生总数比值的估计值为() A.0.5B.0.6C.0.7D.0.8 解析法一设调查的 100 位学生中阅读过西游记的学生人数为 x,则 x 806090,解得 x70, 所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为 70 1000.7. 故选 C.
8、法二用 Venn 图表示调查的 100 位学生中阅读过西游记和红楼梦的人 数之间的关系如图: 易知调查的 100 位学生中阅读过西游记的学生人数为 70,所以该校阅读过 西游记的学生人数与该校学生总数比值的估计值为 70 1000.7.故选 C. 答案C 5.(多选题)(2020山东新高考模拟)为了解户籍、 性别对生育二胎选择倾向的影响, 某地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择 不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对 应比例,则下列叙述中正确
9、的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.倾向选择生育二胎的人员中,男性人数与女性人数相同 D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 解析由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员 中,男性人数为 6060%36,女性人数为 4060%24,不相同. 答案ABD 6.(2019江苏卷)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_. 解析这组数据的平均数为 8,故方差为 s21 6(68) 2(78)2(88)2(8 8)2
10、(98)2(108)25 3. 答案 5 3 考点一统计图表及应用多维探究 角度 1扇形图 【例 11】 (一题多解)(2018全国卷)某地区经过一年的新农村建设,农村的 经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况, 统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正确的是() A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析法一设新农村建设前经济收入为 a,则新农村建设后经济收入为 2a,则
11、由饼图可得新农村建设前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a. 新农村建设后种植收入为 0.74a,其他收入为 0.1a,养殖收入为 0.6a,养殖收入 与第三产业收入的总和为 1.16a,所以新农村建设后,种植收入减少是错误的. 法二因为 0.6p2,因此 D 正确. 设男生、女生两组数据的平均数分别为x 男,x 女,标准差分别为 s男,s女. 观察茎叶图,男生数据分布偏下,女生数据分布偏上,可知x 男x 女,B 正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, s 男s女,C 错误, 因此符合茎叶图所给数据的结论是 ABD. 答案ABD 规律方法1
12、.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重 心”下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 角度 4频率分布直方图 【例 14】某大学艺术专业 400 名学生参加某次测评, 根据男女学生人数比例, 使用分层抽样的方法从中随机抽取了 100 名学生,记录他们的分数,将数据分成 7 组:20,30),30,40),80,90.并整理得到如下频率分布直方图: (1)从
13、总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率; (2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间40,50)内 的人数; (3)已知样本中有一半男生的分数不小于 70, 且样本中分数不小于 70 的男女生人 数相等.试估计总体中男生和女生人数的比例. 解(1)根据频率分布直方图可知,样本中分数不小于 70 的频率为(0.02 0.04)100.6,所以样本中分数小于 70 的频率为 10.60.4. 所以从总体的 400 名学生中随机抽取一人,其分数小于 70 的概率估计值为 0.4. (2)根据题意,样本中分数不小于 50 的频率为 (0.010
14、.020.040.02)100.9, 故样本中分数小于 50 的频率为 0.1, 故分数在区间40,50)内的人数为 1000.155. 所以总体中分数在区间40,50)内的人数估计为 400 5 10020. (3)由题意可知,样本中分数不小于 70 的学生人数为(0.020.04)1010060. 所以样本中分数不小于 70 的男生人数为 601 230. 所以样本中的男生人数为 30260, 女生人数为 1006040, 男生和女生人数的比例为 604032. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为 32. 规律方法1.频率分布直方图的性质. (1)小长方形的面积组距频率
15、 组距频率; (2)各小长方形的面积之和等于 1; (3)小长方形的高频率 组矩,所有小长方形的高的和为 1 组距. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系. 【训练 1】 (1)(多选题)(角度 1)改革开放四十年以来,北京市居民生活发生了翻 天覆地的变化.随着经济快速增长、居民收入稳步提升,消费结构逐步优化升级, 生活品质显著提高,美好生活蓝图正在快速构建.北京市城镇居民人均消费支出 从 1998 年的 7 500 元增长到 2017 年的 40 000 元.1998 年与 2017 年北京市城镇居 民消费结构对比如图所示: 则下列叙述正确的是() A.2017 年北京
16、市城镇居民食品支出占比同 1998 年相比大幅度降低 B.2017 年北京市城镇居民人均教育文化娱乐类支出同 1998 年相比有所减少 C.2017 年北京市城镇居民医疗保健支出占比同 1998 年相比提高约 60% D.2017 年北京市城镇居民人均交通和通信类支出突破 5 000 元,大约是 1998 年 的 14 倍 (2)(角度 2)下图是 2017 年 111 月汽油、柴油价格走势图(单位:元/吨),据此下 列说法错误的是() A.从 1 月到 11 月,三种油里面柴油的价格波动最大 B.从 7 月份开始,汽油、柴油的价格都在上涨,而且柴油价格涨速最快 C.92#汽油与 95#汽油价
17、格成正相关 D.2 月份以后,汽油、柴油的价格同时上涨或同时下跌 解析(1)由 1998 年与 2017 年北京市城镇居民消费结构对比图,知:在 A 中, 2017 年北京市城镇居民食品支出占比同 1998 年相比大幅度降低,故 A 正确;在 B 中,2017 年北京市城镇居民人均教育文化娱乐类支出:11%40 0004 400 元,1998 年北京市城镇居民人均教育文化娱乐类支出:14%7 5001 050 元, 故 2017 年北京市城镇居民人均教育文化娱乐类支出同 1998 年相比明显增加, 故 B 错误;在 C 中,2017 年北京市城镇居民医疗保健支出占比同 1998 年相比提高 约
18、8%5% 5% 100%60%,故 C 正确;在 D 中,2017 年北京市城镇居民人均交 通和通信类支出为 40 00013%5 200(元), 1998 年北京市城镇居民人均交通和 通信类支出为 7 5005%375(元),5 200 375 14,所以 2017 年北京市城镇居民人 均交通和通信类支出大约是 1998 年的 14 倍,故 D 正确. (2)由价格折线图,不难发现 4 月份到 5 月份汽油价格上涨,而柴油价格下跌. 答案(1)ACD(2)D (3)(角度 3) (2020长春质量监测)已知某班级部分同学一次测验的成绩统计如图, 则其中位数和众数分别为() A.95,94B.
19、92,86 C.99,86D.95,91 解析由茎叶图可知,此组数据由小到大排列依次为 76,79,81,83,86,86, 87,91,92,94,95,96,98,99,101,103,114,共 17 个,故 92 为中位数, 出现次数最多的为众数,故众数为 86.故选 B. 答案B (4)(角度 4)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查 了 40 个用户,根据用户对产品的满意评分,得到 A 地区用户满意度评分的频率 分布直方图和 B 地区用户满意度评分的频率分布表. A 地区用户满意度评分的频率分布直方图 图 B 地区用户满意度评分的频率分布表 满意度评分
20、分组 50,60)60,70)70,80)80,90)90,100 频数2814106 (1)在图中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较 两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可); B 地区用户满意度评分的频率分布直方图 图 (2)根据用户满意度评分,将用户和满意度分为三个等级: 满意度评分低于 70 分70 分到 89 分不低于 90 分 满意度等级不满意满意非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 解(1)作出频率分布直方图如图: 通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分 的
21、平均值高于A地区用户满意度评分的平均值; B地区用户满意度评分比较集中, 而 A 地区用户满意度评分比较分散. (2)A 地区用户的满意度等级为不满意的概率大. 记 CA表示事件:“A 地区用户的满意度等级为不满意”; CB表示事件:“B 地区用户的满意度等级为不满意”. 由直方图得 P(CA)的估计值为(0.010.020.03)100.6, P(CB)的估计值为(0.0050.02)100.25. 所以 A 地区用户的满意度等级为不满意的概率大. 考点二样本的数字特征 【例 2】(1)(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分, 评定该选手的成绩时,从 9 个原始评
22、分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数字特征是() A.中位数B.平均数 C.方差D.极差 (2)(2020济南模拟)已知某 7 个数的平均数为 4,方差为 2,现加入一个新数据 4, 此时这 8 个数的平均数为x ,方差为 s2,则() A.x 4,s22 C.x 4,s24,s22 (3)若样本数据 x1,x2,x10的标准差为 8,则数据 2x11,2x21,2x10 1 的标准差为_. 解析(1)中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数 据,因而去掉 1 个最高分和 1 个最低分,不变的是中位数
23、,平均数、方差、极差 均受影响.故选 A. (2)由题意得加入一个新的数据后平均数x 1 8(744)4,方差 s 21 872 (44)27 42. (3)依题意,x1,x2,x3,x10的方差 s264.则数据 2x11,2x21,2x10 1 的方差为 22s22264,所以其标准差为 22642816. 答案(1)A(2)A(3)16 规律方法1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数 据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定; 标准差、方差越小,数据的离散程度越小,越稳定. 2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
24、 【训练 2】 (2020石家庄模拟)“一带一路”是“丝绸之路经济带”和“21 世纪 海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同 年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为 100 分(90 分及 以上为认知程度高).现从参赛者中抽取了 x 人,按年龄分成 5 组,第一组:20, 25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40, 45,得到如图所示的频率分布直方图,已知第一组有 6 人. (1)求 x; (2)求抽取的 x 人的年龄的中位数(结果保留整数); (3)从该市大学生、军人、医务人员、工人、个体户五种人
25、中用分层抽样的方法 依次抽取 6 人,42 人,36 人,24 人,12 人,分别记为 15 组,从这 5 个按年 龄分的组和 5 个按职业分的组中每组各选派 1 人参加“一带一路”知识竞赛, 分 别代表相应组的成绩,年龄组中 15 组的成绩分别为 93,96,97,94,90,职 业组中 15 组的成绩分别为 93,98,94,95,90. ()分别求 5 个年龄组和 5 个职业组成绩的平均数和方差; ()以上述数据为依据,评价 5 个年龄组和 5 个职业组对“一带一路”的认知程 度,并谈谈你的感想. 解(1)根据频率分布直方图得第一组的频率为 0.0150.05,6 x0.05,x 120
26、. (2)设中位数为 a,则 0.0150.075(a30)0.060.5, a95 3 32,则中位数为 32. (3)()5 个年龄组成绩的平均数为 x 11 5(9396979490)94,方差为 s 2 1 1 5(1) 2223202(4)26. 5 个职业组成绩的平均数为 x 21 5(9398949590)94,方差为 s 2 2 1 5(1) 2420212(4)26.8. ()从平均数来看两组的认知程度相同, 从方差来看年龄组的认知程度更稳定(感 想合理即可). A 级基础巩固 一、选择题 1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组 依次为20,
27、40),40,60),60,80),80,100.若低于 60 分的人数是 15,则 该班的学生人数是() A.45B.50C.55D.60 解析由频率分布直方图,知低于 60 分的频率为(0.0100.005)200.3. 该班学生人数 n15 0.350. 答案B 2.为评估一种农作物的种植效果, 选了 n 块地作试验田.这 n 块地的亩产量(单位: kg)分别为 x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳 定程度的是() A.x1,x2,xn的平均数B.x1,x2,xn的标准差 C.x1,x2,xn的最大值D.x1,x2,xn的中位数 解析刻画评估这种农作物亩产量稳
28、定程度的指标是标准差. 答案B 3.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得 该组数据的极差与中位数之和为 61,则被污染的数字为() A.1B.2C.3D.4 解析由图可知该组数据的极差为 482028,则该组数据的中位数为 6128 33,设污染数字为 x,则(30 x)34 2 33,x2,则被污染的数字为 2. 答案B 4.(多选题)(2020青岛调研)下表是某电器销售公司 2018 年度各类电器营业收入 占比和净利润占比统计表: 空调类冰箱类小家电类其他类 营业收入占比90.10%4.98%3.82%1.10% 净利润占比95.80%0.48%3.82%0
29、.86% 则下列判断中正确的是() A.该公司 2018 年度冰箱类电器销售亏损 B.该公司 2018 年度小家电类电器营业收入和净利润相同 C.该公司 2018 年度净利润主要由空调类电器销售提供 D.剔除冰箱类电器销售数据后,该公司 2018 年度空调类电器销售净利润占比将 会降低 解析对于选项 A,由统计表知冰箱类净利润占比为0.48%,所以冰箱类电器 销售亏损,所以 A 中判断正确;对于选项 B,由统计表知,小家电类电器营业 收入占比和净利润占比均为 3.82%, 但在总的营业收入和总的净利润未知的情况 下,无法得到营业收入和净利润相同,所以选项 B 中判断不正确;对于选项 C, 由统
30、计表知,空调类的净利润占比为 95.80%,所以该电器销售公司的净利润主 要由空调类电器销售提供,所以选项 C 中判断正确; 对于选项 D,剔除冰箱类销售数据后,总的净利润增加了,而空调类销售总利润 没变,所以空调类电器销售净利润占比将会降低,选项 D 中判断正确. 答案ACD 5.(多选题)甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如 图所示,则下列说法错误的是() A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差 解析由图可得,x 甲45678 5 6, x 乙
31、3569 5 6,A 项错误; 甲的成绩的中位数为 6,乙的成绩的中位数为 5,B 项错误; s 2 甲 (46)2(56)2(66)2(76)2(86)2 5 2 , s 2 乙 3(56)2(66)2(96)2 5 2.4,C 项正确;甲的成绩的极差为 4, 乙的成绩的极差也为 4,D 项错误. 答案ABD 二、填空题 6.(2019全国卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车 中,有 10 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次 的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 _. 解 析经 停 该
32、站 高 铁 列 车 所 有 车 次 的 平 均 正 点 率 的 估 计 值 为 x 100.97200.98100.99 102010 0.98. 答案0.98 7.(2019马鞍山质检)已知样本容量为 200,在样本的频率分布直方图中,共有 n 个小矩形,若中间一个小矩形的面积等于其余(n1)个小矩形面积和的1 3,则该 组的频数为_. 解析设除中间一个小矩形外的(n1)个小矩形面积的和为 p,则中间一个小矩 形面积为 1 3p,p 1 3p1,p 3 4,则中间一个小矩形的面积等于 1 3p 1 4,200 1 4 50,即该组的频数为 50. 答案50 8.(2020北京东城区调研)气象
33、意义上从春季进入夏季的标志为:“连续 5 天的日 平均温度均不低于 22 ”,现有甲、乙、丙三地连续 5 天的日平均温度的记录 数据(记录数据都是正整数): 甲地:5 个数据的中位数为 24,众数为 22; 乙地:5 个数据的中位数为 27,总体均值为 24; 丙地:5 个数据中有一个数据是 32,总体均值为 26,总体方差为 10.8. 则肯定进入夏季的地区的序号为_. 解析由统计知识,甲地:5 个数据的中位数为 24,众数为 22,可知符合 题意;乙地:5 个数据的中位数为 27,总体均值为 24,当 5 个数据为 19,20, 27, 27, 27 可知其不满足连续 5 天的日平均温度不
34、低于 22 , 所以不符合题意; 丙地:5 个数据中有一个数据是 32,总体均值为 26,总体方差为 10.8.若某一 天的气温低于 22 ,此时则取 21 ,总体方差就大于 10.8.所以满足题意. 答案 三、解答题 9.(2020福州一模)为了解某知名品牌两个不同型号手机 M9, M10 的待机时间(单 位:小时),淮北某手机卖场从仓库中随机抽取 M9,M10 两种型号的手机各 6 台,在相同的条件下进行测试,统计结果如图: (1)根据茎叶图计算 M9,M10 两种型号手机的平均待机时间; (2)根据茎叶图判断 M9,M10 两种型号被测试手机待机时间方差的大小,并说明 理由. 解(1)根
35、据茎叶图中的数据,计算 M9 型号手机的平均待机时间为 x M91 6(56 6965707684)70(小时), M10 型号手机的平均待机时间为 x M101 6(797270808180)77(小 时). (2)M9 手机待机时间方差大于 M10 手机待机时间方差. 理由:M9 的数据分布比较分散,波动较大;M10 的数据分布比较集中,波动较 小. 10.(2020济南模拟)随着新课程改革和高考综合改革的实施,高中教学以发展学 生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展.为此,某 市于 2019 年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高 中学生的数学
36、学科素养,从所有参赛学生中随机抽取 1 000 名学生的成绩(单位: 分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为50,60),60, 70),70,80),80,90),90,100,并绘制成如图所示的频率分布直方图. (1)请补全频率分布直方图,并估计这 1 000 名学生成绩的平均数(同一组数据用 该组区间的中点值作代表); (2)该市决定对本次竞赛成绩排在前 180 名的学生给予表彰,授予“数学学科素 养优秀标兵”称号,一名学生本次竞赛成绩为 79 分,请你判断该学生能否被授 予“数学学科素养优秀标兵”称号. 解(1)成绩在60,70)的频率为 1(0.300.150.1
37、00.05)0.40, 补全的频率分布直方图如图: 样本的平均数x 550.30650.40750.15850.10950.0567. (2)因为 180 1 0000.18, 所以由频率分布直方图可以估计获得“数学学科素养优秀标兵”称号学生的最 低成绩为 800.180.050.10 0.015 78(分). 因为 7978,所以该同学能被授予“数学学科素养优秀标兵”称号. B 级能力提升 11.(2019石家庄模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所 示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学 生进行调查,则样本容量和抽取的高中生近视人数分别为
38、() A.100,20B.200,20 C.200,10D.100,10 解析由题图可知总学生数是 10 000 人,样本容量为 10 0002%200 人,高 中生 2 0002%40 人, 由乙图可知高中生近视率为 50%, 所以人数为 4050% 20,选 B. 答案B 12.(多选题)(2020潍坊模拟)区域经济变化影响着人口的流动, 下图为过去某连续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图. 某连续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图 根据图中的信息,下面结论中正确的是() A.广东人口增量最多,天津增幅最高 B.黑龙江无论是增量还是增幅均居末尾
39、C.天津、北京、重庆和上海四大直辖市增幅均超过 5% D.人口增量超过 200 万的省、自治区或直辖市共有 7 个 解析对于 A,由图知广东 5 年人口增加超过 400 万,增量最多,天津增幅达到 了 19.2%,增幅最高,A 正确;对于 B,由图易知正确;对于 C,上海的人口增 幅为 4.9%,未超过 5%,不正确;对于 D,人口增量超过 200 万的省或直辖市有 天津、北京、重庆、广东、河北、湖南和山东,正确. 答案ABD 13.(2019湘东五校联考)已知等差数列an的公差为 d,若 a1,a2,a3,a4,a5的 方差为 8,则 d 的值为_. 解析依题意,由等差数列的性质得 a1,a
40、2,a3,a4,a5的平均数为 a3,则由方 差公式得1 5(a 1a3)2(a2a3)2(a3a3)2(a4a3)2(a5a3)28,所以 d 2. 答案2 14.从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值, 由测量结果得如下频数分布表: 质量指标值 分组 75,85)85,95)95,105)105,115)115,125 频数62638228 (1)作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点 值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值 不低于 95 的产
41、品至少要占全部产品 80%”的规定? 解(1)样本数据的频率分布直方图如图所示: (2)质量指标值的样本平均数为 x 800.06900.261000.381100.221200.08100. 质量指标值的样本方差为 s2(20)20.06(10)20.2600.381020.222020.08104. 所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104. (3)质量指标值不低于 95 的产品所占比例的估计值为 0.380.220.080.68. 由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标值不 低于 95 的产品至少要占全部产品 80%”的规定
42、. C 级创新猜想 15.(多选题) (2020山东新高考模拟)如图是 2019 年春运期间十二个城市售出的往 返机票的平均价格以及相比去年同期变化幅度的数据统计图, 下列结论正确的是 () A.深圳的变化幅度最小,北京的平均价格最高 B.深圳和厦门往返机票的平均价格与去年同期相比有所下降 C.平均价格从高到低位于前三位的城市为北京、深圳、广州 D.平均价格的涨幅从高到低位于前三位的城市为天津、西安、上海 解析变化幅度看折线图,越接近零轴者变化幅度越小,位于零轴下方者表明价 格下跌;平均价格看条形图,条形图越高平均价格越高,故 ABC 正确,D 错误. 答案ABC 16.(多填题)对某市“四城同创”活动中 800 名志愿者的年龄抽样调查统计后得 到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图 可得: (1)25,30)年龄组对应小矩形的高度为_; (2)据此估计该市“四城同创”活动中志愿者年龄在25,35)的人数为_. 解析设25,30)年龄组对应小矩形的高度为 h,则 5(0.01h0.070.06 0.02)1,解得 h0.04.则志愿者年龄在25,35)年龄组的频率为 5(0.040.07) 0.55,故志愿者年龄在25,35)年龄组的人数约为 0.55800440. 答案(1)0.04(2)440