1、第第 2 节节 统计图表、数据的数字特征、统计图表、数据的数字特征、 用样本估计总体用样本估计总体 最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频 率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用, 会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差), 并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字 特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的 基本方法和样本估计总体的思想解决一些简单的实际问题. 知 识 梳 理 1.频率分布直方图 (1)频率分布表的画法: 第一步:
2、求极差,决定组数和组距,组距极差 组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图) 横轴表示样本数据,纵轴表示频率 组距,每个小矩形的面积表示样本落在该组内的频 率. 2.茎叶图 统计中一种被用来表示数据的图叫作茎叶图,茎是指中间的一列数,叶是从茎的 旁边生长出来的数. 3.样本的数字特征 数字特征 定义 众数 在一组数据中,出现次数最多的数据叫作这组数据的众数 中位数 将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最 中间两个数据的平均数)叫作这组数
3、据的中位数 平均数 样本数据的算术平均数, 方差 微点提醒 1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的 面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为x ,那么 mx 1a,mx2a,mx3a,mxn a 的平均数是 mx a. (2)数据 x1,x2,xn的方差为 s2. 数据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方
4、差为 a2s2. 基 础 自 测 1.判断下列结论正误(在括号内打“”或“”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次.( ) 解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积组距频率 组距频率. (4)错误.茎相同的数据, 叶可不用按从
5、小到大的顺序写, 相同的数据叶要重复记录, 故(4)错误. 答案 (1) (2) (3) (4) 2.(必修 3P33 讲解引申改编)一个容量为 32 的样本,已知某组样本的频率为 0.25, 则该组样本的频数为( ) A.4 B.8 C.12 D.16 解析 设频数为 n,则 n 320.25, n321 48. 答案 B 3.(必修 3P20 示例改编)若某校高一年级 8 个班参加合唱比赛的得分茎叶图如图所 示,则这组数据的中位数和平均数分别是( ) A.91.5 和 91.5 B.91.5 和 92 C.91 和 91.5 D.92 和 92 解析 这组数据由小到大排列为 87,89,9
6、0,91,92,93,94,96, 中位数是9192 2 91.5, 平均数x 8789909192939496 8 91.5. 答案 A 4.(2018 全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍, 实现翻番.为更好地了解该地区农村的经济收入变化情况, 统计了该地区新农村建 设前后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析 法一 设新农村建设前经济收入为 a,
7、则新农村建设后经济收入为 2a,则 由饼图可得新农村建设前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a. 新农村建设后种植收入为 0.74a,其他收入为 0.1a,养殖收入为 0.6a,养殖收入与 第三产业收入的总和为 1.16a,所以新农村建设后,种植收入减少是错误的. 法二 因为 0.64,s24,s22 解析 (1)刻画评估这种农作物亩产量稳定程度的指标是标准差. (2)某 7 个数的平均数为 4, 这 7 个数的和为 4728, 加入一个新数据 4, x 284 8 4.又这 7 个数的方差为 2,且加入一个新数据 4,这 8 个数的方 差 s272(44) 2
8、8 7 4p2,因此正确. 设男生、女生两组数据的平均数分别为x 甲,x 乙,标准差分别为 s甲,s乙. 易求x 甲65.2,x 乙61.8,知x 甲x 乙,正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, s甲y ,因此可看出 A 药的疗效更好. (2)由观测结果可绘制如下茎叶图: 从以上茎叶图可以看出,A 药疗效的试验结果有 7 10的叶集中在茎 2,3 上,而 B 药疗效的试验结果有 7 10的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好. 10.(2017 北京卷)某大学艺术专业 400 名学生参加某次测评, 根据男女学生人数比 例,使用分层抽样的方法从中随机抽取
9、了 100 名学生,记录他们的分数,将数据 分成 7 组:20,30),30,40),80,90,并整理得到如下频率分布直方图: (1)从总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率; (2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间40,50)内的 人数; (3)已知样本中有一半男生的分数不小于 70,且样本中分数不小于 70 的男女生人 数相等.试估计总体中男生和女生人数的比例. 解 (1)根据频率分布直方图可知,样本中分数不小于 70 的频率为(0.02 0.04)100.6, 所以样本中分数小于 70 的频率为 10.60.4. 所以从总体
10、的 400 名学生中随机抽取一人,其分数小于 70 的概率估计为 0.4. (2)根据题意,样本中分数不小于 50 的频率为 (0.010.020.040.02)100.9, 分数在区间40,50)内的人数为 1001000.955. 所以总体中分数在区间40,50)内的人数估计为 400 5 10020. (3)由题意可知,样本中分数不小于 70 的学生人数为 (0.020.04)1010060, 所以样本中分数不小于 70 的男生人数为 601 230. 所以样本中的男生人数为 30260, 女生人数为 1006040, 男生和女生人数 的比例为 604032. 所以根据分层抽样原理,总体
11、中男生和女生人数的比例估计为 32. 能力提升题组 (建议用时:20 分钟) 11.(2019 湖北部分重点中学模拟)某商场对某一商品搞活动, 已知该商品每一个的 进价为 3 元,销售价为 8 元,每天售出的第 20 个及之后的半价出售.该商场统计 了近 10 天这种商品的销量,如图所示,设 x(个)为每天商品的销量,y(元)为该商 场每天销售这种商品的利润.从日利润不少于 96 元的几天里任选 2 天,则选出的 这 2 天日利润都是 97 元的概率是( ) A.1 9 B. 1 10 C.1 5 D.1 8 解析 由题意知 y 5x,x18,19, 95(x19)(43),x20,21, 即
12、 y 5x,x18,19, 76x,x20,21. 当日销量不少于 20 个时,日利润不少于 96 元. 当日销量为 20 个时,日利润为 96 元. 当日销量为 21 个时,日利润为 97 元. 日利润为 96 元的有 3 天,记为 a,b,c,日利润为 97 元的有 2 天,记为 A,B, 从中任选 2 天有(a,A),(a,B),(a,b),(a,c),(b,A),(b,B),(b,c),(c, A),(c,B),(A,B)共 10 种情况, 其中选出的这 2 天日利润都是 97 元的有(A,B)1 种情况, 故所求概率为 1 10. 答案 B 12.(2018 九江模拟)已知样本 x1
13、,x2,xn的平均数为 x;样本 y1,y2,ym 的平均数为 y(xy),若样本 x1,x2,xn,y1,y2,ym的平均数 zax(1 a)y,其中 0a1 2,则 n,m(n,mN+)的大小关系为( ) A.nm B.nm C.nm 解析 由题意得 z 1 nm(nxmy) n nmx 1 n nm y,a n nm, 0a1 2,0 n nm 1 2, 又 n,mN+,2nnm,nm. 答案 C 13.若样本数据 x1,x2,x10的标准差为 8,则数据 2x11,2x21,2x10 1 的标准差为_. 解析 依题意,x1,x2,x3,x10的方差 s264.则数据 2x11,2x21
14、, 2x101 的方差为 22s22264,所以其标准差为 22642816. 答案 16 14.从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,由 测量结果得如下频数分布表: 质量指标值 分组 75,85) 85,95) 95,105) 105,115) 115,125 频数 6 26 38 22 8 (1)作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点 值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不 低于 95 的产品至少要占全部产品 80%”的规定? 解 (1)样本数据的频率分布直方图如图所示: (2)质量指标值的样本平均数为 x 800.06900.261000.381100.221200.08100. 质量指标值的样本方差为 s2(20)20.06(10)20.2600.381020.222020.08104. 所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104. (3)质量指标值不低于 95 的产品所占比例的估计值为 0.380.220.080.68. 由于该估计值小于 0.8, 故不能认为该企业生产的这种产品符合“质量指标值不低 于 95 的产品至少要占全部产品 80%”的规定.