书签 分享 收藏 举报 版权申诉 / 23
上传文档赚钱

类型第2节 数据的数字特征及直观表示、用样本估计总体.docx

  • 上传人(卖家):四川天地人教育
  • 文档编号:1755627
  • 上传时间:2021-09-25
  • 格式:DOCX
  • 页数:23
  • 大小:896.19KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第2节 数据的数字特征及直观表示、用样本估计总体.docx》由用户(四川天地人教育)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 数字 特征 直观 表示 样本 估计 总体 下载 _其他_数学_高中
    资源描述:

    1、第第 2 节节数据的数字特征及直观表示、用样本估计总体数据的数字特征及直观表示、用样本估计总体 知识梳理 1.数据的数字特征 (1)最值 一组数据的最值指的是其中的最大值与最小值, 最值反映的是这组数最极端的情 况. (2)平均数 定义:如果给定的一组数是 x1,x2,xn,则这组数的平均数为x 1 n(x 1x2 xn). 这一公式在数学中常简记为x 1 n n i1xi, 性质:一般地,利用平均数的计算公式可知,如果 x1,x2,xn的平均数为 x ,且 a,b 为常数,则 ax1b,ax2b,axnb 的平均数为 ax b. (3)中位数 有奇数个数,且按照从小到大排列后为 x1,x2,

    2、x2n1,则称 xn1为这组数的 中位数;如果一组数有偶数个数,且按照从小到大排列后为 x1,x2,x2n,则 称xnxn 1 2 为这组数的中位数. (4)百分位数 定义:一组数的 p%(p(0,100)分位数指的是满足下列条件的一个数值:至 少有 p%的数据不大于该值,且至少有(100p)%的数据不小于该值. 确定方法:设一组数按照从小到大排列后为 x1,x2,xn,计算 inp%的值, 如果 i 不是整数,设 i0为大于 i 的最小整数,取 xi0为 p%分位数;如果 i 是整数, 取xixi 1 2 为 p%分位数.特别地,规定:0 分位数是 x1(即最小值),100%分位数是 xn(

    3、即最大值). (5)众数 一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称 为这组数据的众数. (6)极差、方差与标准差 极差:一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了 一组数的变化范围. 方差 定义: 如果 x1, x2, ,xn的平均数为x , 则方差可用求和符号表示为 s21 n n i1_(xi x )21 n n i1x 2 ix 2. 性质:如果 a,b 为常数,则 ax1b,ax2b,axnb 的方差为 a2s2. 标准差 定义:方差的算术平方根称为标准差.一般用 s 表示,即样本数据 x1,x2,xn 的标准差为 s 1 n n i1

    4、 (xix )2.性质: 如果 a, b 为常数, 则 ax1b, ax2b, , axnb 的标准差为|a|s. 2.数据的直观表示 (1)柱形图 柱形图(也称为条形图)可以形象地比较各种数据之间的数量关系. (2)折线图 一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图 来表示. (3)扇形图 扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况. (4)茎叶图 一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列. (5)频数、频率分布直方图 作频数、频率分布直方图的步骤 ()找出最值,计算极差:即一组数据中最大值与最小值的差; ()合理分组,确定区间:

    5、根据数据的多少,一般分 59 组; ()整理数据: 逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频 数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组 是闭区间; ()作出有关图示: 根据上述整理后的数据,可以作出频数分布直方图与频率分布直方图,分别如图 (1)(2)所示.值得注意的是,频数分布直方图的纵坐标是频数,每一组数对应的矩 形高度与频数成正比;频率分布直图的纵坐标是频率 组距,每一组数对应的矩形高度 与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分 布直方图中,所有矩形的面积之和为 1. 频数分布折线图和频率分布折

    6、线图 作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图, 折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义 的. 不难看出,虽然作频数分布直方图与频率分布直方图过程中,原有数据被“压缩” 了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚地看出数 据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计出平 均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利 用原始数据求出的数字特征一般会有差异. 3.用样本估计总体 (1)用样本的数字特征估计总体的数字特征,如果样本的容量恰当,抽样方法又 合理的话,样本的数字特

    7、征能够反映总体的数字特征. (2)用样本的分布估计总体的分布 如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多. 1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心” ,等于频率分布直方图中每个小长方形的 面积乘以小长方形底边中点的横坐标之和. 2.平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为x ,那么 mx1a,mx2a,mx3a,mxn a 的平均数是 mx a. (2)若数据 x1,x2,xn的方差为 s2,那么 数

    8、据 x1a,x2a,xna 的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2. 3.如果一组数中,各数据值都相等,则标准差为 0,表明数据没有波动,数据没 有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据 的波动幅度也较大,数据的离散程度较高,因此标准差(或方差)描述了数据相对 于平均数的离散程度. 诊断自测 1.判断下列结论正误(在括号内打“”或“”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.() (2)数据:68,69,71,63,70,68,69,71,69,72 的 25%分位数为 69.() (3)频率分布直方图中,小矩

    9、形的面积越大,表示样本数据落在该区间的频率越 大.() (4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.() 答案(1)(2)(3)(4) 2一个容量为 32 的样本,已知某组样本的频率为 0.25,则该组样本的频数为 () A4B8C12D16 答案B 解析设频数为 n,则 n 320.25,n32 1 48. 3若某校高一年级 8 个班参加合唱比赛的得分分别为 87,89,90,91,92,93, 94,96,则这组数据的中位数和平均数分别是() A91.5 和 91.5B91.5 和 92 C91 和 91.5D92 和 92 答案A 解析这组数据由小到大排列为 87,8

    10、9,90,91,92,93,94,96, 中位数是9192 2 91.5, 平均数x 8789909192939496 8 91.5. 4(2020全国卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天 能完成 1200 份订单的配货,由于订单量大幅增加,导致订单积压为解决困难, 许多志愿者踊跃报名参加配货工作已知该超市某日积压 500 份订单未配货,预 计第二天的新订单超过 1600 份的概率为 0.05.志愿者每人每天能完成 50 份订单 的配货,为使第二天完成积压订单及当日订单的配货的概率不小于 0.95,则至少 需要志愿者() A10 名B18 名C24 名D32 名 答案B 解

    11、析由题意,第二天完成积压订单及当日订单的配货的概率不小于 0.95,即第 二天确保完成新订单 1600 份,减去超市每天能完成的 1200 份,再加上积压的 500 份,共有 16001200500900(份),至少需要志愿者 9005018(名) 5(2020全国卷)设一组样本数据 x1,x2,xn的方差为 0.01,则数据 10 x1, 10 x2,10 xn的方差为() A0.01B0.1C1D10 答案C 解析10 x1,10 x2,10 xn的方差为 1020.011.故选 C. 6(2020新高考海南卷)某中学的学生积极参加体育锻炼,其中有 96%的学生喜 欢足球或游泳,60%的学

    12、生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足 球又喜欢游泳的学生数占该校学生总数的比例是() A62%B56%C46%D42% 答案C 解析如图,用 Venn 图表示该中学喜欢足球和游泳的学生所占的比例之间的关 系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为 x,则(60%x) (82%x)x96%,解得 x46%.故选 C. 考点一数据的数字特征 【例 1】 (1)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的 成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数字特征是() A中位

    13、数 B平均数 C方差 D极差 (2)(多选题)(2021武汉调研)甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩 的统计表如下表所示, 甲乙 环数45678569 频数11111311 下列说法正确的有() A甲成绩的平均数小于乙成绩的平均数 B甲成绩的中位数等于乙成绩的中位数 C甲成绩的方差小于乙成绩的方差 D甲成绩的极差等于乙成绩的极差 答案(1)A(2)CD 解析(1)中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数 据,因而去掉 1 个最高分和 1 个最低分,不变的是中位数,平均数、方差、极差 均受影响故选 A. (2)由表中数据,得x 甲1 5(45678)6,

    14、x 乙1 5(5369)6, 所以x 甲x 乙,A 错误; 甲成绩的中位数是 6,乙成绩的中位数是 5, 所以甲成绩的中位数大于乙成绩的中位数,B 错误; s2 甲1 5(46) 2(56)2(66)2(76)2(86)22, s2 乙1 53(56) 2(66)2(96)22.4, 所以 s2 甲s 2 甲,甲更稳定,故 最佳人选应是甲 考点二数据数字特征直观表示及应用 角度 1扇形图 【例 2】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻 番 为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前 后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正

    15、确的是() A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案A 解析法一设新农村建设前经济收入为 a,则新农村建设后经济收入为 2a,则 由饼图可得新农村建设前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a. 新农村建设后种植收入为 0.74a,其他收入为 0.1a,养殖收入为 0.6a,养殖收入 与第三产业收入的总和为 1.16a,所以新农村建设后,种植收入减少是错误的 法二因为 0.6 1 4,所以 正确故选 C. 6(多选题)(2021青岛调

    16、研)为了解户籍、性别对生育二胎选择倾向的影响,某 地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生 育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比 例,则下列叙述中正确的是() A是否倾向选择生育二胎与户籍有关 B是否倾向选择生育二胎与性别无关 C倾向选择生育二胎的人员中,男性人数与女性人数相同 D倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 答案ABD 解析由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择 不生育二胎的人员中,农

    17、村户籍人数少于城镇户籍人数,倾向选择生育二胎的人 员中, 男性人数为 6060%36, 女性人数为 4060%24, 不相同 故选 ABD. 二、填空题 7我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有 10 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_ 答案0.98 解 析经 停 该 站 高 铁 列 车 所 有 车 次 的 平 均 正 点 率 的 估 计 值 为 x 100.97200.98100.99 102010 0.98. 8若样本数据 x1,x2,x10的标准差

    18、为 8,则数据 2x11,2x21,2x10 1 的标准差为_ 答案16 解析依题意,x1,x2,x3,x10的方差 s264.则数据 2x11,2x21, 2x101 的方差为 22s22264,所以其标准差为 22642816. 9为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区 进行了“家庭每月日常消费额”的调查 他们将调查所得到的数据分别绘制成频 率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为 s1,s2,s3, 则它们的大小关系为_(用“”连接) 答案s1s2s3 解析根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远, 表现的最分散,标

    19、准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标 准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最 小,故 s1s2s3. 三、解答题 10共享单车入住泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受 人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频 率、满意度等三个方面的信息,在全市范围内发放 5000 份调查问卷,回收到有 效问卷 3125 份,现从中随机抽取 80 份,分别对使用者的年龄段、2635 岁使 用者的使用频率、2635 岁使用者的满意度进行汇总,得到如下三个表格: 表(一) 使用者 年龄段 25 岁以 下 26 岁 35

    20、 岁 36 岁 45 岁 45 岁以 上 人数20401010 表(二) 使用06 次71415222331次 频率/月次/月次/月/月 人数510205 表(三) 满意度 非常满意 (910) 满意 (89) 一般 (78) 不满意 (67) 人数1510105 (1)依据上述表格完成下列三个统计图形: (2)某城区现有常住人口 30 万,请用样本估计总体的思想,估计年龄在 26 岁 35 岁之间,每月使用共享单车在 714 次的人数 解(1)补全三个统计图如图: (2)由表(1)可知:年龄在 2635 岁之间的有 40 人,占总抽取人数的一半,用样 本估计总体的思想可知, 某城区 30 万

    21、人口中年龄在 2635 岁之间的约有 301 215(万人); 又年龄在 2635 岁之间每月使用共享单车在 714 次之间的有 10 人, 占总抽取 人数的1 4, 用样本估计总体的思想可知, 城区年龄在 2635 岁之间的 15 万人中每月使用共 享单车在 714 次之间的约有 151 4 15 4 (万人), 所以年龄在 2635 岁之间,每月使用共享单车在 714 次之间的约有15 4 万人 11某市民用水拟实行阶梯水价,每人月用水量中不超过 w 立方米的部分按 4 元/立方米收费,超出 w 立方米的部分按 10 元/立方米收费,从该市随机调查了 10000 位居民,获得了他们某月的用

    22、水量数据,整理得到如下频率分布直方图: (1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立方米,w 至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替,当 w3 时,估计该市居 民该月的人均水费 解(1)如题图所示,用水量在0.5,2)的频率的和为(0.20.30.4)0.50.45, 用水量在0.5,3)的频率的和为(0.20.30.40.50.3)0.50.85. 用水量小于等于 2 立方米的频率为 0.45,用水量小于等于 3 立方米的频率为 0.85,又 w 为整数, 为使 80%以上的居民在该月的用水价格为 4 元/立方米,w

    23、 至少定为 3. (2)当 w3 时,该市居民该月的人均水费估计为 (0.110.151.50.220.252.50.153)40.15340.05(3.5 3)0.05(43)0.05(4.53)107.21.81.510.5(元) 即当 w3 时,该市居民该月的人均水费估计为 10.5 元 B 级能力提升 12(多选题)(2021淄博模拟)区域经济变化影响着人口的流动,下图为过去某连 续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图 某连续 5 年各省、自治区及直辖市(不含港澳台)人口增长统计图 根据图中的信息,下面结论中正确的是() A广东人口增量最多,天津增幅最高 B黑龙江无

    24、论是增量还是增幅均居末尾 C天津、北京、重庆和上海四大直辖市增幅均超过 5% D人口增量超过 200 万的省、自治区或直辖市共有 7 个 答案ABD 解析对于 A,由图知广东 5 年人口增加超过 400 万,增量最多,天津增幅达到 了 19.2%,增幅最高,A 正确;对于 B,由图易知正确;对于 C,上海的人口增 幅为 4.9%,未超过 5%,不正确;对于 D,人口增量超过 200 万的省或直辖市有 天津、北京、重庆、广东、河北、湖南和山东,正确综上,选 ABD. 13若数据 x1,x2,x3,xn的平均数x 5,方差 s22,则数据 3x11,3x2 1,3x31,3xn1 的平均数和方差分

    25、别为_ 答案16,18 解析x1,x2,x3,xn的平均数为 5, x1x2x3xn n 5, 3x13x23x33xn n 1 35116, x1,x2,x3,xn的方差为 2, 3x11,3x21,3x31,3xn1 的方差是 32218. 14(2020石家庄模拟)“一带一路”是“丝绸之路经济带”和“21 世纪海上丝 绸之路”的简称某市为了了解人们对“一带一路”的认知程度,对不同年龄和 不同职业的人举办了一次“一带一路”知识竞赛,满分为 100 分(90 分及以上为 认知程度高)现从参赛者中抽取了 x 人,按年龄分成 5 组,第一组:20,25), 第二组:25,30),第三组:30,3

    26、5),第四组:35,40),第五组:40,45, 得到如图所示的频率分布直方图,已知第一组有 6 人 (1)求 x; (2)求抽取的 x 人的年龄的中位数(结果保留整数); (3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法 依次抽取 6 人,42 人,36 人,24 人,12 人,分别记为 15 组,从这 5 个按年 龄分的组和 5 个按职业分的组中每组各选派 1 人参加“一带一路”知识竞赛, 分 别代表相应组的成绩,年龄组中 15 组的成绩分别为 93,96,97,94,90,职 业组中 15 组的成绩分别为 93,98,94,95,90. 分别求 5 个年龄组和 5

    27、 个职业组成绩的平均数和方差; 以上述数据为依据, 评价5个年龄组和5个职业组对“一带一路”的认知程度, 并谈谈你的感想 解(1)根据频率分布直方图得第一组的频率为 0.0150.05,6 x0.05,x 120. (2)设中位数为 a,则 0.0150.075(a30)0.060.5, a95 3 32,则中位数为 32. (3)5 个年龄组成绩的平均数为 x 11 5(9396979490)94, 方差为 s 2 1 1 5(1) 2223202(4)26. 5 个职业组成绩的平均数为 x 21 5(9398949590)94,方差为 s 2 2 1 5(1) 2420212(4)26.8. 从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感 想合理即可)

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第2节 数据的数字特征及直观表示、用样本估计总体.docx
    链接地址:https://www.163wenku.com/p-1755627.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库