222用样本数字特征分布估计总体数字特征课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《222用样本数字特征分布估计总体数字特征课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 222 样本 数字 特征 分布 估计 总体 课件
- 资源描述:
-
1、用样本的数字特征估计用样本的数字特征估计总体的数字特征总体的数字特征 在一次射击比赛中在一次射击比赛中,甲、乙两名运动员各射击甲、乙两名运动员各射击10次,命中环数如下次,命中环数如下甲运动员甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?的更稳定些吗?问题问题为了从整体上更好地把握总体的规律,我们要通为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。过样本的数据对总体的数字特征进行研究。用样本的数字特征估计总体的
2、数字特征。用样本的数字特征估计总体的数字特征。1、众数众数 在一组数据中,在一组数据中,出现次数最多出现次数最多的数据的数据叫做这一组数据的众数叫做这一组数据的众数.2、中位数中位数 将一组数据按大小依次排列,将一组数据按大小依次排列,把把处在最中间位置的一个数据处在最中间位置的一个数据(或两个数据(或两个数据的平均数)叫做这组数据的中位数的平均数)叫做这组数据的中位数.3、平均数平均数 (1)x=(x1+x2+xn)/n (2)x=x1f1+x2f2+xkfk 甲在一次射击比赛中的得分如下甲在一次射击比赛中的得分如下:(单位单位:环环).7,8,6,8,6,5,9,10,7,5,则他则他命中
3、的平均数是命中的平均数是_,中位数是中位数是 众数是众数是_ 2.某次数学试卷得分抽样中得到某次数学试卷得分抽样中得到:90分分的有的有3个人个人,80分的有分的有10人人,70分的有分的有5人人,60分的有分的有2人人,则这次抽样的平均分为则这次抽样的平均分为_.7.177分分 练习练习75,6,7,8众数众数:若有两个或两个以上的数据出若有两个或两个以上的数据出现的次数一样,则这些数据都叫众数;若一现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没组数据中每个数据出现的次数一样多,则没有众数。有众数。中位数中位数:唯一确定的。不受极端值的影唯一确定的。不受极端值的
4、影响,仅利用了数据中排在中间数据的信息。响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误信当样本数据质量比较差,即存在一些错误信息时,应该用抗极端性很强的中位数表示数息时,应该用抗极端性很强的中位数表示数据的中心值。据的中心值。平均数平均数:任何一个样本数据的改变都任何一个样本数据的改变都会引起平均数的改变。会引起平均数的改变。月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10如何从频率分布直方图中估计众数?如图:如何从频率分布直方图中估计众数?如图:2.25 众数在样本数据的频率分布直方图中,众
5、数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。思考:思考:频率分布直方图中估计的众数与原始频率分布直方图中估计的众数与原始数据中的众数数据中的众数2.32.3不同,为什么?不同,为什么?在频率分布直方图,我们只能直观地看出在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本原始的数据内容,直方图已经损失一些样本信息。信息。讨论:讨论:众数估计总体情况有什么优缺点?众数估计总体情况有什么优缺点?能够体现样本数据的最大集中点,但它能够体现样本数据的最大集中点,
6、但它对其它数据信息的忽视使得无法客观地反映对其它数据信息的忽视使得无法客观地反映总体特征。总体特征。如何从频率分布直方图中估计中位数?如何从频率分布直方图中估计中位数?0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积前四个小矩形的面积和和=0.492.02后四个小矩形的后四个小矩形的面积和面积和=0.26分析:分析:在样本数据中,有在样本数据中,有50%50%的个体小于或等于中位数,也有的个体小于或等于中位数,也有50%50%的个体
7、大的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。的面积应该相等。总结:总结:在频率分布直方图中,把频率分布直方图划分左右两在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标称为中位数。轴交点的横坐标称为中位数。注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率上图中,设中位数为上图中,设中位数为x,则,则 02.25.05.0)2(22.015.008.004.0 xx思考:思考:2.022.02这个中位数的估计值,与
8、样本数据的中这个中位数的估计值,与样本数据的中位数位数2.02.0不同,为什么?不同,为什么?从频率分布直方图本身得不出原始的数据内容,从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。频率分布直方图已经损失一些样本信息。思考:思考:中位数不受少数极端值的影响,这在某些情中位数不受少数极端值的影响,这在某些情 况下是一个优点,但它对极端值的不敏感有时也会成况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?为缺点,你能举例说明吗?考察考察100位居民的月均用水量表中的数据,如果把位居民的月均用水量表中的数据,如果把最后一个数据错写成最后一个数据错写
9、成22,并不会对样本中位数产生影,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。常造成错误数据。对极端值不敏感有利的例子对极端值不敏感有利的例子:某人具有初级计算机专业技术水平,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很选择工作的参考指标就会
10、冒这样的风险:很可能所选择公司的初级计算机专业技术水平可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的人员的收入很低,其原因是中位数对极小的数据不敏感。数据不敏感。这里更好的方法是同时用平均这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。大且中位数较大的公司就业。对极端值不敏感有弊的例子:对极端值不敏感有弊的例子:如何从频率分布直方图中估计平均数如何从频率分布直方图中估计平均数?注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率0.020.040.060.140.250.
展开阅读全文