统计量和抽样分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计量和抽样分布课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 分布 课件
- 资源描述:
-
1、第九章第九章 统计量和抽样分布统计量和抽样分布第一节第一节 统计量统计量第二节第二节 常用统计量常用统计量第三节第三节 抽样分布抽样分布9.1 统计量统计量完全由样本确定的量完全由样本确定的量(可能是向量可能是向量)称为称为统计量统计量 数学观点数学观点:统计量是样本的函数:统计量是样本的函数(可能是向量值函数可能是向量值函数)定义:定义:设设(X1,Xn)为总体为总体X的一个样本的一个样本,f(X1,Xn)为不为不含任何未知参数的连续函数,则称含任何未知参数的连续函数,则称f(X1,Xn)为样为样本本(X1,Xn)的一个统计量的一个统计量.统计量是随机变量统计量是随机变量(或随机向量或随机向
2、量),统计量是确定的,统计量是确定的数或向量,其数值称为统计量观察值数或向量,其数值称为统计量观察值.2(,)N 例:例:设设(X1,X2,X3)是从正态总体是从正态总体 中抽取的中抽取的 样本,其中样本,其中 已知已知,未知未知.1233XXX 2123XXX 前提:前提:1.样本均值样本均值 Sample Mean一组数据一组数据X1,X2,Xn是总体是总体X的一个样本的一个样本11niiXXn 9.2 常用统计量常用统计量2.样本标准差或均方差样本标准差或均方差注意:它们的观测值用相应的小写字母表示注意:它们的观测值用相应的小写字母表示 211niiSXXn 2211niiXXn 反映总
3、体反映总体X取值的平均取值的平均反映总体反映总体X取值的离散程度取值的离散程度2.样本方差样本方差 Sample Variance 2211niiSXXn 3.样本的样本的K阶原点矩阶原点矩11nkkiiAXn 4.样本的样本的K阶中心矩阶中心矩 11nkkiiBXXn 它包括两个方面:它包括两个方面:数据的简单处理数据的简单处理 研究随机现象,首要的工作是收集原始数据研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它杂乱无章的,需要通过整理后才能显示出它们的分布状况。们的分布状况。数据的简
4、单处理数据的简单处理:以一种直观明了方式加工数据以一种直观明了方式加工数据(1)数据整理数据整理(2)计算样本特征数计算样本特征数计算样本特征数:计算样本特征数:数据简单处理的具体操作步骤数据简单处理的具体操作步骤 数据整理:数据整理:(1)反映趋势的特征数反映趋势的特征数 (a)样本均值样本均值11niiXXn (b)中位数:数据按大小顺序排列后,位中位数:数据按大小顺序排列后,位 置居中的那个数或居中的两置居中的那个数或居中的两 个数的平均数个数的平均数.(c)众数:样本中出现最多的那个数。众数:样本中出现最多的那个数。(1)将数据分组将数据分组(2)计算各组频数计算各组频数作频率分布表作
5、频率分布表作频率直方图作频率直方图(2)反映分散程度的特征数:极差、四分位差反映分散程度的特征数:极差、四分位差 (a)极差:样本数据中最大值与最小值之差极差:样本数据中最大值与最小值之差 记为记为 RMm(b)四分位数:将样本数据依概率分为四等四分位数:将样本数据依概率分为四等 份的份的3个数椐,依次称为第一、个数椐,依次称为第一、第二、第三四分位数。第二、第三四分位数。第一四分位数第一四分位数Q1:1()0.25P XQ第二四分位数第二四分位数Q2:2()0.5P XQ第三四分位数第三四分位数Q3:3()0.75P XQ即即 例:为对某小麦杂交组合例:为对某小麦杂交组合F2代的株高代的株高
6、X进行研究,抽取进行研究,抽取 容量为容量为100的样本,测试的原始数据记录如下的样本,测试的原始数据记录如下(单位:单位:厘米厘米),试根据以上数据,画出它的频率直方图,试根据以上数据,画出它的频率直方图,求随机变量求随机变量X的分布状况。的分布状况。87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99 89104 94 94 92 96 87 94 92 86102 88 75 90 90 80 84 91 82 94 99102 91 96 94 94 85 88 80 83 81 69 95 80
7、 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92 第一整理原始数据,加工为分组资料,作频率分表,第一整理原始数据,加工为分组资料,作频率分表,画直方图,提取样本分布特征的信息画直方图,提取样本分布特征的信息.1.找出数据中最小值找出数据中最小值m=69,最大值,最大值M=111,极差为:,极差为:Mm=42,即,即R=42.2.数据分组,根据样本容量数据分组,根据样本容量n的大小,决定分组数的
8、大小,决定分组数k。一般规律:一般规律:30n40 5k6 40n60 6k8 60n100 8k10 100n500 10k20具体步骤如下:具体步骤如下:数据分组数参考表数据分组数参考表 数据数数据数4060100150200400600分组数分组数68791015162024数据数数据数800100015002000500010000分组数分组数273035395674(2)一般采取等距分组一般采取等距分组(也可以不等距分组也可以不等距分组),组距等于极差除以组数略大的测量单位组距等于极差除以组数略大的测量单位 的整数倍。的整数倍。111694.759Mmk(1)本例取本例取 k=9(3
9、)本例测量单位为本例测量单位为1厘米,组距为厘米,组距为 3.确定组限和组中点值确定组限和组中点值注意:组的上限与下限应比数据多一位小数。注意:组的上限与下限应比数据多一位小数。当取当取a=67.5,b=112.49(a略小于略小于m,b略大于略大于M,且且a和和b都比数据多一位小数),分组如下:都比数据多一位小数),分组如下:一般根据算式:一般根据算式:各组中点值各组中点值 组距组距=组的上限或下限组的上限或下限1267.5,72.5)72.5,77.5)77.5,82.5)82.5,87.5)87.5,92.5)92.5,97.5)97.5,102.5)102.5,107.5)107.5,
10、112.5)组中点值分别为:组中点值分别为:70 75 80 85 90 95 100 105 1104.将数据分组,计算出各组频数,作频数、频率分布表将数据分组,计算出各组频数,作频数、频率分布表组序组序区间范围区间范围频数频数fj频率频率Wj=fj/n累计频率累计频率Fj167.5,72.5)20.020.02272.5,77.5)50.050.07377.5,82.5)100.100.17482.5,87.5)180.180.35587.5,92.5)300.30.65692.5,97.5)180.180.83797.5,102.5)100.10.938102.5,107.5)40.04
11、0.979107.5,112.5)30.031.00作频率直方图作频率直方图 5.作出频率直方图作出频率直方图以样本值为以样本值为横坐标横坐标,频率,频率/组距为组距为纵坐标纵坐标;以分组区间为底,以以分组区间为底,以 为高为高 15jjjjjWWYXX 从频率直方图可看到:从频率直方图可看到:靠近两个极端的数据出现比较少,而中间附近的靠近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势数据比较多,即中间大两头小的分布趋势.随机变量分布状况的最粗略的信息随机变量分布状况的最粗略的信息在频率直方图中,每个矩形面积恰好等于样本值在频率直方图中,每个矩形面积恰好等于样本值落
12、在该矩形对应的分组区间内的频率,即落在该矩形对应的分组区间内的频率,即 频率直方图中的小矩形的面积近似地反映了样本频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似数据落在某个区间内的可能性大小,故它可近似描述描述X的分布状况。的分布状况。11jjjjjjjWSXXWXX 样本方差样本方差 样本标准差样本标准差 Q1 Q3 极差极差 四分位差四分位差 68.6909 8.288 85.25 95 42 4.875第二计算样本特征数第二计算样本特征数 1.反映集中趋势的特征数:反映集中趋势的特征数:样本均值、中位数、众数样本均值、中位数、众数等等样本均值样本均值
展开阅读全文