数理统计的基本知识课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数理统计的基本知识课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 基本知识 课件
- 资源描述:
-
1、第六章第六章 数理统计的基本知识数理统计的基本知识 数理统计是以概率论为基础,根据试验或观察得到的数据,来研究随机现象通过统计分析,对研究对象的客观规律性作出合理的估计和推断第一节 总体与样本 在一个统计问题中,我们把所研究对象的全体称为一个总体总体中的每个元素(即每一个研究对象)称为个体 若总体中包含有限个个体,则称这个总体为有限总体,否则称为无限总体,总体中所包含的个体总数称为总体容量 在统计问题中,人们所关心的往往不是总体的一切方面,而是它的某一项数量指标X因此,我们把这个数量指标X所有可能取值的全体就作为总体看待,称为总体X,X是一个随机变量我们要根据试验或观察得到的数据来得到X的概率
2、分布和数字特征,分别称为总体的分布和数字特征 大家知道,随机现象的统计规律性必然在大量的重复试验中呈现出来,为了推断总体X 的性质,从理论上讲,应该对每个个体逐一进行测试,然而实际上这样做往往是不现实的,例如,要研究灯泡寿命,由于寿命测试是破坏性的,当测试过每只灯炮的寿命后,这批灯泡就报废了 一般来说,恰当的方法是按一定的规则从总体中抽取若干个个体进行测试,为了使测试到的数据能很好地反映总体的情况,当然应该要求总体中每一个个体被抽到的可能性是均等的并且在抽取一个个体后总体的成分不改变这种抽取个体的方法称为简单随机抽样被抽出的部分个体,叫做总体的一个样本 假设我们从总体 X 中抽取 n 个个体进
3、行测试(简单抽样),把测试结果分别记作X1,X2,,Xn由于抽样的随机性,Xi 可以取 X 所有可能的值,是与 X 具有相同分布的随机变量,且 X1,X2,Xn 相互独立这样的 n 个个体称为总体 X 的一个简单随机样本 定义 设 X 是具有某一概率分布的随机变量(看作一个总体)如果随机变量X1,X2,,Xn 相互独立,且都与 X 具有相同的概率分布,则称 n 维随机变量(X1,X2,Xn)为来自总体 X 的简单随机样本,简称样本,n 称为样本容量 在对总体X进行一次具体的抽样并作观测之后,得到样本(X1,X2,Xn)的确切的数值(x1,x2,xn),称为一个样本观测值(观察值),简称样本值
4、样本(X1,X2,Xn)所有可能取值的全体称为样本空间,它是n维空间或其中的一个子集样本观察值(x1,x2,xn)是样本空间中的一个点 如果总体 X 的分布函数为F(x),则 X 的样本 X1,X2,Xn 的联合分布函数为 .如果总体 X 为连续型且概率密度为 f(x),则样本(X1,X2,Xn)的联合概率密度为 niixF1)(niixf1)(第二节 统计量及其分布 一、统计量 样本是总体的代表,是统计推断的依据在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的函数,来进行统计推断 定义1 设(X1,X2,Xn)是来自总体 X 的一个样本,t=g(t1,t2,tn)为t1,t2
5、,tn的一个单值实函数,并且其中不包含任何未知参数,则称 T=g(X1,X2,Xn)为一个统计量 设 x1,x2,xn 是相应于样本 X1,X2,Xn 的样本值,则称 g(x1,x2,,xn)是统计量T=g(X1,X2,Xn)的观察值二、样本矩 下面给出几个常用的统计量设(X1,X2,Xn)是来自总体 X 的一个样本,(x1,x2,xn)是样本观察值,定义:样本均值 niiXnX11 样本分差 .样本标准差(均方差)niiniiXnXnXXnS12212211)(11niiXXnSS122)(11 样本k阶(原点)矩 (k=1,2,).样本k阶中心矩 (k=1,2,).nikikXnA11ni
6、kikXXnB1)(1显然 ,XA 1221SnnB 它们的观察值分别为 ,niixnx11niiniixnxnxxns12212211)(11niixxns12)(11nikikxna11nikikxxnb1)(1,.三、顺序统计量 定义2 (X1,X2,Xn)是总体X的一个样本,(x1,x2,xn)是一个样本观察值,将它由小到大的顺序排列,得到x(1)x(2)x(n),取x(i)作为X(i)的观测值,由此得到的统计量X(1),X(2),X(n)称为样本(X1,X2,Xn)的一组顺序统计量,X(i)称为第i个顺序统计量或第i项统计量 Rn=x(n)x(1)分别称为样本中位数和样本极差 样本均
7、值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上的大致位置;样本方差与样本极差描述了样本的分散程度mnXXmnXXmmm2,)(2112,)1()()1(当当第三节 样本分布函数与频率直方图一、样本分布函数 样本能够反映总体X的信息,总体X的分布函数F(x)是否能由样本来“表示”?回答是肯定的,我们用下面介绍的样本函数来近似表示总体X的分布函数 定义 设x(1),x(2),x(n)是总体X的顺序统计量的一组观察值,对于任意的实数x,定义函数 .,1;1,2,1,;,0)()()1()()1(niinxxnixxxnixxxF 称Fn(x)为总体X的样本分布函数(或经验分布函数)样本分布
8、函数Fn(x)不仅与样本容量 n 有关,还与所得到的样本观察值有关,故它是随机变量Fn(x)的图形(图6-1)呈跳跃上升的台阶状,在x(1),x(2),x(n)中的不重复的值处,跳跃高度为 ;在重复 l 次的值处,跳跃高度为 图6-1中的曲线是总体 X 的理论分布函数 F(x)的图形nln1图6-1 样本分布函数Fn(x)具有以下性质:10Fn(x)1;2Fn(x)是单调不减函数;3Fn(x)是处处右连续的 对于样本观察值(x1,x2,xn),为了求其对应的样本分布函数 Fn(x)之值,只须将这 n 个值中小于或等 x 的个数除以样本容量 n 即可对于给定的x,Fn(x)是 n 次重复独立试验
9、中事件 Xx 出现的频率,而理论分布函数F(x)是事件Xx发生的概率,由伯努利定理知,对任意给定的正数,有 ,即Fn(x)按概率收敛于F(x)进一步还有如下结论1|)()(|limxFxFPnn 定理 (格利文科(W.Glivenko)定理)定理)设总体X的分布函数为F(x),样本分布函数Fn(x),则对于任何实数x,有 证明从略 以上结论是我们用样本去推断总体的依据10|)()(|suplimxFxFPnxn 二、频率直方图二、频率直方图 如果说样本分布函数是通过随机样本对总体分布函数的反映,那么下面介绍的频率直方图就是样本对总体概率密度函数的反映(假设总体是连续随机变量)依据总体 X 的一
10、个样本观察值(x1,x2,xn)画直方图的一般步骤如下:1找出x1,x2,xn中的最小值x(1)与最大值x(n)2选择常数a、b(ax(1),bx(n),在区间a,b内插入k1个分点;a=t0t1t2tk1100时,取 k 为1015通常取 ti 比样本观察值精度高一位 ,1kabtttii 3对于每个小区间(ti-1,ti,数出x1,x2,xn落入其中的个数 ni(称为频数),再算出频率 ,i=1,2,k 4在 xOy 平面上,对每个 i,画出以(ti-1,ti 为底,以 yi=fi/t(i=1,2,k)为高的矩形这种图称为频率直方图,简称直方图nnfii 直方图中第 i 个小矩形面积 yi
11、t=fi(i=1,2,k),k 个小矩形的面积之和为1 由于样本观察值的 n 个数值 x1,x2,xn是从总体X 中独立抽取的,它们落入区间(ti-1,ti 的频率 fi 近似等于随机变量 X 在该区间内取值的概率,即fiPti-1Xti=pi,i=1,2,k,当 X 是连续随机变量,且概率密度为 f(x)时,则有 ,i=1,2,k由此可见直方图在一定程度上反映了X 的概率密度情况ittipxxffii1d)(例1 某炼钢厂生产一种钢,由于各种偶然因素的影响,各炉钢的含硅量是有差异的,因而应该把含硅量X看成一个随机变量现在记录了120炉正常生产的这种钢的含硅量的数据(百分数):0.860.83
展开阅读全文