SPSS第5章-总体分布、样本分布与参数估计(修课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SPSS第5章-总体分布、样本分布与参数估计(修课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 总体 分布 样本 参数估计 课件
- 资源描述:
-
1、第五章 总体分布、 样本分布与参数估计 5.1 总体分布与样本分布总体分布与样本分布一、总体与总体分布一、总体与总体分布 总体总体:反映总体特征的随机变量的取值的全体。反映总体特征的随机变量的取值的全体。 总体分布总体分布:反映总体特征的随机变量的概率分布。反映总体特征的随机变量的概率分布。二、随机样本与样本观测值二、随机样本与样本观测值 1、随机样本、随机样本 表征表征n次抽取个体的随机抽样的一组随机变量次抽取个体的随机抽样的一组随机变量X1,X2, Xn 。 2、样本观测值、样本观测值(样本数据样本数据) n次随机抽样的结果:次随机抽样的结果:x1,x2,xn (称为随机样本称为随机样本X
2、1,X2, Xn 的样本观测值的样本观测值)。 n称为随机样本向量称为随机样本向量( X1,X2, Xn )的维度,即自由度。的维度,即自由度。 一个总体10,5,8,7,10 Q:若有放回地抽取2次,请画出两次均值的分布图。 有放回(with replacement)抽样 ,ijXXX10587101010,1010 10,5 7.510,8910,78.510,101055,107.55,555,86.5 5,7 65,107.588,109 8,56.5 8,888,7 7.58,10977,108.57,567,87.5 7,777,108.51010,101010,57.510,89
3、10,78.510,1010 一个样本统计量的概率分布被称为该统计量的抽样分布 样本均值抽样分布 直方图0510678910其他接收频率0.00%50.00%100.00%150.00%频率累积 %3、样本、样本(累积累积)分布函数分布函数 设样本观测值设样本观测值x1 x2 , xn,ki为小于为小于xi+1的样本值出现的累积频的样本值出现的累积频次,次, n为样本容量,则可得样本累积频率分布函数如下:为样本容量,则可得样本累积频率分布函数如下:xxxxxnkxxxFniiin当当当 1 / 0)(11样本样本(累积累积)分布函数分布函数Fn(x)是对总体的累积分布函数是对总体的累积分布函数
4、F(x)的近似,的近似, n越大越大, Fn(x)对对F(x)的近似越好。的近似越好。格利文科格利文科 ( Glivenko )定理定理 当样本容量当样本容量 n 趋于无穷大时,趋于无穷大时,Fn(x)以概率以概率1(关于关于 x )均匀地收敛于均匀地收敛于F(x).1)0)()(suplim(xFxFPnxn思考:请举出总体均值和总体方差的合适估计量。 5.2 统计量与统计量的分布统计量与统计量的分布一、统计量的定义一、统计量的定义统计量统计量:统计量是不含未知参数的,随机样本:统计量是不含未知参数的,随机样本X1,X2,, Xn的函数。的函数。统计量的值统计量的值: 统计量的值是不含未知参
5、数的统计量的值是不含未知参数的, 样本观测值样本观测值x1,x2,xn的函数的函数.二、几个重要统计量分布:二、几个重要统计量分布: 2、t 与与 F分布分布1、 2(n)分布分布 设随机变量设随机变量 X N(0,1) , X1,X2,, Xn为为 X 样本,则样本,则 2 = X2i= X21 + X22 + X2n 2 (n) 2 (n)分布的均值分布的均值 E( 2)= n,方差,方差 D( 2 )= 2n。n=1n=4n=10 2(n)分布图分布图0, 00,)2(21)(2122xxexnxfxnnn 2(n)密度函数:密度函数:其中,其中,n为自由度。为自由度。 (n/2)为珈玛
6、函数,是一个含参数为珈玛函数,是一个含参数n/2的的积分,为:积分,为:0212)2/(dtetntn2、t 分布分布)(ntnYXT其中,其中,X N(0,1),Y 2(n)分布,且分布,且X与与Y相互独立。相互独立。密度函数为:密度函数为:xnxnnnxfnn212)1()2/()21()(t 分布图分布图3、F 分布分布),(nmFnVmUF其中,其中,U 2(m),V 2(n) ,且且U与与V相互独立。相互独立。m=100,n=20m=15,n=20重要性质:重要性质:0 00,)1 ()() 2/() 2/()2()(212xxxnmxnmnmnmnmxfnmm密度函数形式为:密度函
7、数形式为:),(1),(1mnFnmF三、由一般正态分布的随机样本所构成的若干重要统计量的分布三、由一般正态分布的随机样本所构成的若干重要统计量的分布定理:若定理:若X1,X2,, Xn 是正态总体是正态总体N( , 2)的一个随机样本,的一个随机样本,则:则:(1) X N( , 2 / n)(2) X 与与 S2 相互独立。相互独立。nXZ (3) N(0, 1)22)1(Sn (4) 2(n-1)(5) t(n -1)nSXT(6) 2(n)niiX122)(1(1) N(0,1)22212121)()(nnYX定理:若定理:若X1,X2,, Xn1 和和Y1,Y2,, Yn2 分别是正
8、态总体分别是正态总体N( 1, 12)和和N( 2, 22)的一个随机样本,且它们相互独立,的一个随机样本,且它们相互独立,则满足如下性质:则满足如下性质: (3) F(n1-1,n2-1)22222121SSF 21212122221121)2() 1() 1()()(nnnnnnSnSnYXT (2)t(n1+n2 - 2),( 1 = 2 )21122211121222)()(niiniiYnXn (4) F(n1,n2)四、任意分布的随机样本均值函数的均值与方差四、任意分布的随机样本均值函数的均值与方差设:随机变量设:随机变量 X 服从任何均值为服从任何均值为 ,标准差为,标准差为 的
9、分布,的分布,X是是随机样本随机样本X1,X2,, Xn的均值函数。则:的均值函数。则:(1) X = ;(2) X = / n 或或 2X = 2 / n Tips: 某类个体数量占总体数量的比例问题:某类个体数量占总体数量的比例问题:0-1分布分布 若若XB(1, p),则,则 E(X)= p, D(X)= p(1-p)X的均值也是总体中某类个体的比例的均值也是总体中某类个体的比例 pnpppXX)1 (,2五、中心极限定理五、中心极限定理假设随机变量假设随机变量 X 服从任何均值为服从任何均值为 ,标准差为,标准差为 的分布,的分布,X是是随机样本随机样本X1,X2,, Xn的均值函数。
10、的均值函数。当当 n 充分大时,有:充分大时,有:思考:在实际问题中思考:在实际问题中n多大?多大?2( ,)XNn近似地正态分布均匀分布总体分布样 本 均 值分布(n=2)样 本 均 值分布(n=10)样 本 均 值分布(n=30)指数分布Tips:当n 30, 无论总体分布形态如何,中心极限定理均适用;当n 15, 对于分布较为对称的总体,中心极限定理适用;当总体是正态分布时,无论样本大小,中心极限定理均适用。ExEx:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率;(
11、2)计算样本均值小于7.2的概率;(3)计算样本均值在7.2和7.5之间的概率。解答1:)5 . 7(XP求)2 . 27-5 . 72 . 27-(XP)2273. 0Y(2 . 27-YPX,则:令?)2273. 0Y(),1 , 0(Y PN查表得其中标准正态分布表标准正态分布表 ( - ( - x x ) = 1 ( ) = 1 ( x x ) ) x00.010.020.030.040.050.060.070.080.0900.500 00.504 00.508 00.512 00.516 00.519 90.523 90.527 90.531 90.535 90.10.539 80
12、.543 80.547 80.551 70.555 70.559 60.563 60.567 50.571 40.575 30.20.579 30.583 20.587 10.591 00.594 80.598 70.602 60.606 40.610 30.614 10.30.617 90.621 70.625 50.629 30.633 10.636 80.640 40.644 30.648 00.651 70.40.655 40.659 10.662 80.666 40.670 00.673 60.677 20.680 80.684 40.687 90.50.691 50.695 00.
13、698 50.701 90.705 40.708 80.712 30.715 70.719 00.722 40.60.725 70.729 10.732 40.735 70.738 90.742 20.745 40.748 60.751 70.754 90.70.758 00.761 10.764 20.767 30.770 30.773 40.776 40.779 40.782 30.785 20.80.788 10.791 00.793 90.796 70.799 50.802 30.805 10.807 80.810 60.813 30.90.815 90.818 60.821 20.8
14、23 80.826 40.828 90.835 50.834 00.836 50.838 910.841 30.843 80.846 10.848 50.850 80.853 10.855 40.857 70.859 90.862 1解答2:)2 . 7(XP求)2 . 27-2 . 72 . 27-(XP)0909. 0Y(2 . 27-YPX,则:令?)0909. 0Y(),1 , 0(Y PN查表得其中统计方法统计描述统计推断参数估计假设检验点估计区间估计 5.3 点估计点估计1、概念、概念 设设 是总体分布中一个需要估计的参数,现从总体中抽是总体分布中一个需要估计的参数,现从总体中抽取
15、一个随机样本取一个随机样本X1,X2,, Xn ,记估计,记估计 的统计量为的统计量为 ),(21nXXX则称则称 为为 的估计量。的估计量。若得到一组样本观测值若得到一组样本观测值x1,x2,xn ,就可得出,就可得出 的估计的估计值,记:值,记: 。),(21nxxx注:在选取样本统计量注:在选取样本统计量 作为点估计时,必须考虑到作为点估计时,必须考虑到“无偏性无偏性”,这,这一点很重要。一点很重要。总体分布参数总体分布参数 的点估计,就是求出的点估计,就是求出 的估计值。的估计值。点估计点估计2、矩估计、矩估计 用样本矩来估计总体矩。用样本矩来估计总体矩。矩的一般形式:矩的一般形式:
16、E(X k)表示表示 k 阶原点矩阶原点矩(以原点为中心以原点为中心); E(X- )k 表示表示k 阶中心矩阶中心矩(以以 为中心为中心); Q:偏度、峰度、方差、均值分别是什么矩?2、矩估计、矩估计 Ex:设某批产品的寿命在上服从均匀分布,但是参数未知,随机地抽取五个产品,测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试求这批产品寿命均值和方差的矩估计值,并写出相应的分布函数。3、极大似然估计法、极大似然估计法 若总体若总体 X 的的(累积累积)概率分布函数为概率分布函数为F(x, ), 概率密度函数概率密度函数 f (x, ), 其中其中 为未知参数
17、为未知参数 。 若若 X 为离散型随机变量为离散型随机变量, 则由离散型与连续型的对应关系则由离散型与连续型的对应关系, f (x, )对应于离散情况下的概率对应于离散情况下的概率P(X=x).X 为连续型随机变量时为连续型随机变量时, X的随机样本的随机样本X1,X2,, Xn的联合的联合概率密度函数为概率密度函数为niixfL1),()( 称为称为 的极大似然估计函数的极大似然估计函数. 当当 X 为离散随机变量时为离散随机变量时, L表示概率表示概率:),(2211nnxXxXxXPL关于关于 的极大值如果存在的极大值如果存在, 极大值极大值 就是就是 的的极大似然估计值极大似然估计值.
18、 其含义是其含义是: 一组观测值一组观测值x1,x2,xn在一次实验中出现了在一次实验中出现了, 其其联合概率就应当是最大的联合概率就应当是最大的, 所以选择所以选择 使联合密度使联合密度L最大的那个最大的那个.),(21nxxxEx: 设设x1,x2,, xn是正态总体是正态总体N( , 2)的样本观测值,的样本观测值,求求 与与 2 的极大似然估计值的极大似然估计值.解解: 极大似然函数为极大似然函数为nixieL12)(2221)(取对数取对数, 分别对分别对 与与 2 求偏导求偏导, 并令偏导为并令偏导为0, 可求出可求出 与与 2的极大的极大似然估计值如下似然估计值如下:2121)(
19、11niiniixxnxnx如果将上述如果将上述xi 换成换成 Xi , 上式成为极大似然估计量。上式成为极大似然估计量。 5.3 判别点估计的优劣标准判别点估计的优劣标准1、无偏估计量、无偏估计量E2、最小方差性、最小方差性)()(VarVar3、有效估计量、有效估计量 (1)无偏性;无偏性;(2)最小方差性。最小方差性。4、渐近无偏估计量、渐近无偏估计量)(lim En5、一致估计量、一致估计量1)(limpn一致估计量的另一等价定义:一致估计量的另一等价定义:(1) 渐进无偏的;渐进无偏的;(2)0)(limnnVar6、渐进有效性:、渐进有效性: (1) 一致估计量;一致估计量; (2
展开阅读全文