统计学第7章参数估计-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学第7章参数估计-课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 参数估计 课件
- 资源描述:
-
1、统计学-ch7 suyl1第七章参数估计第七章参数估计点估计区间估计抽样估计的进一步讨论统计学-ch7 suyl2l 数理统计的基本问题之一是根据样本所提供的信息,对总体的分布以及分布的数字特征做出统计推断。通过样本估计总体未知参数的方法主要包括参数估计和非参数估计法。这里的参数可以是总体分布中的未知参数,也可以是总体的某个数字特征。参数估计通常是通过构造样本的函数样本统计量来实现的。统计学-ch7 suyl3参数估计示意图总体总体样样本本统计量统计量描述描述作出推断作出推断统计量是进行参数估计的关键统计量是进行参数估计的关键.不同的参数估计不同的参数估计方法得到的统计量可能不同方法得到的统计
2、量可能不同.在这里在这里,我们介绍两我们介绍两种常用的参数估计方法种常用的参数估计方法:点估计法和区间估计法点估计法和区间估计法.随机抽样随机抽样统计学-ch7 suyl4点估计概念点估计概念求点估计量的两种方法求点估计量的两种方法统计学-ch7 suyl5,其中,其中7.1.1 点估计概念点估计概念随机抽查随机抽查5050天的销售金额(单位:万元):天的销售金额(单位:万元):30,27,26,38,35,22,41 呢呢?据此据此,我们应如何估计我们应如何估计和和而全部信息就由这而全部信息就由这50个数组成个数组成.例例 某商场每日销售金额某商场每日销售金额X X2(,)N u 2,u 未
3、知未知7.1 点估计点估计统计学-ch7 suyl6设总体设总体X的分布的函数的形式为已知的分布的函数的形式为已知(如正态分布、泊松如正态分布、泊松分布等分布等),但它的一个或多个参数未知,借助总体,但它的一个或多个参数未知,借助总体X的一的一个样本来估计总体未知参数的值的问题,称为参数的个样本来估计总体未知参数的值的问题,称为参数的点估计点估计问题。问题。统计学-ch7 suyl7如何寻找样本统计量?如何寻找样本统计量?有很多方法都可以用来构造样本统有很多方法都可以用来构造样本统计量,比如矩估计法、极大似然估计法、计量,比如矩估计法、极大似然估计法、最小二乘估计法、顺序统计量法最小二乘估计法
4、、顺序统计量法 这里,我们主要介绍矩估计法和极这里,我们主要介绍矩估计法和极大似然估计法。大似然估计法。统计学-ch7 suyl87.1.2 矩估计法矩估计法统计学中,矩是指以期望值为基础而定义的数字特征,如数学期望、方差、协方差等。矩估计法是英国统计学家K.皮尔逊最早提出来的,其理论基础是大数定理。统计学-ch7 suyl9矩估计法的基本思想就是:矩估计法的基本思想就是:样本均值样本均值1niiXXn 是一阶样本矩是一阶样本矩,总体均值总体均值E(X)是一阶是一阶 总体矩。总体矩。把样本矩作为相应的总体矩的估计量把样本矩作为相应的总体矩的估计量就是把一阶就是把一阶样本矩样本矩 作为一阶作为一
5、阶总体矩总体矩的估计量的估计量.X作为作为E(X)E(X)的估计量的做法的估计量的做法,将将推广这种做法推广这种做法,把把二阶样本矩二阶样本矩作为二阶作为二阶总体矩总体矩的估计量的估计量,把三阶样本矩作为三阶总体矩的估计量把三阶样本矩作为三阶总体矩的估计量,.,.这种方法就是这种方法就是矩估计法矩估计法.统计学-ch7 suyl10矩估计法的一般步骤如下:l设总体的分布中包含 个未知参数,则其分布函数可以表示为 。若总体 X 的 阶原点矩 l存在,l且为的函数,记为 。l分别用样本的k阶原点矩 去估计总体的K阶原点矩,即l l 12,k k k kk12(;,.,)kF x k k kk()k
6、kE X12,kk nXniki/11211,.,1,2,nkkkiiXikn 统计学-ch7 suyl11 l上式确定了包含个未知参数的个方程式,即有下列方程组l l l l解联立方程组,就可得到未知参数 的矩估计量l它是样本的函数。将样本观测值 代入矩估计量,即得到 的矩估计值 。111()(6.2)1()niinkkiiE XXnE XXni12,.,iinXXX 12,.,nx xxi12,.,iinx xx 统计学-ch7 suyl12例例1 1 设总体设总体X X的均值的均值 及方差及方差 2 均存在均存在 ,且且 2 0,0,但但 均为未知均为未知.又设又设 是一个样本是一个样本
7、,试求试求 2、的估计量的估计量.、12,.,nXXX2 解解 总体的一阶矩及二阶矩分别为总体的一阶矩及二阶矩分别为1(),E X22()E X 222()()D XE X 样本的一阶矩和二阶矩分别为样本的一阶矩和二阶矩分别为111,niiAXXn 2211niiAXn 令令1122AA 即即X 22211niiXn 统计学-ch7 suyl13解得解得,X 22211niiXn 2211niiXnXn 211niiXXn 2211niiXXn 2.nS 统计学-ch7 suyl14例例2 2 设总体设总体X X服从二点分布服从二点分布X X 0 1 0 1P P 1-1-P PP P其中其中
8、00P10,有 则称 是参数的一致估计量。一致估计量是大样本所呈现的性质。若某个估计量是待估参数的一致估计量,意味着样本容量很大时,估计量和待估参数接近的可能性几乎等于100%。lim|1nP 统计学-ch7 suyl51无偏估计量直接比较方差大小统计学-ch7 suyl52nXXX,217.2.1 区间估计的概念设是来自总体的一个样本,是总体未知参数。对给定的,如能确定两个统计量 和 ,满足)10(121P则称为置信度或置信概率,是的置信度的置信区间,称为显著性水平。置信度可以用频率来说明。如果是置信度 0.95 置信区间,当从总体中多次取样本容量为 n 的样本时,则每次可得到一个置信区间,
9、这些置信区间有的包含,而有的则不包含,但平均来说,包含的置信区间的频率应在 0.95 附近波动。),(21111),(21127.2 区间估计统计学-ch7 suyl53评价区间估计的两个标准:估计的可靠度。置信度1-反映了区间估计的可信度。置信水平 =0.95,说明估计区间 以95%的概率包含总体的参数。或者说,100个这样的估计区间中,平均有95个包含了总体参数;估计的精确度。区间的长度 反映了区间估计的精确度。当区间的长度愈大,估计区间包含真值的可能性也就愈大,但是估计也愈不精确。可靠度和精确度是相互矛盾的。112(),21()-统计学-ch7 suyl54估计的可靠度。估计的可靠度。置
10、信度 反映了区间估计的可信度。置信水平 =0.95,说明估计区间 以95%的概率包含总体的参数。或者说,100个这样的估计区间中,平均有95个包含了总体参数;121,1统计学-ch7 suyl55统计学-ch7 suyl56 区间的长度:(上限下限)区间的半径:(上限下限)/2 反映了区间估计的精确度。当区间的长度愈大,虽然估计区间包含真值的可能性愈大,但是估计却不精确。估计的精确度估计的精确度统计学-ch7 suyl57 可靠度和精确度是相互矛盾的。当其中之一确定时可靠度和精确度是相互矛盾的。当其中之一确定时,扩大样本容量可以改善另一个。,扩大样本容量可以改善另一个。统计学-ch7 suyl
11、58步骤:首先,构造一个与待估计参数有关的统计量T;其次,找出统计量的分布,在一定的置信水平下,给出临界值;最后,计算总体参数的置信区间。统计学-ch7 suyl59抽样平均误差l估计量的标准差也称为抽样平均误差。样本均值的标准差=均值的抽样平均误差nnXDx2)(在不重复抽样条件下,均值的抽样平均误差的计算公式为:)1()1()(22NnnNnNnXDxNnNnN11不重复抽样修正系数统计学-ch7 suyl60抽样极限误差nZx2/l一定置信水平下抽样误差的可能范围,称为抽样极限误差或允许误差。1-置信水平下,均值的抽样极限误差:l重复抽样条件下l不重复抽样条件下)1(22/NnnZx统计
12、学-ch7 suyl61(1)总体方差2(或总体标准差)。其它条件不变的条件下,总体差异程度大,抽样误差大。(2)样本容量n(Sample size;抽样数目)抽样数目).其它条件不变的条件下,n 愈大,抽样误差愈小影响抽样误差的因素统计学-ch7 suyl62(3)抽样方法。重复抽样的抽样平均误差较大;抽样比例很小时,修正系数接近于,重复抽样与不重复抽样的抽样误差相差很小l对于无限总体,无论采用重复还是不重复抽样,都可用重复抽样的抽样误差公式来度量抽样误差;l对于有限总体,当抽样比例很小时(小于5%),抽样误差常常都可采用重复抽样的公式来计算。影响抽样误差的因素(续)统计学-ch7 suyl
13、63(4)估计的置信度(1-)抽样平均误差不受置信度大小影响在其他条件相同的情况下,抽样估计的置信水平越高,抽样极限误差越大。(5)抽样组织方式。不同抽样组织方式有不同的抽样误差影响抽样误差的因素(续)统计学-ch7 suyl64样本均值的抽样分布样本均值的抽样分布:则:则:)/,(2nNXX02Z2ZZ/2 /2nZ2nZ21.大样本时总体均值的置信区间)1,0(/NnXZ7.2.2 单个总体参数区间估计的方法统计学-ch7 suyl65总体均值的置信区间由此可得,在(由此可得,在(1)置信度下,)置信度下,总体均值总体均值的的置信区间置信区间可表示为:可表示为:或:或:1/|2/2/2/Z
14、nXZPZnXP1/2/2/nZXnZXP)/,/(2/2/nZXnZX)/(2/nZX统计学-ch7 suyl66某专业大学生的体重服从标准差为5.4kg的正态分布。随机抽取36名,测得他们的平均体重为65kg。在95%的置信度下,对总体平均体重进行估计的抽样平均误差和抽样极限误差为多少?并求其置信区间。)kg(764.19.096.1例1)kgnx(9.0364.5【解】【解】:xxZ2抽样平均误差:抽样平均误差:抽样极限误差抽样极限误差:总体平均体重的置信区间总体平均体重的置信区间:(:(65-1.764,65+1.764)统计学-ch7 suyl67总体方差已知时,均值的置信区间的求解
15、步骤(1)假定条件总体服从正态分布,且总体方差(2)已知如果非正态分布,n 30,可以由正态分布来近似(2)枢轴量为正态变量:)1,0(NnXZ(3)在()在(1)置信度下,)置信度下,抽样极限误差抽样极限误差为:为:(4)在()在(1)置信度下,)置信度下,总体均值总体均值 的的置信区间置信区间为:为:xZ2/)(2/nZXnZx2/)(xX即统计学-ch7 suyl68 因此,给定置信度因此,给定置信度(1-),根据根据 t 分布表可得临界值分布表可得临界值 t/2。于是有:于是有:)1(/ntnSXt枢轴量为枢轴量为 t 统计量:统计量:2.小样本时总体均值的区间估计02t2tt/2Xn
16、St/2nSt/2nStx2/统计学-ch7 suyl69)(xX2.总体方差 未知时,均值的置信区间(1)假定条件总体服从正态分布总体方差(2)未知(2)枢轴量为t 分布变量:(3)总体均值)总体均值 在(在(1)置信度下的)置信度下的 抽样极限误差抽样极限误差 和和 置信区间置信区间 为:为:nStx2/(4)大样本条件下,也可由正态分布近似。)大样本条件下,也可由正态分布近似。)1(ntnSXt)(2/nStX即统计学-ch7 suyl70假定某商场某袋装食品总量呈正态分布,现随机抽取10袋,测得重量分别为789、780、794、762、802、813、770、785、810、806(克
17、),要求以95的置信度,估计这批食品平均每袋重量的区间范围。解:解:已知 n=10,1-=0.95,查表得:t/2(n-1)=t0.025(9)2.2622。由样本数据算得:样本均值=791.1,s=17.1361 12 2.2 26 61 10 01 17 7.1 13 36 62 2.2 26 62 22 2n nS St t 2 2 x x),(xxxx=(791.1-12.26,791.1+12.26)即(即(778.84,803.36)克。)克。例2统计学-ch7 suyl71某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量
18、为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计总体人均产量以及总产量的置信区间。例【解】已知【解】已知 N=1000,n=100,1-=0.9545,5.4,35SX22/z统计学-ch7 suyl72xxZ2/350.86 350.86 0.86例解(P.119/126)【解】已知【解】已知 N=1000,n=100,1-=0.9545,5.4,35SX22/z43.0)10001001(1005.4)1(22Nnnx总体人均产量的置信区间:总体人均产量的置信区间:总产量的置信区间:总产量的置信区间:100034.14N 100035.86统计学-ch7 suyl731.
19、1.总体方差已知时总体方差已知时:22(,)xzxznn*22(1)(1)SSxtntnnn,x 2.2.总体方差未知时总体方差未知时:总体均值的置信区间可表示为:总体均值的置信区间可表示为:xxxx小结:统计学-ch7 suyl743.总体成数(比率)的置信区间1.假定条件成数成数P是是XB(1,P)的均值的均值E(X);D(X)=P(1-P);大样本大样本n 大于大于30且且 np 和和n(1-p)都大于都大于5条件下,样本条件下,样本成数的分布可以由正态分布来近似:成数的分布可以由正态分布来近似:2.枢轴量为正态枢轴量为正态分布分布变量:变量:)1(,(nPPPNp)1,0(/)1(Nn
20、PPPpZ),(ppppnppZp)1(23.总体成数总体成数 的置信区间为:的置信区间为:统计学-ch7 suyl75估计成数时的抽样平均误差成数的抽样平均误差成数的抽样平均误差=样本成数的标准差样本成数的标准差nPPnXDnXDpDnii)1()()/()(1npp)1(nPPp)1(在不重复抽样条件下,成数的抽样平均误差为:在不重复抽样条件下,成数的抽样平均误差为:)1()1()1()1(NnnPPNnNnPPp在重复抽样在重复抽样条件下条件下统计学-ch7 suyl76估计成数时的抽样极限误差当样本量当样本量n充分大时,充分大时,成数的抽样极限误差成数的抽样极限误差为:为:(重复抽样)
21、(重复抽样)),(ppppnppZZpp)1(22/总体成数总体成数 的置信区间为:的置信区间为:(不重复抽样)(不重复抽样))1()1(22/NnnppZZpp影响因素同前统计学-ch7 suyl77 某企业对职工进行调查。随机抽查了某企业对职工进行调查。随机抽查了200人。其中有人。其中有140人平均每天看电视一小时以上。试对每天看电视人平均每天看电视一小时以上。试对每天看电视一小时以上职工的比例进行区间估计(置信度一小时以上职工的比例进行区间估计(置信度95%)解:解:已知已知 n=200,p0.7,n p=1405,n(1-p)=605,1-=0.95,/2=1.96064.0200)
22、7.01(7.096.1)1(2nppZp以以95的置信度可推断该企业的置信度可推断该企业每天看电视一小时以上每天看电视一小时以上的职工比例在的职工比例在63.6%76.4%之间。之间。),(pppp(0.7-0.064,0.7+0.064)(0.636,0.764)例统计学-ch7 suyl78例随机从60000桶罐头中抽取300桶调查,发现有6桶不合格。以95.45%的概率估计全部罐头的不合格率和不合格桶数。解:解:已知已知 n=300,p0.02,n p=6 5,n(1-p)=2945,1-=0.9545,/2=2不合格率不合格率的置信区间的置信区间为:(2-1.616,2%+1.616
23、%)不合格品总数不合格品总数的区间的区间为:(0.38460000,3.61660000)(230.4,2169.6)(单位:桶)01616.0300)02.01(02.02)1(2nppZp统计学-ch7 suyl794.正态总体方差的区间估计设总体服从正态分布,则与样本方差设总体服从正态分布,则与样本方差S2和待和待估计的总体方差估计的总体方差2 有关的枢轴量及其分有关的枢轴量及其分布为:布为:)1()1(222222nSnnSn统计学-ch7 suyl80正态总体方差的区间估计(续)置信度与卡方分布的分位数置信度与卡方分布的分位数 2 222/222/1/2)1()1(2222nSn1)
24、1()1(12222221nSnnP)(1 1-)由于 对于给定的置信度对于给定的置信度(1-),有临界值有临界值 和和 满足:满足:)1(221n)1(22n统计学-ch7 suyl81总体方差总体方差2 的置信区间:的置信区间:)()(,11)1()1(2212222nSnnSn或:或:正态总体方差的区间估计(续)(,1)1(2212222nnSnnSnn)1()1(12222221nSnn)(由得:统计学-ch7 suyl82 例,随机从某车间加工的同类零件中,随机从某车间加工的同类零件中抽取抽取16件,测得其的平均长度为件,测得其的平均长度为12.8厘厘米,方差为米,方差为0.0023
25、。假定零件的长度服。假定零件的长度服从正态分布,求方差及标准差的置信区从正态分布,求方差及标准差的置信区间(置信度为间(置信度为95)。)。统计学-ch7 suyl83 已知已知16,0.0023,1-0.95,查,查 分布表得分布表得:2s220.97512(1)(15)6.262n220.0252(1)(15)27.488n2 代入数据,可得所求方差的置信区间为代入数据,可得所求方差的置信区间为 (0.0013,0.0059)标准差的置信区间(标准差的置信区间(0.036,0.077)解:解:统计学-ch7 suyl84大样本条件下,样本标准差大样本条件下,样本标准差S S的分布趋近于正的
展开阅读全文