概率论与数理统计浙大四版-第七章-第七章3讲课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《概率论与数理统计浙大四版-第七章-第七章3讲课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 浙大 第七 讲课
- 资源描述:
-
1、第四节 区间估计区间估计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.也就是说,我们希望确定一个区间,使我也就是说,我们希望确定一个区间,使我们能以比较高的们能以比较高的可靠程度可靠程度相信它包含真参相信它包含真参数值数值.湖中鱼数的真值湖中鱼数的真
2、值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的,是用概率来度量的,称为置信概率,置信度或置信水平称为置信概率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作 1 ,这里,这里 是一个是一个很小的正数很小的正数.置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等.1 121P根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我,21 小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能置信区间置信区间.称区间称区间 为为 的的,21 1置信水平为置信水
3、平为 的的 寻找置信区间的方法寻找置信区间的方法,一般是从确定一般是从确定误差限误差限入手入手.1|P使得使得称称 为为 与与 之间的误差限之间的误差限.我们选取未知参数的某个估计量我们选取未知参数的某个估计量 ,根,根据置信水平据置信水平 ,可以找到一个正数,可以找到一个正数 ,1 只要知道只要知道 的概率分布,确定误差限并不难的概率分布,确定误差限并不难.下面我们就来正式给出置信区间的定义下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法并通过例子说明求置信区间的方法.由不等式由不等式|可以解出可以解出 :这个不等式就是我们所求的置信区间这个不等式就是我们所求的置信区间.一
4、、一、置信区间定义:置信区间定义:121P),(2111nXXX ),(2122nXXX )(21 满足满足设设 是是 一个待估参数,给定一个待估参数,给定,0 若由样本若由样本X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的的置信水平置信水平(置信度、(置信度、置信概率)为置信概率)为 的置信区间的置信区间.,21 121 和分别称为置信下限和置信上限分别称为置信下限和置信上限.一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间,21 内内.这里有两个要求这里有两个要求:可见,可见,11 对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个
5、只依赖于样本的界限两个只依赖于样本的界限(构造统计量构造统计量)22 )(21 (X1,Xn)(X1,Xn)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间12 长度长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.,21 1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 21 P内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.,1,区间估计精度降低区间估计精
6、度降低可信程度增大可信程度增大间长度增大间长度增大置信区置信区增大增大置信水平置信水平固定固定样本容量样本容量 n.,1区间估计精度提高区间估计精度提高可信程度不变可信程度不变间长度减小间长度减小置信区置信区增大增大样本容量样本容量固定固定置信水平置信水平n 关于定义的说明关于定义的说明.),(,是随机的是随机的而区间而区间没有随机性没有随机性但它是一个常数但它是一个常数虽然未知虽然未知被估计的参数被估计的参数 :1),(),(2121的本质是的本质是因此定义中下表达式因此定义中下表达式 nnXXXXXXP).,(1 ,1 ),(的概率落入随机区间的概率落入随机区间以以而不能说参数而不能说参数
7、的真值的真值的概率包含着参数的概率包含着参数以以随机区间随机区间 :1),(),(2121还可以描述为还可以描述为另外定义中的表达式另外定义中的表达式 nnXXXXXXP若反复抽样多次若反复抽样多次(各次得到的样本容量相等各次得到的样本容量相等,都是都是n),(间间每个样本值确定一个区每个样本值确定一个区按按伯努利大数定理伯努利大数定理,在这样多的区间中在这样多的区间中,.%100,)%1(100 不不包包含含的的约约占占真真值值的的约约占占包包含含,的的真真值值的的真真值值或或不不包包含含每每个个这这样样的的区区间间或或包包含含 例如例如 ,1000 0.01,次次反复抽样反复抽样若若 .1
8、0 1000 个个真值的约为真值的约为个区间中不包含个区间中不包含则得到的则得到的 N(0,1)选选 的点估计为的点估计为X求参数求参数 的置信度为的置信度为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,,2已知),(2 N 1nXU 取二、置信区间的求法二、置信区间的求法明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参数的寻找未知参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出
9、U取值于任意区间的概率取值于任意区间的概率.,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u对于给定的置信水平对于给定的置信水平(大概率大概率),根据根据U的分布,的分布,确定一个区间确定一个区间,使得使得U取值于该区间的概率为取值于该区间的概率为置信水平置信水平.1|2unXP使使为什么为什么这样取这样取?,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u 122unXunXP 1|2unXP使使从中解得从中解得,22 unXunX也可简记为也可简记为2 unX 122unXunXP于是所求于是所求 的的 置信区间为置信区间为 从例从例1解题
10、的过程,我们归纳出求置解题的过程,我们归纳出求置信区间的一般步骤如下信区间的一般步骤如下:1.明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?12.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)称称S(T,)为为枢轴量枢轴量.3.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 S(T,),且其分布为已知且其分布为已知.4.对于给定的置信水平对于给定的置信水平 ,根据,根据S(T,)的分布,确定常数的分布,确定常数a,b,使得使得 1 1 P(a S(T,)b)=5.对对“aS(T,)b”作等价变形作
11、等价变形,得到如下得到如下形式形式:121P,21 1 则则 就是就是 的的100()的置信区间的置信区间.可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 和估计量和估计量T 的函数的函数S(T,),且且S(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何未知参数参数 (这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要.这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态
12、正态的情形的情形.若样本容量很大,即使总体分布若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间似分布,于是也可以近似求得参数的区间估计估计.教材上讨论了以下几种情形:教材上讨论了以下几种情形:单个正态总体均值单个正态总体均值 和方差和方差 的区间估计的区间估计.2 两个正态总体均值差两个正态总体均值差 和方差比和方差比 的区间估计的区间估计.21 2221 比例比例 p 的区间估计的区间估计.教材教材180页已经给出了概率分布的上侧分位数页已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们
13、(分位点)的定义,为便于应用,这里我们再简要介绍一下再简要介绍一下.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.设设0 1,对随机变量对随机变量X,称满足称满足 )(xXP的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.x 例如例如:645.105.0u96.1025.0u 设设0 1,对随机变量对随机变量X,称满足称满足 )(xXP 的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.x 标准正态分布的标准正态分布的上上 分位数分位数 u 例如例如:348.9)3(2025.0 216.0)3(2975.0 设设0 1,对随机变量对随机变量X,称满足称满
14、足 )(xXP 的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.x 分布的上分布的上 分位数分位数)(2n 2 自由度为自由度为n的的 设设0 1,对随机变量对随机变量X,称满足称满足 )(xXP 的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.x F分布的上分布的上 分分位数位数),(21nnF 自由度为自由度为n1,n2的的 书末附有书末附有 分布、分布、t 分布、分布、F分布的上侧分布的上侧分位数表,供使用分位数表,供使用.需要注意的事项在教需要注意的事项在教材上有说明材上有说明.2 至于如何由标准正态分布函数表查表至于如何由标准正态分布函数表查表求得分位数,若你
15、对分布函数定义熟悉的求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决话,这个问题不难解决.,),(,12221本方差本方差分别是样本均值和样分别是样本均值和样的样本的样本总体总体为为并设并设设给定置信水平为设给定置信水平为SXNXXXn 一、单个总体 的情况 ,)1(2为已知为已知 由例由例1可知可知:1 的置信区间的置信区间的一个置信水平为的一个置信水平为 .2/znX 的置信区间的置信区间均值均值 1.包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称得质量称得质量(单单位位:克克)分别为分别为506,500,495,488,504,486,505,506,500,495,4
16、88,504,486,505,513,521,520,512,485.513,521,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解,12,10 n,92.502 x计算得计算得,10.0)1(时时当当 05.02/zz 查表得查表得0.05).0.10(1 10,和和分别取分别取置信区间置信区间的的试求糖包的平均质量试求糖包的平均质量且标准差为且标准差为.新建文件夹新建文件夹42-1.ppt42-1.ppt2-12-1,95.021 ,645.1例例2 2/znx645.1121092.502 ,67.507 2/znx645.1121092.502 ,17.498
17、90%的置信区间为的置信区间为的置信度为的置信度为即即).67.507,17.498(,05.0)2(时时当当 ,975.021 025.02/zz 95%的置信区间为的置信区间为的置信度为的置信度为同理可得同理可得).58.508,26.497(.,1 ;,1,置信区间也较小置信区间也较小较小时较小时当置信度当置信度置信区间也较大置信区间也较大较大时较大时当置信度当置信度从此例可以看出从此例可以看出 附表附表2-22-2,96.1查表得查表得 ,)2(2为未知为未知 ,2/直接使用此区间直接使用此区间不能不能中含有未知参数中含有未知参数由于区间由于区间 znX ,222 替换替换可用可用的无
18、偏估计的无偏估计是是但因为但因为SSS 1 的置信区间的置信区间的置信度为的置信度为 .)1(2/ntnSX 推导过程如下推导过程如下:,1)1()1(2/2/ntnSXntnSXP即即 1 的置信区间的置信区间的置信度为的置信度为于是得于是得 .)1(2/ntnSX ),1(/ntnSX 又根据第六章定理三知又根据第六章定理三知 ,1)1(/)1(2/2/ntnSXntP则则解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得重称得重量量(克克)如下如下:496509502506496493505514512497510504503499508506设袋装糖果的重量服从
19、正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值,151 0.05,n :)1(分布表可知分布表可知查查 nt)15(025.0t,2022.6,75.503 sx计算得计算得 .0.95 的置信区间的置信区间的置信度为的置信度为 附表附表3-13-1,1315.2例例3 5%9 的置信区间的置信区间的置信度为的置信度为得得 1315.2162022.675.503).1.507,4.500(即即就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为95%.).(61.621315.21620
20、22.6 克克其误差不大于其误差不大于 ,的近似值的近似值为为若依此区间内任一值作若依此区间内任一值作 这个误差的可信度为这个误差的可信度为95%.推导过程如下推导过程如下:,22的无偏估计的无偏估计是是因为因为 S),1()1(222 nSn 根据第六章第二节定理二知根据第六章第二节定理二知 1 2的置信区间的置信区间的置信度为的置信度为方差方差 .)1()1(,)1()1(22/1222/2 nSnnSn .,未知的情况未知的情况只介绍只介绍根据实际需要根据实际需要 .22的置信区间方差 1 2的置信区间的置信区间的置信度为的置信度为于是得方差于是得方差 ,1)1()1()1(22/222
21、2/1 nSnnP则则 ,1)1()1()1()1(22/12222/2 nSnnSnP即即 .)1()1(,)1()1(22/1222/2 nSnnSn 1 的置信区间的置信区间的一个置信度为的一个置信度为标准差标准差 .)1(1,)1(122/122/nSnnSn 进一步可得进一步可得:注意注意:在密度函数不对称时在密度函数不对称时,2分布分布分布和分布和如如F 习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解,151 0.975,21
22、0.025,2 n :)1(2分布表可知分布表可知查查 n )15(2025.0,2022.6 s计算得计算得)15(2975.0 代入公式得标准差的置信区间代入公式得标准差的置信区间).60.9,58.4(附表附表4-14-1,488.27,262.6附表附表4-24-2例例4休息片刻继续休息片刻继续例例5 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X),(2 N,2未知 随机抽查随机抽查100个婴儿个婴儿得得100个体重数据个体重数据X1,X2,X100 的区间估计的区间估计2 求求和和(置信水平为(置信水平为1-).解:这是单总体均值和方差的估计解:这是单总体均值和方差的估计未知2
23、2,),(NX已知已知 先求均值先求均值 的区间估计的区间估计.)1(ntnSXt 因方差未知,取因方差未知,取 对给定的置信度对给定的置信度 ,确定分位数确定分位数 1),1(2nt使使1)1(|2nttP1)1(|2ntnSXP即即)1(),1(22ntnSXntnSX均值均值 的置信水平为的置信水平为 的区间估计的区间估计.即为即为 1从中解得从中解得1)1()1(22ntnSXntnSXP)1()1(222nSn 取枢轴量取枢轴量 1)1()1()1(2222221nSnnP从中解得从中解得 1)1()1()1()1(22122222nSnnSnP2 再求方差再求方差 的置信水平为的置
展开阅读全文