书签 分享 收藏 举报 版权申诉 / 96
上传文档赚钱

类型参数估计基础-ppt课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2749362
  • 上传时间:2022-05-23
  • 格式:PPT
  • 页数:96
  • 大小:2.53MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《参数估计基础-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    参数估计 基础 ppt 课件
    资源描述:

    1、参数估计基础2022-5-232了解总体特征的最好方法是对总体的每一个体进行观察、了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。试验,但这在医学研究实际中往往不可行。对对无限总体无限总体不可能对所有个体逐一观察不可能对所有个体逐一观察. . 对对有限总体有限总体限于人力、财力、物力、时间或个体过多等原限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究因,不可能也没必要对所有个体逐一研究( (如对一批罐头质如对一批罐头质量检查量检查) )。借助借助抽样研究抽样研究。 2022-5-232022-5-233抽样研究的目的是用样本信

    2、息推断总体特征,即用样本资料计算的统计指标推断总体参数常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验 2022-5-232022-5-234内容复习参数估计参数估计假设检验假设检验研究总体研究总体统计描述统计描述样本样本统计推断统计推断随机抽样统计表统计表统计图统计图统计指标统计指标2022-5-232022-5-235第六章总体均数估计抽样误差与标准误分布总体均数及总体概率的估计案例讨论2022-5-232022-5-236教学目的与要求 掌握:均数和率抽样误差的概念;均数和率标准误的掌握:均数和率抽样误差的概念;均数和率标准误的意义和计算;总体均数和总体率区间估计的意义

    3、、计意义和计算;总体均数和总体率区间估计的意义、计算及其适用条件。算及其适用条件。熟悉:总体均数的点估计;熟悉:总体均数的点估计;t 0.05,()的概念,标准误和的概念,标准误和标准差的区别;置信区间与医学参考值范围的区别。标准差的区别;置信区间与医学参考值范围的区别。了解:了解:t值、值、t分布、分布、t值表及其应用。值表及其应用。2022-5-232022-5-237复习一些概念参数(parameter)与统计量(statistics) 参数获取的途径 对总体进行研究对总体进行研究 抽样研究抽样研究抽样误差(sampling error)1.抽样误差的概念:由个体变异产生的,随机抽样引起

    4、的样本统计量与总体参数间的差异。(抽样误差=总体参数样本统计量)2.抽样误差产生的原因:3.抽样误差的特点:随机,不可避免,有规律可循。4.在大量重复抽样的情况下,可以展示其规律性2022-5-232022-5-238第一节抽样误差与标准误2022-5-23一、抽样试验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随机抽取样本)中,每次随机抽取样本含量含量n n5 5,并计算其均数与标准差;重复抽取,并计算其均数与标准差;重复抽取10001000次,获得次,获得10100000份样本;计算份样本;计算10001000份样本的均数与标准差,并对份样本的

    5、均数与标准差,并对10001000份样本份样本的均数作直方图。的均数作直方图。 按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实的抽样实验;比较计算结果。验;比较计算结果。2022-5-23抽样试验(n=5)2022-5-23抽样试验(n=10)2022-5-23抽样试验(n=30)2022-5-231000份样本抽样计算结果总体的均总体的均数数总体标准总体标准差差s s均数的均均数的均数数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.2212n n=10=105.005.000.500.5

    6、05.005.000.15800.1580n n=30=305.005.000.500.505.005.000.09200.09202022-5-232022-5-2314一、均数的抽样误差 样本均数的抽样分布 举例举例1x总体总体样本样本1样本样本2样本样本3样本样本2x3xnx2022-5-232022-5-2315一、均数的抽样误差样本均数的抽样分布 抽样模拟实验抽样模拟实验 假定总体:某年某地假定总体:某年某地13岁女学生身高值岁女学生身高值 XN(155.4,5.3) 随机抽样:随机抽样:n30,K1002022-5-232022-5-2316一、均数的抽样误差=155.4=5.31

    7、13 0,1 5 2 .3nX223 0,1 5 5 .2nX1 0 01 0 03 0,1 5 4 .8nX 实验实验6-1从已知的从已知的13岁女生身高总体中随机抽样示意图岁女生身高总体中随机抽样示意图2022-5-232022-5-2317样本号均数样本号均数1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.

    8、7100156.62022-5-232022-5-2318一、均数的抽样误差表6-2 6-2 从总体N N(155.4155.4,5.35.32 2)抽样得到100100个样本均数的频数分布组段(cm)(cm)频数频率(%)(%)152.611.0153.244.0153.844.0154.42222.0155.02525.0155.62121.0156.21717.0156.833.0157.422.0 158.0158.611.0合计100100.02022-5-232022-5-2319 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均

    9、数构成一新分布新分布,绘制直方图。,绘制直方图。图图6-2 从正态分布总体从正态分布总体N(155.4,5.3)随机抽样所得样本均数分布随机抽样所得样本均数分布2022-5-232022-5-2320一、均数的抽样误差1、样本均数的抽样分布特点|各样本均数未必等于总体均数;各样本均数未必等于总体均数;|样本均数之间存在差异;样本均数之间存在差异;|样本均数的分布规律:围绕着总体均数样本均数的分布规律:围绕着总体均数155.4cm155.4cm,中间多,中间多,两边少,左右基本对称,服从正态分布;两边少,左右基本对称,服从正态分布;|样本均数的变异较原变量的变异减小。样本均数的变异较原变量的变异

    10、减小。2022-5-232022-5-2321一、均数的抽样误差抽样误差 概念:由于抽样造成的样本统计量与统计量以及样本统计概念:由于抽样造成的样本统计量与统计量以及样本统计量与总体参数之间的差异叫作量与总体参数之间的差异叫作抽样误差抽样误差。 抽样误差产生的基本条件抽样误差产生的基本条件 抽样研究抽样研究 个体差异个体差异 表现形式表现形式 样本统计量与样本统计量之间的差异样本统计量与样本统计量之间的差异 样本统计量与总体参数之间的差异样本统计量与总体参数之间的差异2022-5-232022-5-2322一、均数的抽样误差2、均数的抽样误差(1 1)概念:由个体变异产生的,随机抽样引起的样本

    11、均数与)概念:由个体变异产生的,随机抽样引起的样本均数与总体均数间的差异。总体均数间的差异。(均数的抽样误差(均数的抽样误差= =总体均数样本均数)总体均数样本均数)(2 2)表现形式:)表现形式:样本均数与总体均数间存在差异样本均数与总体均数间存在差异样本均数与样本均数间存在差异样本均数与样本均数间存在差异2022-5-23 m mXm6X5X4X3X2X1X.X2022-5-2324 均数的抽样误差可表现为均数的抽样误差可表现为样本均数与总体均数的差值样本均数与总体均数的差值 均数的抽样误差也可表现为多个样本均数间的离散程度均数的抽样误差也可表现为多个样本均数间的离散程度 在实际科研中,上

    12、述二者都难以得到。2022-5-232022-5-2325 如何度量抽样误差的大小? 如何揭示抽样分布的规律? 中心极限定理为我们提供解决办法:2022-5-232022-5-2326 中心极限定理(central limit theorem) 从均数为从均数为m m、标准差为标准差为s s的总体中独立随机抽样,当样的总体中独立随机抽样,当样本含量本含量n n增加时,样本均数的分布将趋于正态分布,增加时,样本均数的分布将趋于正态分布,此分布的均数为此分布的均数为m m,标准差为,标准差为 。 Xs(,)m sx(,)Xm s2022-5-232022-5-2327标准误(standard er

    13、ror,SE) 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异样本均数的标准差称为标准误。此标准误与个体变异s s 成正比,与样本成正比,与样本含量含量n n的平方根成反比。的平方根成反比。2022-5-232022-5-23283、均数的标准误 (standard error)(1)(1)概念:将样本均数的标准差称为均数的标准误, , 它是描述均数抽样误差大小的指标(2)(2)计算: 实际工作中,s s 往往是未知的,一般可用样本标准差s s代替s s :一、均数的抽样误差XnssX

    14、SSn2022-5-232022-5-23293、均数的标准误 (standard error)(3)(3)统计学意义均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之,亦然。(4)(4)影响抽样误差大小的因素标准差样本含量n n 实际工作中,可通过适当增加样本含量来减少均数的标准误,从而降低抽样误差。2022-5-233个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775

    15、.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn2022-5-232022-5-23314、总体分布非正态分布时,样本均数的分布规律中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋

    16、于正态分布. .样本均数的总体均数仍等于;样本均数的标准误仍满足均数标准误的计算式;当较小时,样本均数的分布是偏态的;当足够大(50)样本均数的分布近似正态分布一、均数的抽样误差2022-5-232022-5-2332 非正态总体样本均数的抽样实验 图6-1(a)是一个正偏峰的分布, 用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 2022-5-230.002.505.007.5010.0012.5005001,0001,5002,0002,500FrequencyMean = 0.9922Std. Dev. = 1.01146N = 10

    17、,0000.001.002.003.004.00n=50100200300400500600FrequencyMean = 0.9993Std. Dev. = 0.44341N = 10,0000.000.501.001.502.002.503.00n=100100200300400500600700FrequencyMean = 0.9988Std. Dev. = 0.31365N = 10,0000.501.001.502.00n=300100200300400500600FrequencyMean = 0.9997Std. Dev. = 0.18276N = 10,0000.500.75

    18、1.001.251.501.75n=500100200300400500600700FrequencyMean = 0.999Std. Dev. = 0.14125N = 10,0002022-5-2338 影响抽样误差大小的因素有:影响抽样误差大小的因素有: 样本标准差。样本标准差。S越大,越大, 也就越大。也就越大。 样本含量。样本含量。n 越大,抽样误差越小越大,抽样误差越小。 因此如在一定标准差条件下,加大样本含量,可减少抽样误差,因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。以保证的样本均数的代表性和可靠性。 Xs2022-5-232022

    19、-5-2339 例6-1 20006-1 2000年某研究者随机调查某地健康成年男子2727人,得到血红蛋白量的均数为125 g /L125 g /L,标准差为15 g /L15 g /L。试估计该样本均数的抽样误差。 = = =Xs/ sn15/ 27 2.89g /L2022-5-232022-5-2340样本频率的抽样分布与抽样误差 2022-5-232022-5-2341黑球比例%样本频数样本频率(%) 5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.0

    20、31.0 5 5.034.0 3 3.040.0 2 2.0合计100 100.0 表表6-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni = 35)2022-5-232022-5-2342抽样分布与抽样误差2022-5-232022-5-2343样本频率样本频率 的总体均数参数为的总体均数参数为, 率的标准误计算公式率的标准误计算公式公式公式nXp 1pnsnppnppSp)1 (1)1 (2022-5-232022-5-2344例6-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。 p

    21、= 41.5% = 0.415,n = 776(1)pppns0.415 0.585.77%7760.01771=2022-5-232022-5-2345思考题:什么是抽样误差?决定抽样误差大小的因素有哪些?抽样误差能避免么?抽样误差有规律么?标准误和标准差有何区别与联系?2022-5-232022-5-2346标准误和标准差有何区别与联系2022-5-232022-5-2347第二节分布分布的概念分布的特征界值表2022-5-232022-5-2348一、分布的概念XZms随机变量随机变量X XN N(m m,s s2 2)标准正态分布N(0,1)变换1,nvSXnSXtXmmt t分布(分

    22、布(=n n-1-1)标准正态分布标准正态分布N N(0 0,1 1)XZnms2( ,)XXNm s样本均数2022-5-232022-5-2349t分布 设从正态分布N(m m,s s2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。 nsXsXtXmmX2022-5-232022-5-2350二、值与分布学习t 分布的意义 事实上,任何一个样本统计量均有其分布的特点和规律。统计量的抽样事实上

    23、,任何一个样本统计量均有其分布的特点和规律。统计量的抽样分布规律是进行统计推断的理论基础。分布规律是进行统计推断的理论基础。 t t 分布是十分有用的,它是总体均数的区间估计和假设检验的理论基础。分布是十分有用的,它是总体均数的区间估计和假设检验的理论基础。 2022-5-232022-5-2352三、分布的特征分布的图形分布的参数:=n n-1-1自由度对图形的影响分布的极限是标准正态分布分布曲线下的尾部面积(概率)界值表2022-5-232022-5-2353t分布=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图6-3 不同自由度下的t分布图2022-

    24、5-232022-5-2354t分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t 分布只有一个特征参数,即为自由度()。 t分布与自由度 有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 2022-5-232022-5-2355 =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3 图6.4 自由度分别为1、5、时的t分布 2022-5-232022-5-2356t 分布曲线下的面积规律同标准正态分布一样,统计应用中最关心的是t 分布曲线下的尾部面积(即概率)与

    25、横轴t 值间的关系。每一自由度下的t分布曲线都有其自身分布规律2022-5-232022-5-2357界值表 (t critical value)统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度 下的t界值表(附表3)(439439页)横标目为自由度(-1) 纵标目为概率(即曲线下尾部阴影部分面积)表中的数字为相应的t t界值( (t0) )单侧概率(one-tailed probability)所对应的t t界值记为, 双侧概率(two-tailed probability)所对应的t t界值记为/2,2022-5-232022-5-23582022-5-232

    26、022-5-23592022-5-232022-5-2360界值表 (t critical value) 不同自由度下的界值表:附表2 2 查t t0.05,160.05,16 =1.746 =1.746(单侧) P P( (t t1.746)=0.051.746)=0.05或P P( (t t-1.746)=0.05-1.746)=0.05 查t t0.05/2,160.05/2,16 =1.746 =1.746(双侧) P P( (t t1.746)1.746)P P( (t t-1.746)=0.05-1.746)=0.05或P P(-1.746(-1.746t t1.746)=0.95

    27、100,故可以用标准正态分布代替t分布,u0.10=1.64 即该地12岁男孩平均身高的90可信区间为:141.77143.57(cm),可认为该地12岁男孩平均身高在141.77143.57(cm)之间。 )(77.1415477. 064. 167.14210. 0cmsuXX)(57.1435477. 064. 167.14210. 0cmsuXX2022-5-232022-5-2375附 表 2 t 界 值 表 概 率 , P 单 侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 自 由 度 双 侧 0.50 0.40

    28、 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173

    29、8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 100 0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390 200 0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340 500 0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310 1000 0.675 0.842 1.282 1.646 1.962 2.330

    30、 2.581 2.813 3.098 3.300 0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905 2022-5-232022-5-2376两总体均数差值的置信区间实际工作中,我们常需要估计两总体均数之差的大小,实际工作中,我们常需要估计两总体均数之差的大小,例如正常成年男、女的血红蛋白平均相差多少?糖尿例如正常成年男、女的血红蛋白平均相差多少?糖尿病患者经某药物治疗后,试验组与对照组的总体血糖病患者经某药物治疗后,试验组与对照组的总体血糖值平均降低多少?冠心病患者和正常人的血清胆固醇值平均降低多少?冠心

    31、病患者和正常人的血清胆固醇值平均相差多少?我们可以用两样本均数之差值平均相差多少?我们可以用两样本均数之差()作为两作为两总体均数之差总体均数之差()的点估计。同理,点估计没有考虑抽样的点估计。同理,点估计没有考虑抽样误差的大小,需估计两总体均数之差的置信区间。误差的大小,需估计两总体均数之差的置信区间。2022-5-232022-5-2377假设正态总体 和 ,当 , 均未知,但 时,则两总体均数之差( )的双侧( )置信区间为: = 211(,)Nm s222(,)Nm s21s22s2212ss21mm11212/2,()XXXXtS2) 1() 1(2121nnnn21XXS)11(1

    32、12nnSc)2() 1() 1(212222112nnSnSnSc当n1、 n2较大时, 可用 来近似计算。21XXS221212SSnn2022-5-232022-5-2378 例例6.5 测定测定28例结核病患者和例结核病患者和34例对照者的脑脊液中镁例对照者的脑脊液中镁(mmol/L)的含量,结果见表的含量,结果见表6.5,试估计结核病人和对照者的脑,试估计结核病人和对照者的脑脊液中镁含量的总体均数之差的脊液中镁含量的总体均数之差的95%置信区间。置信区间。表表6.56.5 两对比组脑脊液中镁含量两对比组脑脊液中镁含量(mmol/L)(mmol/L)组别例数均数标准差结核组281.04

    33、0.17对照组341.280.142022-5-232022-5-2379假定两组方差齐,假定两组方差齐, 查界值表得查界值表得 222(28 1) 0.17(34 1) 0.140.023828342cS122121111()0.0238()0.039372834cXXSSnn1222834260nn0.05/2,602.000t(1.28 1.04)2.0000.1613LC 00 (mmol/L)(1.28 1.04)2.0000.3187UC 00 (mmol/L) 故两总体均数之差的95%置信区间为(0.16, 0.32)mmol/L,可以认为结核病患者脑脊液中的镁含量较对照人群平均

    34、低0.24mmol/L,其95%置信区间为(0.16, 0.32)mmol/L。2022-5-232022-5-2380总体概率的置信区间 根据样本含量n和样本频率p的大小,可以采用查表法和正态近似法计算总体概率的置信区间。1、查表法 当样本含量n较小,比如n 50,特别是p很接近0或100%时,可以通过查相应统计用表(附表7),确定总体概率的置信区间。 2022-5-232022-5-2381例 某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。 解:查概率的置信区间表(附表7),在n = 39的横行,X=2的纵列交叉处的数值为117

    35、 即该手术合并症发生概率的95%置信区间为1% 17% 2022-5-232022-5-2382注意:附表7中仅列出X n/2部分;当X n/2时,应以n X值查表,然后从100中减去查得的数值即为所求的置信区间。2022-5-232022-5-23832、正态近似法 当n足够大,且样本频率p和(1 p)均不太小时,如np与n(1 p) 均大于5时,p的抽样分布接近正态分布,此时总体概率的置信区间 p z /2Sp 2022-5-232022-5-2384例 用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。 解:

    36、本例n比较大,且np = 94及n(1 p) = 26均大于5, p z/2 Sp= p z0.05/2 = 0.783 1.96 = 0.709 0.857 即该仪器乳腺癌总体检出率的95%可信区间置信区间为(70.9% , 85.7% )。 (1)ppn0.783(10.783)1202022-5-232022-5-2385 在某地随机抽取在某地随机抽取329人,作血清登革热血凝抑制抗体反人,作血清登革热血凝抑制抗体反应检验,结果应检验,结果29人阳性,问人阳性,问(1)调查的)调查的329人的抗体阳性率是多少?人的抗体阳性率是多少?(2)抗体阳性率的抽样误差是多少?)抗体阳性率的抽样误差

    37、是多少?(3)试估计该地人群血清登革热血凝抑制抗体阳性率?)试估计该地人群血清登革热血凝抑制抗体阳性率?2022-5-232022-5-2386三、应注意的一些问题置信区间和置信限的关系准确度与精密度的关系2022-5-232022-5-2387正确理解可信区间的涵义可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95的可信度是针对可信区间的构建方法而言的。 以均数的95%可信区间为例,其涵义是:如果重复100次抽样,每100个样本所算得的100个可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。2022-5-232

    38、022-5-2388可信区间和可信限的关系 可信限:分别指两个点值,分别称为下限值和上限值。可信限:分别指两个点值,分别称为下限值和上限值。 可信区间可信区间:是指以上、下可信限为界的一个范围。是指以上、下可信限为界的一个范围。 用公式用公式 表示可信限;表示可信限; 用用 表示可信区间。表示可信区间。,XXts / 2 ,(,)XXXtsXts/2/22022-5-23置信区间的解释 总体均数的95%置信区间:如果从总体中重复抽取如果从总体中重复抽取100份样本含量相同的独立样本,每份样本可分别计算一个置信区间,份样本含量相同的独立样本,每份样本可分别计算一个置信区间,那么在那么在100个置

    39、信区间中,大约有个置信区间中,大约有95个置信区间包括个置信区间包括(估计正确估计正确),只有只有5个置信区间不包括个置信区间不包括(估计错误估计错误)。 或者说或者说对于某一个区间而言,它包含总体均数的可能性为对于某一个区间而言,它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为,而不包含总体均数的可能性仅为5%。因此在实际应用中,。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为以这种方法估计总体均数犯错误的概率仅为5%。 2022-5-232022-5-2390 -2 -1 0 1 2 图图4.1 100个来自个来自N(0,1)的样本所估计的可信区间示意的样本所估计的可

    40、信区间示意 2022-5-232022-5-2391可信区间意义:虽然不能知道某校全体女大学生身高均数的确切数虽然不能知道某校全体女大学生身高均数的确切数值,全体女大学生身高均数在值,全体女大学生身高均数在163.0 - 164.5cm之间的可能之间的可能性是性是95%,在,在 162.7 164.7cm之间的可能性是之间的可能性是99%。 换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0 - 164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错的概率是,说错的概率是5%;做;做出校全体女大学生身高均数为出校全体女大学生身高均数为162.7

    41、164.7cm的结论,说对的结论,说对的概率是的概率是99%,说错的概率是,说错的概率是1%。2022-5-232022-5-2392可信区间的两个要素准确度 反映为可信度反映为可信度1-1- 的大小的大小 ,即区间包含总体均数的概率大,即区间包含总体均数的概率大小,越接近小,越接近1 1越好越好精密度 反映为区间的宽度,区间越窄越好反映为区间的宽度,区间越窄越好 在可信度确定的情况下,增加样本含量可减小可信区间的宽在可信度确定的情况下,增加样本含量可减小可信区间的宽度度2022-5-232022-5-2393 9 5 可 信 区 间 9 9 可 信 区 间 公式 区 间 范 围 窄 宽 估计

    42、错误的概率 大(0.05) 小(0.01)XXStXStX ,2/05. 0,2/05. 0, XXStXStX ,2/01. 0,2/01. 0, 可信区间的两个要素当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。2022-5-232022-5-2394 求参数置信区间保 证准确度先 提 高精 度再处理处理“准确度与精密度准确度与精密度”关系的原则关系的原则在置信度确定的情况下,增加在置信度确定的情况下,增加样本含量样本含量可减小区间宽度。可减小区间宽度。2022-5-232022-5-2395可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%95%是可信度,即所求可信区间包含总体参数的可信程度为95%95% 95%95%的参考值范围中的95%95%是一个比例,即所求参考值范围包含了95%95%的正常人。2022-5-232022-5-2396总体均数置信区间与参考值范围的区别总体均数置信区间与参考值范围的区别2022-5-23

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:参数估计基础-ppt课件.ppt
    链接地址:https://www.163wenku.com/p-2749362.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库