参数估计基础-ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《参数估计基础-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 基础 ppt 课件
- 资源描述:
-
1、参数估计基础2022-5-232了解总体特征的最好方法是对总体的每一个体进行观察、了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。试验,但这在医学研究实际中往往不可行。对对无限总体无限总体不可能对所有个体逐一观察不可能对所有个体逐一观察. . 对对有限总体有限总体限于人力、财力、物力、时间或个体过多等原限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究因,不可能也没必要对所有个体逐一研究( (如对一批罐头质如对一批罐头质量检查量检查) )。借助借助抽样研究抽样研究。 2022-5-232022-5-233抽样研究的目的是用样本信
2、息推断总体特征,即用样本资料计算的统计指标推断总体参数常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验 2022-5-232022-5-234内容复习参数估计参数估计假设检验假设检验研究总体研究总体统计描述统计描述样本样本统计推断统计推断随机抽样统计表统计表统计图统计图统计指标统计指标2022-5-232022-5-235第六章总体均数估计抽样误差与标准误分布总体均数及总体概率的估计案例讨论2022-5-232022-5-236教学目的与要求 掌握:均数和率抽样误差的概念;均数和率标准误的掌握:均数和率抽样误差的概念;均数和率标准误的意义和计算;总体均数和总体率区间估计的意义
3、、计意义和计算;总体均数和总体率区间估计的意义、计算及其适用条件。算及其适用条件。熟悉:总体均数的点估计;熟悉:总体均数的点估计;t 0.05,()的概念,标准误和的概念,标准误和标准差的区别;置信区间与医学参考值范围的区别。标准差的区别;置信区间与医学参考值范围的区别。了解:了解:t值、值、t分布、分布、t值表及其应用。值表及其应用。2022-5-232022-5-237复习一些概念参数(parameter)与统计量(statistics) 参数获取的途径 对总体进行研究对总体进行研究 抽样研究抽样研究抽样误差(sampling error)1.抽样误差的概念:由个体变异产生的,随机抽样引起
4、的样本统计量与总体参数间的差异。(抽样误差=总体参数样本统计量)2.抽样误差产生的原因:3.抽样误差的特点:随机,不可避免,有规律可循。4.在大量重复抽样的情况下,可以展示其规律性2022-5-232022-5-238第一节抽样误差与标准误2022-5-23一、抽样试验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随机抽取样本)中,每次随机抽取样本含量含量n n5 5,并计算其均数与标准差;重复抽取,并计算其均数与标准差;重复抽取10001000次,获得次,获得10100000份样本;计算份样本;计算10001000份样本的均数与标准差,并对份样本的
5、均数与标准差,并对10001000份样本份样本的均数作直方图。的均数作直方图。 按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实的抽样实验;比较计算结果。验;比较计算结果。2022-5-23抽样试验(n=5)2022-5-23抽样试验(n=10)2022-5-23抽样试验(n=30)2022-5-231000份样本抽样计算结果总体的均总体的均数数总体标准总体标准差差s s均数的均均数的均数数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.2212n n=10=105.005.000.500.5
6、05.005.000.15800.1580n n=30=305.005.000.500.505.005.000.09200.09202022-5-232022-5-2314一、均数的抽样误差 样本均数的抽样分布 举例举例1x总体总体样本样本1样本样本2样本样本3样本样本2x3xnx2022-5-232022-5-2315一、均数的抽样误差样本均数的抽样分布 抽样模拟实验抽样模拟实验 假定总体:某年某地假定总体:某年某地13岁女学生身高值岁女学生身高值 XN(155.4,5.3) 随机抽样:随机抽样:n30,K1002022-5-232022-5-2316一、均数的抽样误差=155.4=5.31
7、13 0,1 5 2 .3nX223 0,1 5 5 .2nX1 0 01 0 03 0,1 5 4 .8nX 实验实验6-1从已知的从已知的13岁女生身高总体中随机抽样示意图岁女生身高总体中随机抽样示意图2022-5-232022-5-2317样本号均数样本号均数1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.
8、7100156.62022-5-232022-5-2318一、均数的抽样误差表6-2 6-2 从总体N N(155.4155.4,5.35.32 2)抽样得到100100个样本均数的频数分布组段(cm)(cm)频数频率(%)(%)152.611.0153.244.0153.844.0154.42222.0155.02525.0155.62121.0156.21717.0156.833.0157.422.0 158.0158.611.0合计100100.02022-5-232022-5-2319 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均
9、数构成一新分布新分布,绘制直方图。,绘制直方图。图图6-2 从正态分布总体从正态分布总体N(155.4,5.3)随机抽样所得样本均数分布随机抽样所得样本均数分布2022-5-232022-5-2320一、均数的抽样误差1、样本均数的抽样分布特点|各样本均数未必等于总体均数;各样本均数未必等于总体均数;|样本均数之间存在差异;样本均数之间存在差异;|样本均数的分布规律:围绕着总体均数样本均数的分布规律:围绕着总体均数155.4cm155.4cm,中间多,中间多,两边少,左右基本对称,服从正态分布;两边少,左右基本对称,服从正态分布;|样本均数的变异较原变量的变异减小。样本均数的变异较原变量的变异
10、减小。2022-5-232022-5-2321一、均数的抽样误差抽样误差 概念:由于抽样造成的样本统计量与统计量以及样本统计概念:由于抽样造成的样本统计量与统计量以及样本统计量与总体参数之间的差异叫作量与总体参数之间的差异叫作抽样误差抽样误差。 抽样误差产生的基本条件抽样误差产生的基本条件 抽样研究抽样研究 个体差异个体差异 表现形式表现形式 样本统计量与样本统计量之间的差异样本统计量与样本统计量之间的差异 样本统计量与总体参数之间的差异样本统计量与总体参数之间的差异2022-5-232022-5-2322一、均数的抽样误差2、均数的抽样误差(1 1)概念:由个体变异产生的,随机抽样引起的样本
11、均数与)概念:由个体变异产生的,随机抽样引起的样本均数与总体均数间的差异。总体均数间的差异。(均数的抽样误差(均数的抽样误差= =总体均数样本均数)总体均数样本均数)(2 2)表现形式:)表现形式:样本均数与总体均数间存在差异样本均数与总体均数间存在差异样本均数与样本均数间存在差异样本均数与样本均数间存在差异2022-5-23 m mXm6X5X4X3X2X1X.X2022-5-2324 均数的抽样误差可表现为均数的抽样误差可表现为样本均数与总体均数的差值样本均数与总体均数的差值 均数的抽样误差也可表现为多个样本均数间的离散程度均数的抽样误差也可表现为多个样本均数间的离散程度 在实际科研中,上
12、述二者都难以得到。2022-5-232022-5-2325 如何度量抽样误差的大小? 如何揭示抽样分布的规律? 中心极限定理为我们提供解决办法:2022-5-232022-5-2326 中心极限定理(central limit theorem) 从均数为从均数为m m、标准差为标准差为s s的总体中独立随机抽样,当样的总体中独立随机抽样,当样本含量本含量n n增加时,样本均数的分布将趋于正态分布,增加时,样本均数的分布将趋于正态分布,此分布的均数为此分布的均数为m m,标准差为,标准差为 。 Xs(,)m sx(,)Xm s2022-5-232022-5-2327标准误(standard er
13、ror,SE) 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异样本均数的标准差称为标准误。此标准误与个体变异s s 成正比,与样本成正比,与样本含量含量n n的平方根成反比。的平方根成反比。2022-5-232022-5-23283、均数的标准误 (standard error)(1)(1)概念:将样本均数的标准差称为均数的标准误, , 它是描述均数抽样误差大小的指标(2)(2)计算: 实际工作中,s s 往往是未知的,一般可用样本标准差s s代替s s :一、均数的抽样误差XnssX
14、SSn2022-5-232022-5-23293、均数的标准误 (standard error)(3)(3)统计学意义均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之,亦然。(4)(4)影响抽样误差大小的因素标准差样本含量n n 实际工作中,可通过适当增加样本含量来减少均数的标准误,从而降低抽样误差。2022-5-233个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775
15、.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn2022-5-232022-5-23314、总体分布非正态分布时,样本均数的分布规律中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋
16、于正态分布. .样本均数的总体均数仍等于;样本均数的标准误仍满足均数标准误的计算式;当较小时,样本均数的分布是偏态的;当足够大(50)样本均数的分布近似正态分布一、均数的抽样误差2022-5-232022-5-2332 非正态总体样本均数的抽样实验 图6-1(a)是一个正偏峰的分布, 用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 2022-5-230.002.505.007.5010.0012.5005001,0001,5002,0002,500FrequencyMean = 0.9922Std. Dev. = 1.01146N = 10
17、,0000.001.002.003.004.00n=50100200300400500600FrequencyMean = 0.9993Std. Dev. = 0.44341N = 10,0000.000.501.001.502.002.503.00n=100100200300400500600700FrequencyMean = 0.9988Std. Dev. = 0.31365N = 10,0000.501.001.502.00n=300100200300400500600FrequencyMean = 0.9997Std. Dev. = 0.18276N = 10,0000.500.75
18、1.001.251.501.75n=500100200300400500600700FrequencyMean = 0.999Std. Dev. = 0.14125N = 10,0002022-5-2338 影响抽样误差大小的因素有:影响抽样误差大小的因素有: 样本标准差。样本标准差。S越大,越大, 也就越大。也就越大。 样本含量。样本含量。n 越大,抽样误差越小越大,抽样误差越小。 因此如在一定标准差条件下,加大样本含量,可减少抽样误差,因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。以保证的样本均数的代表性和可靠性。 Xs2022-5-232022
19、-5-2339 例6-1 20006-1 2000年某研究者随机调查某地健康成年男子2727人,得到血红蛋白量的均数为125 g /L125 g /L,标准差为15 g /L15 g /L。试估计该样本均数的抽样误差。 = = =Xs/ sn15/ 27 2.89g /L2022-5-232022-5-2340样本频率的抽样分布与抽样误差 2022-5-232022-5-2341黑球比例%样本频数样本频率(%) 5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.0
20、31.0 5 5.034.0 3 3.040.0 2 2.0合计100 100.0 表表6-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni = 35)2022-5-232022-5-2342抽样分布与抽样误差2022-5-232022-5-2343样本频率样本频率 的总体均数参数为的总体均数参数为, 率的标准误计算公式率的标准误计算公式公式公式nXp 1pnsnppnppSp)1 (1)1 (2022-5-232022-5-2344例6-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。 p
21、= 41.5% = 0.415,n = 776(1)pppns0.415 0.585.77%7760.01771=2022-5-232022-5-2345思考题:什么是抽样误差?决定抽样误差大小的因素有哪些?抽样误差能避免么?抽样误差有规律么?标准误和标准差有何区别与联系?2022-5-232022-5-2346标准误和标准差有何区别与联系2022-5-232022-5-2347第二节分布分布的概念分布的特征界值表2022-5-232022-5-2348一、分布的概念XZms随机变量随机变量X XN N(m m,s s2 2)标准正态分布N(0,1)变换1,nvSXnSXtXmmt t分布(分
展开阅读全文