医学精品课件:第3节 均数的抽样误差和总体均数估计2013 临本.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学精品课件:第3节 均数的抽样误差和总体均数估计2013 临本.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学精品课件:第3节 均数的抽样误差和总体均数估计2013 临本 医学 精品 课件 抽样误差 总体 估计 2013
- 资源描述:
-
1、第三节第三节 均数的抽样误差和总体均数估均数的抽样误差和总体均数估计计1.参数估计参数估计 包括:点估计与区间估计包括:点估计与区间估计2.假设检验假设检验统计推断的两部分内容:统计推断的两部分内容:统计推断:用样本信息推论总体的特征。统计推断:用样本信息推论总体的特征。样本样本随机抽取部分观察单位随机抽取部分观察单位?推断推断inferenceinferenceX参数估计参数估计一、均数的抽样误差与标准误一、均数的抽样误差与标准误2009年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则
2、这100个个样本均数构成样本均数构成一新分布一新分布,绘制频数图,绘制频数图从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布 ,各样本均数各样本均数 未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本样本均数的分布为中间多,两边少,左右基本对称。对称。样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大大缩小。大缩小。可算得这可算得这100个样本均数的均数为个样本均数的均数为167.69cm、标准、标准差为差为1.69cm。XX 样本均数分布具
3、有如下样本均数分布具有如下特点:特点:从正态分布总体从正态分布总体 中以固定中以固定 n 抽样时,样本均抽样时,样本均数数 的分布仍服从正态分布的分布仍服从正态分布 。当样本含量当样本含量 n 足够大时,即使从偏态分布总体中以固定足够大时,即使从偏态分布总体中以固定 n 抽样,其样本均数的分布也近似服从正态分布。抽样,其样本均数的分布也近似服从正态分布。),(2NX),(2XNnNX2,8 8理论上可以证明,理论上可以证明,抽样误差:抽样误差:由个体变异产生的、抽样造成的样本由个体变异产生的、抽样造成的样本统计量与总体参数的差别统计量与总体参数的差别 原因:原因:1 1)抽样)抽样 2 2)个
4、体差异)个体差异由于由于变异变异的存在,的存在,抽样研究抽样研究所造成的样本所造成的样本均数与总体均数的差异,以及各样本均数均数与总体均数的差异,以及各样本均数间的差异称为间的差异称为均数的抽样误差均数的抽样误差。抽样误差在抽样研究中是不可避免的,但抽样误差在抽样研究中是不可避免的,但只要严格遵循随只要严格遵循随机化抽样的原则,就能估计抽样误差的大小机化抽样的原则,就能估计抽样误差的大小。1.均数的抽样误差的概念均数的抽样误差的概念表示表示样本统计量样本统计量抽样误差大小的统计抽样误差大小的统计指标。指标。标准误:标准误:说明抽样误差的大小,总体说明抽样误差的大小,总体计算公式计算公式Xn2、
5、标准误、标准误(standard error,SE)实质:样本均数的标准差实质:样本均数的标准差若用样本标准差若用样本标准差s 来估计来估计 ,(7-28)XSSn当样本例数当样本例数n一定时,标准误与标准差呈正比一定时,标准误与标准差呈正比当标准差一定时,标准误与样本含量当标准差一定时,标准误与样本含量n的平方的平方根呈反比。根呈反比。通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。抽样调查抽样调查150名名3岁女孩的身高均数为岁女孩的身高均数为92.79cm,标准差为,标准差为4.61cm,则其标准误是,则其标准误是多少?多少?例子例子:0.38snxscm1 1、反映样
6、本均数的可靠性;、反映样本均数的可靠性;2 2、估计总体均数的置信区间;、估计总体均数的置信区间;3 3、用于均数的假设检验。、用于均数的假设检验。指标指标意义意义应用应用标准差标准差(s s)衡量变量值变异程度,衡量变量值变异程度,s s越大表示变量值变异程度越大表示变量值变异程度越大,越大,s s越小表示变量值越小表示变量值变异程度越小变异程度越小描述正态分布(近似正描述正态分布(近似正态分布)资料的频数分态分布)资料的频数分布;医学参考值范围的布;医学参考值范围的估计估计标准误标准误()样本均数的变异程度,表样本均数的变异程度,表示抽样误差的大小。示抽样误差的大小。标准标准误越大表示抽样
7、误差越大,误越大表示抽样误差越大,样本均数的可靠性越小;标样本均数的可靠性越小;标准误越小表示抽样误差越小,准误越小表示抽样误差越小,样本均数的可靠性越大样本均数的可靠性越大总体均数区间估计;两总体均数区间估计;两个或多个总体均数间比个或多个总体均数间比较的假设检验较的假设检验XS标准差和标准误的区别标准差和标准误的区别1616二、二、t 分布分布(一)(一)t分布概念分布概念 随机变量随机变量X XN N(,2 2)标准正态分布标准正态分布N N(0 0,1 12 2)z变换Xz,1XXXtnSSn 式中式中 为自由度为自由度(degree of freedom,df)3实际工作中,由于实际
8、工作中,由于 未知,用未知,用 代替,则代替,则 不再服从标准正态分布,而服从不再服从标准正态分布,而服从t t 分分布。布。XXS()/XXS均数均数标准正态分布标准正态分布N N(0 0,1 12 2)),(2nN1,nvSXnSXtXStudent Student t t分布分布自由度:自由度:n n-1-1XnXz/0t 分布分布一簇曲线一簇曲线),(2 NX),(2XN X0N(0,1)XXu XsXt Xun足够大时,足够大时,分布分布分布分布ut(1)(2)(3)以固定以固定 n 随机抽样随机抽样2222英国统计学家英国统计学家GossetGosset(二)(二)t 分布的图形与
9、特征分布的图形与特征 分布只有一个参数,即自由度t t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(标准正态曲线)=5=1f(t)图图 不同自由度下的不同自由度下的t 分布图分布图t 分布与标准正态分布分布与标准正态分布252526261特征:特征:3t 界界值值表表:详详见见附附表表2,可可反反映映t 分分布布曲曲下下的的面面积积。单单侧侧概概率率或或单单尾尾概概率率:用用,t 表表示示;双双侧侧概概率率或或双双尾尾概概率率:用用2、t界值表:界值表:详见详见P312,可反映,可反映t分布曲线下的面积。分布曲线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率
10、:用 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。表表示示;双双侧侧概概率率或或双双尾尾概概率率:用用/2,t表表示示。-tt0 由由t t界值表可知:界值表可知:相同自由度时,相同自由度时,t t越大,概率越大,概率P P越越 小。小。相同相同t t值时,双侧概率是单侧概率的两倍。值时,双侧概率是单侧概率的两倍。=时,时,t t 分布即为分布即为Z Z分布,故分布,故t t界值表中界值表中最后一行是最后一行是Z Z界值。界值。t分布的分位数分布的分位数(双侧双侧t界值界值)/2/21-t/2,-t/2,3131,ttP,ttP 1-t,t分布的分位数分布的分位数(单
11、侧单侧t界值界值)3232举例:举例:三、总体均数的置信区间估计三、总体均数的置信区间估计用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数推断总体均数。用样本均数推断总体均数。1.点估计点估计(point estimation):用相应样本统计量直接作为其总体参数用相应样本统计量直接作为其总体参数的估计值。如用的估计值。如用 估计估计、s估计估计 等。其方等。其方法虽简单,但未考虑抽样误差的大小。法虽简单,但未考虑抽样误差的大小。X 按预先给定的概率按预先给定的概率(1 )所确定的包含未知所确定的包含未知总体参数的一个范围。总体参数的一个范围。总体均数
12、的区间估计:总体均数的区间估计:按预先给定的概率按预先给定的概率(1 )所确定的包含未知总体均数的一个范围。所确定的包含未知总体均数的一个范围。如给定如给定=0.05,该范围称为参数的该范围称为参数的95%可信区可信区间或置信区间;间或置信区间;如给定如给定=0.01,该范围称为参数的该范围称为参数的99%可信区可信区间或置信区间。间或置信区间。2区间估计区间估计(interval estimation):计算总体均数可信区间计算总体均数可信区间n需考虑:需考虑:(1)总体标准差)总体标准差 是否已知,是否已知,(2)样本含量)样本含量n的大小的大小n通常有两类方法:通常有两类方法:(1)t分
展开阅读全文