第四章研参数估计基础课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四章研参数估计基础课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 参数估计 基础 课件
- 资源描述:
-
1、医用统计方法及其医用统计方法及其SPSS软件应用软件应用公共卫生学院公共卫生学院流行病与卫生统计学系流行病与卫生统计学系QuestionQuestion 某市某市20002000年随机测量了年随机测量了9090名名1919岁健康男岁健康男大学生的身高,其均数为大学生的身高,其均数为172.2cm172.2cm,标准,标准差为差为4.5cm,4.5cm,,试估计该地,试估计该地1919岁健康男大岁健康男大学生的身高可能的范围。学生的身高可能的范围。讲课提纲 抽样分布和抽样误差抽样分布和抽样误差t t分布分布 总体均数和概率的估计总体均数和概率的估计 第一节第一节 抽样分布与抽样误差抽样分布与抽样
2、误差 统计推断包括两方面的内容:统计推断包括两方面的内容:参数估计参数估计和和假设检验假设检验 抽样误差抽样误差:由:由产生的、由于产生的、由于而造成的而造成的样本统计量与样本统计量及样本统计量与总体参数之样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差。无倾向性,不可避免。间的差异称为抽样误差。无倾向性,不可避免。一、样本均数的抽样分布与抽样误差一、样本均数的抽样分布与抽样误差 均数的抽样误差:均数的抽样误差:由由个体变异个体变异产生的、由于产生的、由于抽样抽样而造成的样本而造成的样本均数与样本均数及样本均数与总体均数之间的差异均数与样本均数及样本均数与总体均数之间的差异称
3、为均数的抽样误差。用于表示均数抽样误差的指称为均数的抽样误差。用于表示均数抽样误差的指标叫样本均数的标准差,也称标叫样本均数的标准差,也称样本均数的标准误样本均数的标准误。抽样实验一:抽样实验一:假定从假定从1313岁女学生身高总体均数岁女学生身高总体均数标准差标准差 的的正态总体正态总体中进行随机抽样。中进行随机抽样。)(4.155cm)(3.5cm v样本均数的抽样分布特点样本均数的抽样分布特点:1 1 各样本均数未必等于总体均数各样本均数未必等于总体均数 2 2 样本均数之间存在差异样本均数之间存在差异 3 3 样本均数的分布很有规律,围绕着总体均数,中样本均数的分布很有规律,围绕着总体
4、均数,中 间多,两边少,左右基本对称,也服从正态分布间多,两边少,左右基本对称,也服从正态分布 4 4 样本均数的变异较之原变量变异大大缩小样本均数的变异较之原变量变异大大缩小 抽样实验二:非正态总体样本均数的抽样实验(实验5-2)图5-1(a)是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 PERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.
5、13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=5PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21
6、.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0N=5N=10n=30PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=
7、50PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0N=30N=50 1 1)从正态总体)从正态总体N(N(,2 2)中,随机抽取例数为中,随机抽取例数为n n的的多个样本,样本均数多个样本,样本均数 服从正态分布;即使是从服从正态分布;即使是从偏态总体中随机抽样,当偏态总体中随机抽样,当n n足够
8、大时足够大时(如如n n50)50),也近似正态分布。也近似正态分布。2)从均数为从均数为,标准差为标准差为的正态或偏态总体中抽的正态或偏态总体中抽取例数为取例数为n n的样本,样本均数的标准差即的样本,样本均数的标准差即标准误标准误为为 。XXX 标准误的大小与标准误的大小与的大小成正比,与的大小成正比,与n n成反比,而成反比,而为定值,说明可以通过为定值,说明可以通过增加样本例数增加样本例数来减少标准误,来减少标准误,以降低抽样误差。以降低抽样误差。未知,用样本标准差未知,用样本标准差S S来估计总体标准差来估计总体标准差。用 来表示均数抽样误差的大小。nX/nSSX/XS(标准误的理论
9、值)(标准误的理论值)(标准误的估计值)(标准误的估计值)例例5-1 20005-1 2000年某研究所随机调查某地健康年某研究所随机调查某地健康成年男子成年男子2727人,得到血红蛋白的均数为人,得到血红蛋白的均数为125g/L125g/L,标准差为标准差为15g/L 15g/L。试估计该样本均数的抽样误差。试估计该样本均数的抽样误差。lgnSSX/89.227/15/二二 、样本频率的抽样分布与抽样误差、样本频率的抽样分布与抽样误差 从同一总体中随机抽出观察单位相等的多个样本,从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率及各样本率之间都存在差异,这种差样本率与总体率及各样本率
10、之间都存在差异,这种差异是由于抽样引起的,称为异是由于抽样引起的,称为。表示频率的抽样误差大小的指标叫表示频率的抽样误差大小的指标叫样本频率的抽样分布与抽样误差样本频率的抽样分布与抽样误差 实验4.2:某班近视眼患病率20%(总体概率=20%),随机抽出35人(n=35),观察近视眼患病率(样本频率p i)。重复这样的实验100次,每次得到患病率分别为14.4%,19.8%,20.2%,22.5%,等,将其频数分布列于表5-3。表表5-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni=35)黑球比例%样本频数%5.0 3 3.0 8.0 7 7.011.0 5 5.014
11、.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.031.0 5 5.034.0 3 3.040.0 2 2.0合计100 100.0:总体率,:总体率,n:样本例数。:样本例数。当当未知时,未知时,p p (为样本含量足够大,(为样本含量足够大,且且p p和和1-p1-p不太小)不太小)公式为公式为::率的标准误的估计值,:率的标准误的估计值,p p:样本率。:样本率。据数理统计的原理,率的标准误用据数理统计的原理,率的标准误用 表示表示 PnP1nPPSP1PS 例例5-2 5-2 某市随机调查了某市随机调查了5050岁
12、以上的中老年岁以上的中老年妇女妇女776776人,其中患有骨质疏松症者人,其中患有骨质疏松症者322322人,患病率人,患病率为为41.5%41.5%,试计算该样本频率的抽样误差。,试计算该样本频率的抽样误差。%77.10177.0776415.01415.0nP1PSP 一、一、t t分布的概念分布的概念在统计应用中,可以把任何一个均数为在统计应用中,可以把任何一个均数为,标准差为,标准差为的正态分布的正态分布N(,2)转变为转变为=0,=1的标准正态分布,的标准正态分布,即将正态变量值即将正态变量值X用用 来代替。来代替。也服从正态分布,也服从正态分布,XXzXXSXSXt服从标准正态分布
13、服从标准正态分布N(0,1)服从服从=n-1的的t分布分布 XZXXFREQUENCY0200t3 MIDPOINT-12.0-11.5-11.0-10.5-10.0-9.5-9.0-8.5-8.0-7.5-7.0-6.5-6.0-5.5-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.52.02.53.03.54.04.55.05.56.06.57.07.58.08.59.09.510.010.511.011.512.0FREQUENCY0200t50 MIDPOINT-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0
14、-0.50.00.51.01.52.02.53.03.54.04.55.0N=3N=50t分布曲线特点:分布曲线特点:1)t分布曲线是单峰分布,它以分布曲线是单峰分布,它以0为中心,左为中心,左右对称。右对称。2)t分布的形状与样本例数分布的形状与样本例数n有关。自由度越小,有关。自由度越小,则则 越大,越大,t 值越分散,曲线的峰部越矮,尾部翘的值越分散,曲线的峰部越矮,尾部翘的越高。越高。3)当当 n时,则时,则S逼近逼近,t分布逼近标准分布逼近标准正态分布。正态分布。t分布不是一条曲线,而是一簇曲线。分布不是一条曲线,而是一簇曲线。二、二、t 分布的图形和分布的图形和t分布表分布表XS=
15、(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图5-3 不同自由度下的t分布图t分布分布 统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度 下的t界值表(附表2)。t界值表:横标目为自由度,纵标目为概率P。t临界值:表中数字表示当 和P 确定时,对应的值。单侧概率(one-tailed probability):用t,表示 双侧概率(two-tailed probability):用t/2,表示t分布分布 例如,当=16,单侧概率P=0.05时,由表中查得单侧t0.05,16=1.746;而当=16,双侧概率P=0.05时,由表
16、中查得双侧t0.05/2,16=2.120。按t分布的规律,理论上有单侧:P(t t0.05,16)=0.05 和 P(t t0.05,16)=0.05 双侧:P(t t0.05/2,16)P(t t0.05/2,16)=0.05 t分布分布更一般的表示方法如图5-4(a)和(b)中阴影部分所示为:单侧:P(t t,)=和 P(t t,)=双侧:P(t t/2,)P(t t/2,)=t分布分布从t界值表中或表的右上角图列亦可看出:在相同自由度时,t值越大,概率P越小;而在相同t值时,双侧概率P为单侧概率P的两倍,即t0.10/2,16=t0.05,16=1.746。一、参数估计的概念一、参数估
17、计的概念 统计推断包括参数估计和假设检验。参数估计就是统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。用样本指标(统计量)来估计总体指标(参数)。参数估计参数估计点估计点估计(point estimation)区间估计区间估计(interval estimation)二、置信区间的计算二、置信区间的计算1.点估计点估计:用样本统计量直接作为总体参数的估计值用样本统计量直接作为总体参数的估计值。例如例如 于于2000年测得某地年测得某地27例健康成年男性血红蛋白量例健康成年男性血红蛋白量的样本均数为的样本均数为125g/L,试估计其总体均数。,试估计其总体
展开阅读全文