医科大学精品课件:参数估计.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医科大学精品课件:参数估计.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医科大学 精品 课件 参数估计
- 资源描述:
-
1、4 参数估计,引子 : 1. 医学科学研究的特点 医学统计学的任务,风 险,问题:已知某市健康儿童共125万人,想知道其平均血糖水平是多少?,求(参数)的问题,Population:125万人,13,方法二: 随机抽样 (50人),A= 4.66mmol/L (样本统计量),风 险,怎么样由 估计?,利用了一个规律,“抽样分布”的规律,4.1 抽样分布与标准误 4.2 t 分布 . 4.3 总体参数的估计 .,4.1 抽样分布与标准误,【实验一】假定某年某地13岁所有女学生的身高服从XN (155.4 , 5.32)的正态分布,从中抽取一个样本含量为30的样本,比较样本均数和总体均数的差异。,
2、 , 156.6,样本均数 :,156.7,158.1,155.6,表6.1 从正态总体 N (155.4, 5.32) 抽样得到的100个样本均数的分布频数表(n=30),样本均数的分布特征:,图6.1,图6.1 某年某地女学生身高样本均数分布的频数表,以样本均数作为随机变量,有以下特点: 各样本均数未必等于总体均数。 样本均数之间存在差异。 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。,抽样误差(sampling error):由于抽样造成的样本统计量与样本统计量,以及样本统计量与总体参数间的差别,称为。 原因:个
3、体变异 特征:A. 不可避免性 B. 可控性,原总体变量的分布,样本均数的抽样分布,标准误 (standard error of mean,SME或SE)概念:,样本均数的标准差简称标准误(standard error,SE)是描述均数的抽样误差大小的指标。 数理统计研究表明,标准误 即抽样误差的大小具有一定的规律性,,样本均数,标准误 (standard error,SE)计算:,标准误的理论值,标准误的理论值的估计值,前提: 无限总体 完全随机抽样,(1)标准误(standard error)是描述均数的抽样误差大小的指标,可用来衡量样本均数的可靠性;标准误越小,说明抽样误差越小,样本均数
4、代表总体均数就越可靠。 (2)用于参数估计。 (3)用于假设检验。,标准误的意义:,小结:若随机变量X服从XN ( , s2) 的正态分布,则以之随机抽样计算的样本均数所构成的分布也呈正态分布。,1. 样本均数的总体均数仍等于原来的总体均数。 2. 样本均数的标准差 叫做标准误 (standard error of mean, SEM),记作 ,是描述均数的抽样误 差大小的指标。,中心极限定理,【实验二】:非正态分布样本均数的抽样分布 图6-2是一个正偏态分布,用电脑从中随机抽取样本含量分别为5、10、30、50的样本各1000次,计算样本均数,绘制直方图,并观察其样本均数的分布。,n = 5
5、,n = 10,n = 30,n = 50,当样本容量足够大时(n 30) ,样本均数的抽样分布逐渐趋于正态分布,偏态分布总体,从偏态总体中抽样,当n足够大时(n大于30),其均数也近似于正态分布。,样本均数的总体均数仍等于原来的总体均数。 样本均数的标准差 仍叫做标准误,记作 。,中心极限定理,计算公式仍是:,举例:大规模普查得某地健康成年男子血红蛋白总体均数为 =135g/L,=20.5g/L。若在其中进行随机抽样,样本量n=100,样本均数 =130g/L,S=23.4g/L,求其理论标准误和样本均数的估计标准误。,2. 样本均数的估计标准误:,1.理论标准误:,解:,均数;标准差 N(
6、,2 ),正态分布与抽样分布的区别与联系,原总体变量的分布,样本均数的抽样分布,标准差与标准误的区别与联系,4.2 t 分布,均数;标准差 N(,2 ),均数;标准误 N(, ),总体分布,抽样分布,原变量,任意正态分布曲线 XN(,2),标准正态分布曲线 XN(0,1),u 变换,对于正态变量X,标准正态分布,对样本均数的正态分布进行标准化t 分布,若对抽样分布 进行标准化变换,有,实际工作中, 是未知的,所以常需以 代替。,W.S.Gosett 研究它的分布规律,提出它不服从标准正态分布的规律,而服从=n-1的t 分布,后人用其笔名student命名,称之为students t-distr
7、ibution,简称 t 分布。,t 分布:,Z分布,t 分布,故:,【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转换,将t 值绘成直方图: 。,n =3时的t分布,n=50时的t分布,所以,不同的自由度(=n-1)即有不同的 t 分布,【实验三】:从前述13岁女学生身高这个正态总体中分别作样本量为3或50的随机抽样,各取1000份样本,分别得到1000个样本的均数及其标准误,对它们分别作t 转换,将t 值绘成直方图: 。,n =3时的t分布,n=50时的t分布,所以,不同的自由度
8、(=n-1)即有不同的 t 分布,不同自由度的t 分布的曲线,t 分布图形的特征:,1. t分布的密度曲线呈单峰,曲线在t =0处最高,并以t=0为中心左右对称;t值可是正数,也可是负数。 2. 与标准正态分布相比,曲线最高处较矮,两尾部较高。 3. t分布的概率密度曲线是一簇曲线,它只有一个参数 自由度;一但确定,其曲线形状即也确定。 越小,则t值越分散,曲线越低平,尾部越高; 随着的逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,t分布的极限分布是Z分布。 4. t分布的概率密度曲线下面积有一定规律性,可通过查“t分布界值表”得到。,t 分布图形的特征:,t 分布曲线下的整个面积为1; t
9、 分布曲线下从a 到b 的面积为t 值分布在此范围内的百分比,即t 值落在此范围内的概率p。,t 分布曲线下的面积分布规律:,自由度为 的t 分布曲线,t 界值表:以自由度 为横标目,概率P 为纵标目,表中数字表示当和 P确定时,对应的是正侧或双侧的t 临界值表,记作t(,)或t(/2,) 。,包括,单侧概率的t 临界值,记作t(,),双侧概率的t 临界值,记作t(/2,),附 表 2 t 界 值 表,例1,求当=9,单尾概率=0.05时的 t界值,表明:按t分布的规律,从正态分布总体中抽取样本含量n=10的样本,则由该样本计算的t 值大于等于1.833的概率为0.05,或小于等于-1.833
展开阅读全文