大学精品课件:第3章总体均数的估计与假设检验94.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:第3章总体均数的估计与假设检验94.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 精品 课件 总体 估计 假设检验 94
- 资源描述:
-
1、统计分析,统计描述,统计推断,用统计指标、统计表和统计图来描述资料的分析规律及其数量特征,总体参数估计,假设检验,统计推断(statistical inference) 通过样本统计量信息推断相应总体参数的方法。 包括对总体参数的置信推断及参数间差异的假设检验。,第三章 总体均数的估计与假设检验,总体均数的估计,抽样误差与标准误 t分布 参数的估计,一、抽样误差与标准误,由于个体变异的存在,在抽样研究中产生样本统计量之间,样本的统计量和总体参数之间的差异,称为抽样误差(sampling error)。 各种参数都有抽样误差,抽样误差的定义,正态总体 =4.83 =0.52,100份样本的均数和
2、标准差,将这100份样本的均数看成新变量值,按频数分布方法,得到这100个样本均数,形成的直方图见图4-1。,图4-1 随机抽样所得100个样本均数的分布,抽样实验小结,从正态总体N(,2)中抽取样本,获得均数的分布仍近似呈正态分布N(, 2/n) ; 从任意总体中随机抽样,当样本含量足够大时(n60),其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,我们仿造标准差的计算公式,写出样本均数的标准差,变量值的标准差,样本均数的标准差,标准误的意义,标准误反映了样本均
3、数间的离散程度,也反映了样本均数与总体均数的差异。 大,抽样误差大,用 估计的可靠程度低; 小,抽样误差小,用 估计的可靠程度高。,在例数n一定时,标准误的大小与标准差成正比; 当总体中各观察值变异较小时,抽到的样本均数与总体均数相差较小;当总体中各观察值变异较大时,抽到的样本均数与总体均数相差较大,则抽样误差大。 而当总体一定时,标准误与样本含量的平方根成反比; 样本例数n越大,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计,例:对某地成年男性红细胞数的抽样调查中,随机抽取了100名成年男性,调查得到其均数是5
4、.381012/L,标准差为0.441012/L,求其标准误。,n=100 s=0.441012/L,(1012/L),二、 t 分布(t-distribution),u分布,随机变量X N(m,s2),u变换,标准正态分布 N(0,12),均数,标准正态分布 N(0,12),在实际工作中,由于 未知,常用 s 代替,此时 服从t分布 (t-distribution)即:,t 分布(t-distribution),X1,X2,X3, N ( , 2 ),N (0,1 ),u 分布,X1,X2,X3, N ( , 2x ),N (0,1 ),Sx,t 分布,t分布曲线,t 分布有如下性质: 单峰
5、分布,曲线在t0 处最高,并以t0为中心左右对称 与正态分布相比,曲线最高处较矮,两尾部翘得高 t分布曲线是一簇曲线,其形态变化与自由度(=n-1)的大小有关。随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,标准正态分布曲线有一定的面积特点,t分布也有一定的面积特点。 由于t分布是一簇曲线,曲线的高低与自由度有关,要获得相同的外侧面积,其界值点并不相同,因此,外侧面积为的t界值点表示为t, ,其值的大小可查t界值表。,t分布的面积特点及界值,t 界值表(附表1),1.812,2.228,-2.228,t,f (t),=10的t分布图,表示法:双侧 单侧,用 途:1. 总体均数置
6、信区间的估计 2. 用于t检验,自由度相同时,P值 , t值 P值相同时,自由度 , t值 自由度 时, t值=u值,三、总体均数的置信区间估计 参数估计,parameter estimation,概念,用样本统计量估计总体参数称参数估计(parameter estimation) 是统计推断的一个重要内容 常用的估计方法有两种: 点估计 置信区间估计,点估计(point estimation),概念:指用样本统计量直接作为总体参数的估计值 方法:直接用随机样本的均数 作为总体均数的估计值,即 ;用样本率p作为总体率的估计值,即 特点:方法简单;但未考虑抽样误差的大小;点估计的准确性很难评价,
7、置信区间估计( confidence interval estimation),又称可信区间估计,即按预先给定的概率(1), 估计未知总体参数的可能范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI),置信度( confidence level),也称可信度:估计正确的概率,可以是90%、95%,99% 等。置信度越大,区间要求越宽 90%可写成1-0.10,95%可写成1-0.05,99%可写成1-0.01, 0.10、0.05、0.01用表示,为估计错误的概率,(1-)即表示置信度。 一般情况下,置信区间选择95%。置信度定位95%时,置信区间的大小就
8、由抽样误差决定。,置信限( confidence limit),置信区间通常两个数值即置信限(confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U)。 置信区间是指包括总体参数的范围,置信限是指范围的两个界限,置信区间的上下限即为可信限。,总体均数置信区间的计算,已知时: 总体均数,95%的可信区间按下式计算:,总体均数置信区间的计算,未知 n 较大时(n100),总体均数的95%可信区间 n 较小时(n100) ,总体均数的95%可信区间,例 从某年某地20岁健康男大学生中抽得110名的一个样本,
9、求得身高的均数为172.73cm, 标准差为4.09cm, 试估计该地20岁健康男大学生身高均数的95置信区间。,该地20岁健康男大学生身高均数的95置信区间为 (171.97, 173.49) cm,(172.731.960.39 , 172.731.960.39) =(171.97, 173.49) cm,例 从某年某地20岁健康男大学生中抽得11名的一个样本, 求得身高的均数为172.25cm, 标准差为4.09cm, 试估计该地20岁健康男大学生身高均数的95置信区间。,该地20岁健康男大学生身高均数的95置信区间为 (169.50, 175.00) cm,=11-1=10,查t界值表
10、,得t0.05/2(10)=2.228 (172.252.2281.233, 172.252.2281.233) =(169.50, 175.00),总体均数的95置信区间的含义,100次抽样,可得到100个置信区间,平均有95个置信区间包括客观存在的总体均数,只有5个置信区间未包括总体均数,四、假设检验(hypothesis test),10岁男孩为总体A =130cm,=7.5cm,11岁男孩为总体B =140cm,=8.2cm,a2 X=131.9cm n=10,a1 X=128.3cm n=10,b X=138.2cm n=10,H0: a1与a2之差 是抽样误差,H1: b与a2之差
11、是 两不同年龄之差 与抽样误差之和 (本质之差),引起两个样本均数不相等的原因有两种可能 : 1、来自相同的总体,由于抽样误差所致; 2、来自不相同的总体,由于本质差异所致。 假设检验就是在这两者中作出决策的过程。,假设检验(hypothesis test),假设检验的基本思想 假设检验的基本步骤 t检验和u检验 样本均数与总体均数比较 配对设计的两样本均数比较 完全随机化设计的样本均数比较 假设检验中应注意的问题,假设检验的基本思想,亦称显著性检验(significane test) 它是利用小概率反证法的思想,从问题的对立面( H0 )出发间接判断要解决的问题(H1)是否成立,然后在H0成
12、立的条件下计算检验统计量(test ststistic),最后获得P值(P-value)来判断。,假设检验的步骤(1),1、建立检验假设,确定检验水准 (1)两种假设 H0: 无效假设(null hypothesis) 差异由抽样误差所致,=0 H1: 备择假设(alternative hypothesis)差异是由本质性差异引起,0 (2)两侧检验:单侧,双侧 (3)检验水准(显著性水平)(level of test) =0.05,u与u0比较,2、选择检验方法,计算检验统计量 即计算样本与所假设总体的偏离情况 根据研究设计方法、统计推断的目的、资料类型、样本含量和资料分布等选择适当的检验方
展开阅读全文