书签 分享 收藏 举报 版权申诉 / 47
上传文档赚钱

类型研究生-统计学讲义-第3讲-总体均数估计和假设检验课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3406953
  • 上传时间:2022-08-28
  • 格式:PPT
  • 页数:47
  • 大小:326.54KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《研究生-统计学讲义-第3讲-总体均数估计和假设检验课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    研究生 统计学 讲义 总体 估计 假设检验 课件
    资源描述:

    1、第四章第四章 第一节第一节 总体均数的估计总体均数的估计一一.样本均数的分布和样本均数的分布和 t 分布分布(P49P49)在抽样研究中,即使是严格遵守随机抽样原则,从在抽样研究中,即使是严格遵守随机抽样原则,从同一总体中每次抽取样本含量相等同一总体中每次抽取样本含量相等(都为都为n n)的样本,计的样本,计算每一个样本的样本均数,由于变异存在,样本均数算每一个样本的样本均数,由于变异存在,样本均数有大有小,不尽相同,是随机变量,其分布称为样本有大有小,不尽相同,是随机变量,其分布称为样本均数的分布。这里介绍样本均数的两条常用性质:均数的分布。这里介绍样本均数的两条常用性质:情形情形当抽样来自

    2、均数为当抽样来自均数为 ,方差为,方差为 的的正态分布正态分布总体总体时,样本均数的分布(抽样分布)有下面的性质时,样本均数的分布(抽样分布)有下面的性质X 2X 1.的分布是正态的的分布是正态的 X2.设设 分布的均数是分布的均数是 ,则则 =XX X3.设设 的方差是的方差是 ,则则 =,是总体标是总体标准误准误.X2X 2X nX2 X X 情形情形 当抽样来自均数为当抽样来自均数为 ,方差为,方差为 的的非正态非正态分布分布总体时,样本均数的分布(抽样分布)有下面总体时,样本均数的分布(抽样分布)有下面的性质:的性质:X2X1 的分布是近似正态的,随样本容量的增加,靠的分布是近似正态的

    3、,随样本容量的增加,靠近正态的程度就越好近正态的程度就越好一般地,一般地,的抽样分布靠近正的抽样分布靠近正态分布所需要的样本容量取决于最初分布的外形态分布所需要的样本容量取决于最初分布的外形在几乎所有的情形里面,对在几乎所有的情形里面,对 的抽样分布,样本容的抽样分布,样本容量在量在30或以上就可以得到很好的正态近似或以上就可以得到很好的正态近似(均数(均数的这个性质就是众所周知的的这个性质就是众所周知的中心极限定理中心极限定理Central Limit Theorem)XXX2.设设 分布的均数是分布的均数是 ,则则 =3.设设 的方差是的方差是 ,则则 =,是总体标是总体标准误准误.X X

    4、 XX2X 2XnX2 X X 由第由第1条(均数抽样分布的正态或近似正态)将在后面条(均数抽样分布的正态或近似正态)将在后面推出强有力的统计推论推出强有力的统计推论两种情形中的第两种情形中的第3条表明,与条表明,与个体观测值相比较,样本均数是变化较小的变量,那个体观测值相比较,样本均数是变化较小的变量,那是因为标准误总是比标准差小的缘故是因为标准误总是比标准差小的缘故 nSSXX 二、二、t 分布分布 在公式在公式 n/X 中用中用 nsn 代替代替得到:得到:nsX/用用 S 替换替换产生了一个不同的样本分布产生了一个不同的样本分布如果如果值未值未知又必须估计它,用估计值替换知又必须估计它

    5、,用估计值替换所得变量的分布称所得变量的分布称为为 t 分布这个分布是分布这个分布是19世纪在英国世纪在英国Guinness 啤酒啤酒厂工作的厂工作的W.S.Gossett发现,在发现,在1908年以笔名年以笔名“Student”发表因此有时称为发表因此有时称为Students t 分布,分布,这个分布族取决于参数这个分布族取决于参数n1 (4-4)n/X nsX/是具有是具有=0,=1的标准正态分布,而的标准正态分布,而 是是具有具有=0,取决于样本容量的取决于样本容量的t 分布分布随随样本容量的增加,样本容量的增加,t 分布渐近标准正态分分布渐近标准正态分布布见图,见图,t 分布的准确外形

    6、取决于被称为自由度(分布的准确外形取决于被称为自由度(degrees of freedom)的数量)的数量像正态分布一样,像正态分布一样,t 分布是对称的分布是对称的钟形曲线,但是有点平坦,例如,它们有大的标准差钟形曲线,但是有点平坦,例如,它们有大的标准差对任何对任何t 分布,自由度恰好是样本容量减分布,自由度恰好是样本容量减1:df=n1 作为为多个作为为多个t 分布的部分累积分布函数的比较已经列分布的部分累积分布函数的比较已经列在附表在附表 5 里里因为因为t 分布是概率密度函数,任何分布是概率密度函数,任何t 分布曲线下的面积分布曲线下的面积为为1在某些情形,我们必须使用固定概率(一个

    7、在某些情形,我们必须使用固定概率(一个t 分分布下的面积),留心并找出区间端点到中心布下的面积),留心并找出区间端点到中心0的这个的这个概率,设这个概率是概率,设这个概率是1,常常很小,规定为常常很小,规定为0.05或或0.01,于是,于是1=0.95或或0.99那么为寻找这个那么为寻找这个t 0,使使得得 1)(00tttP0t0t 2 2 t 分布里,定位在中间的面积分布里,定位在中间的面积1 t 分布有两条重要性质:分布有两条重要性质:(1)从正态总体中每次随机抽取例数为)从正态总体中每次随机抽取例数为n的样本,的样本,按(式按(式4-4)计算的统计量服从自由度为)计算的统计量服从自由度

    8、为df=n-1的的t分分布(即样本均数与总体均数相差多少个标准误服从自布(即样本均数与总体均数相差多少个标准误服从自由度为由度为n-1的的t分布)。分布)。(2)从相互独立,总体均数分别为)从相互独立,总体均数分别为1,2,而标准,而标准差都为差都为的两个正态总体中,随机抽取样本含量分别为的两个正态总体中,随机抽取样本含量分别为n1,n2的两个样本,分别算出样本均数和标准差为的两个样本,分别算出样本均数和标准差为X1和和S1,X2和和S2,按,按(式(式4-5)计算的统计量服从自由度)计算的统计量服从自由度为为df=n1+n22的的t分布。分布。x xt=21)()(2121xxsxx自由度自

    9、由度df=n1+n22 (式(式4-5)S =21xx)11(2)1()1(2121222211nnnnsnsn (式(式4-6)2T 分布的规律分布的规律 如附表如附表3的的 t 界值表(表中只列出界值表(表中只列出正的正的t值),表中横标目为自由度值),表中横标目为自由度df,纵标目为概率,纵标目为概率P,表中数字表示自由度为表中数字表示自由度为df时时t分布的界值(分布的界值(critical value)。)。t界值有单侧和双侧两种情况:自由度为界值有单侧和双侧两种情况:自由度为df时,时,t分布的双侧分布的双侧界值记为界值记为t/2,df,P(|t|t/2,df)=;t分布分布的单侧

    10、的单侧界值记为界值记为t,df,P(tt,df)=。例如,自由例如,自由度度df9时,由附表时,由附表3的的t界值表查出界值表查出0.05的单侧界值的单侧界值t0.05,91.833,双侧界值,双侧界值t0.05/2,92.262,则有:,则有:P(t1.833)0.05;P(t 1.833)P(t1.833)0.95。P(t2.262)0.025;P(t 2.262)P(-2.262 t 2.262)1-20.0250.95。从从 t 分布的界值与标准正态分布的界值可发现,同样分布的界值与标准正态分布的界值可发现,同样的尾部面积,的尾部面积,t分布的界值要大于标准正态分布的界值,分布的界值要

    11、大于标准正态分布的界值,当自由度当自由度df时,时,t 分布的界值逼近标准正态分布界分布的界值逼近标准正态分布界值。值。三三.总体均数的估计总体均数的估计(P 51)1 1点估计和点估计和区间估计区间估计 总体参数的估计有点估计和总体参数的估计有点估计和区间估计。区间估计。由样本观察值算出总体参数的一个估计值(为统计由样本观察值算出总体参数的一个估计值(为统计量)称为该参数的量)称为该参数的一个点估计一个点估计(point estimation)。点估计给出未知参数的一个近似值,但没考虑试验误点估计给出未知参数的一个近似值,但没考虑试验误差影响,也未指出这种估计的可靠程度。因为估计量差影响,也

    12、未指出这种估计的可靠程度。因为估计量是来自一个随机抽取的样本,每一次取值都有随机性是来自一个随机抽取的样本,每一次取值都有随机性,刚好等于待估计参数的可能性极小,而在参数值左,刚好等于待估计参数的可能性极小,而在参数值左右的情况较多。右的情况较多。统计学上更合理的估计是在一定概率(统计学上更合理的估计是在一定概率(1-)下,由)下,由含有未知参数及其点估计值所构成的统计量的分布规含有未知参数及其点估计值所构成的统计量的分布规律估计出参数可能存在的范围,称为区间估计律估计出参数可能存在的范围,称为区间估计(interval estimation),所给出的范围称为该参数的),所给出的范围称为该参

    13、数的(1-)可信区间或置信区间()可信区间或置信区间(confidence interval,简记为简记为CI)。这个范围包含参数值的可靠程度为()。这个范围包含参数值的可靠程度为(1-),称为可信度或置信度(),称为可信度或置信度(confidence degree)或可)或可信概率。信概率。2 2可信区间的意义可信区间的意义 现以总体均数的现以总体均数的95%可信区间为可信区间为例,总体参数例,总体参数95%可信区间的意义是:考虑总体参数可信区间的意义是:考虑总体参数的可信区间取决于所抽取的样本,在同样条件下,进的可信区间取决于所抽取的样本,在同样条件下,进行许多重复的抽样,每抽取一个样本

    14、可得到待估计参行许多重复的抽样,每抽取一个样本可得到待估计参数的一个可信区间,在这些区间中,有的包含待估计数的一个可信区间,在这些区间中,有的包含待估计的参数,有的不包含,平均说来每的参数,有的不包含,平均说来每100个中有个中有95个正个正确。确。实践中一般不会去抽取许多个样本,通常只抽取一个实践中一般不会去抽取许多个样本,通常只抽取一个样本,计算出一个区间,虽然无法确认这个区间是否样本,计算出一个区间,虽然无法确认这个区间是否包含了待估计的参数,但可知这种估计可信的程度为包含了待估计的参数,但可知这种估计可信的程度为95,会冒,会冒5%犯错误的风险。因犯错误的风险。因5%是小概率,在实是小

    15、概率,在实际应用中就认为待估计的总体参数在算得的区间内。际应用中就认为待估计的总体参数在算得的区间内。3可信区间有两要素:一是准确度,反映在可信度(可信区间有两要素:一是准确度,反映在可信度(1-)的大小,即区间包含总体参数的可能性(概率)的大小,准的大小,即区间包含总体参数的可能性(概率)的大小,准确度越接近确度越接近1越好,例如,可信度越好,例如,可信度99%比比95%犯错误的风险小;犯错误的风险小;二是精密度,反映在区间的长度,区间的长度愈小愈精密。二是精密度,反映在区间的长度,区间的长度愈小愈精密。在可信度确定的情况下,增大样本含量,相应的界值(如在可信度确定的情况下,增大样本含量,相

    16、应的界值(如t界界值)减少,标准误也减小,可减小区间长度,提高精密度。值)减少,标准误也减小,可减小区间长度,提高精密度。在样本含量确定的情况下,可信度(在样本含量确定的情况下,可信度(1-)愈大,总体参数估)愈大,总体参数估计的准确度愈高,但精密度愈差。二者是矛盾的,为兼顾准计的准确度愈高,但精密度愈差。二者是矛盾的,为兼顾准确度和精密度,常用确度和精密度,常用95%可信区间。可信区间。4.4.单个总体均数的估计单个总体均数的估计 样本均数是总体均数样本均数是总体均数的一的一个点估计。个点估计。已知时,按(式已知时,按(式4-34-3)计算的统计量服从)计算的统计量服从标准正态分布,根据标准

    17、正态分布的规律标准正态分布,根据标准正态分布的规律 P(-u/2 u u/2)=1-,有,有 已知时,正态总体均数已知时,正态总体均数的双侧的双侧(1 1)可信区间计算公式为(可信区间计算公式为(4-74-7)未知时,按(式未知时,按(式4-4)计算的统计量服从)计算的统计量服从 t 分布,由分布,由t分布的规律分布的规律 P(-t/2t72次次/分分 对于这两种可能,统计上通过检验前一种可能来对于这两种可能,统计上通过检验前一种可能来作出判断,假设检验的目的是排除差异完全由抽样作出判断,假设检验的目的是排除差异完全由抽样误差所致的可能性。方法是:先假设差异完全由抽误差所致的可能性。方法是:先

    18、假设差异完全由抽样误差所致,在这个假设下,计算检验统计量样误差所致,在这个假设下,计算检验统计量(如如t值值、u值等值等),按样本统计量的概率分布规律,求出获得,按样本统计量的概率分布规律,求出获得现有样本检验统计量值的概率现有样本检验统计量值的概率 如果出现了小概率事件,就拒绝这个假设;如果如果出现了小概率事件,就拒绝这个假设;如果没有出现小概率事件,则没有理由怀疑这个假设,所没有出现小概率事件,则没有理由怀疑这个假设,所以不拒绝这个假设。这种推断方法的特点是依据小概以不拒绝这个假设。这种推断方法的特点是依据小概率原理,采用类似于数学中逻辑论证的反证法,但又率原理,采用类似于数学中逻辑论证的

    19、反证法,但又区别于纯数学中逻辑推理的反证法。因为这里并不是区别于纯数学中逻辑推理的反证法。因为这里并不是形式逻辑中的绝对矛盾,而是基于人们在实践中广泛形式逻辑中的绝对矛盾,而是基于人们在实践中广泛应用的小概率原理。所以,可以说假设检验的基本思应用的小概率原理。所以,可以说假设检验的基本思想是某种带有概率性质的反证法。想是某种带有概率性质的反证法。假设检验有两种类型:假设检验有两种类型:(1)参数检验参数检验(nparametric):在许多问题中,总体分布的类型为已知,只是一个:在许多问题中,总体分布的类型为已知,只是一个或几个参数未知,只对未知参数作出假设,然后根据或几个参数未知,只对未知参

    20、数作出假设,然后根据随机样本提供的信息,选取检验统计量,按检验统计随机样本提供的信息,选取检验统计量,按检验统计量的分布规律,用量的分布规律,用“小概率原理小概率原理”推断假设是否成立推断假设是否成立。绍的绍的 t 检验、检验、u 检验,第五章介绍的方差分析等。检验,第五章介绍的方差分析等。(2)非参数检验非参数检验(nonparametric):是一种与总体分布):是一种与总体分布无关的统计检验方法,它不比较参数,而是比较分布的无关的统计检验方法,它不比较参数,而是比较分布的位置。当不知道样本来自的总体分布类型或已知总体分位置。当不知道样本来自的总体分布类型或已知总体分布与检验所要求的条件不

    21、符,可用非参数检验。详见第布与检验所要求的条件不符,可用非参数检验。详见第十一章。十一章。二、假设检验的一般步骤二、假设检验的一般步骤 1.1.建立假设并确定检验水准建立假设并确定检验水准 (1)(1)建立假设:建立假设:假设需根据研究的目的对总体的特征而提出。假假设需根据研究的目的对总体的特征而提出。假设有两种:一种是检验假设设有两种:一种是检验假设(hypothesis to be tested),假设差异完全由抽样误差造成,常称无效假设,假设差异完全由抽样误差造成,常称无效假设(hull hypothesis),用,用H0表示。表示。另一种是和另一种是和H0相对立的备择假设相对立的备择假

    22、设(alternative hypothesis),用,用H1表示,表示,H1通常是希望证实的情况。假通常是希望证实的情况。假设检验是针对设检验是针对H0进行的,希望用样本数据推断进行的,希望用样本数据推断H0是假的是假的,从而证实,从而证实H1是真的。假设检验的结果是在零假设是真的。假设检验的结果是在零假设H0和和对立假设对立假设H1之间作出抉择。当拒绝之间作出抉择。当拒绝H0时,接受时,接受H1,认,认为差异有统计意义;当不拒绝为差异有统计意义;当不拒绝H0时,认为差异无统计意时,认为差异无统计意义,则不接受义,则不接受H1。建立假设涉及检验方向:以建立假设涉及检验方向:以H0为准,如果根

    23、据专业为准,如果根据专业知识或研究目的,知识或研究目的,H1不能肯定方向,则假设检验的方不能肯定方向,则假设检验的方向是双侧的,称为双侧检验向是双侧的,称为双侧检验(two sided test)。如果根据。如果根据专业知识或研究目的,专业知识或研究目的,H1肯定方向,则假设检验方向肯定方向,则假设检验方向是单侧的,称为有单侧检验是单侧的,称为有单侧检验(one sided test)。也就是说。也就是说,单侧指实验结果向一个方向变化的。,单侧指实验结果向一个方向变化的。以样本均数以样本均数(其总体均数为其总体均数为)与已知的总体均数与已知的总体均数(已已知的总体均数用知的总体均数用0表示表示

    24、)比较为例,如例比较为例,如例4.2,如果根据,如果根据专业知识已知此类脾虚病人的脉博不会低于健康人,或专业知识已知此类脾虚病人的脉博不会低于健康人,或是研究者只关心此类脾虚病人的脉博是否快于正常人,是研究者只关心此类脾虚病人的脉博是否快于正常人,不关心是否慢于正常人,可用单侧检验。如果如果没有不关心是否慢于正常人,可用单侧检验。如果如果没有专业知识,不知此类脾虚病人的脉博快于或慢于健康人专业知识,不知此类脾虚病人的脉博快于或慢于健康人,两种可能性都存在,或是研究者只关心此类脾虚病人,两种可能性都存在,或是研究者只关心此类脾虚病人的脉博是否不同于正常人,目的只是推断两总体均数有的脉博是否不同于

    25、正常人,目的只是推断两总体均数有无差别,不管是此类脾虚病人的脉博快于正常人还是慢无差别,不管是此类脾虚病人的脉博快于正常人还是慢于正常人,研究者都同等关心,应当用双侧检验。于正常人,研究者都同等关心,应当用双侧检验。例例4.2的目的是推断此类脾虚病人的脉博是否快于的目的是推断此类脾虚病人的脉博是否快于正常人正常人(正常人的脉博总体均数为正常人的脉博总体均数为0=72次次/分分),H0为此类脾虚病对脉博数无影响,即此类脾虚病人的为此类脾虚病对脉博数无影响,即此类脾虚病人的脉博总体均数脉博总体均数 等于正常人等于正常人,用符号表示为用符号表示为:H0:=72次次/分分,即,即=0与之对应的备择假设

    26、为该类脾虚病的脉博数快于正与之对应的备择假设为该类脾虚病的脉博数快于正常人常人,用符号表示为:用符号表示为:H1:72次次/分,即分,即0(2)确定检验水准:检验水准确定检验水准:检验水准(size of a test)亦称显著亦称显著性水平性水平(significance level),常用符号,常用符号表示。表示。是假设是假设检验时预先确定的,用以作为判断多小的概率可以检验时预先确定的,用以作为判断多小的概率可以认为是小概率的水准,故称为检验水准。认为是小概率的水准,故称为检验水准。的大小视的大小视具体情况而定,一般具体情况而定,一般取取0.05或或0.01,若按,若按=0.05拒绝拒绝H

    27、0,接受,接受H1,作出这样的判断要冒,作出这样的判断要冒5%错误的风险。错误的风险。从图从图4-2可以看出,同一资料、同一检验水准可以看出,同一资料、同一检验水准时,时,因单侧检验的界值因单侧检验的界值t0.025相当于双侧检验的界值相当于双侧检验的界值t0.05,双,双侧侧 P 为单侧为单侧 P 的两倍,所以单侧检验比双侧检验更易的两倍,所以单侧检验比双侧检验更易拒绝拒绝H0。一般认为双侧检验较为稳妥,故较为常用。一般认为双侧检验较为稳妥,故较为常用。强调指出,检验水准强调指出,检验水准的确定,以及选择单侧检验的确定,以及选择单侧检验还是双侧检验,都应结合专业知识和研究目的,在实还是双侧检

    28、验,都应结合专业知识和研究目的,在实验设计时决定,不能等到样本结果计算完后再根据主验设计时决定,不能等到样本结果计算完后再根据主观愿望选定。观愿望选定。2选取检验统计量,明确其分布,并由样本计算检选取检验统计量,明确其分布,并由样本计算检验统计量值验统计量值 检验统计量是指建立在无效假设检验统计量是指建立在无效假设H0基础基础上的,用于抉择是否拒绝上的,用于抉择是否拒绝H0而选定的样本函数。参数而选定的样本函数。参数检验的检验统计量要求满足以下条件:检验的检验统计量要求满足以下条件:在在H0成立的成立的条件下,它的分布函数是已知的;条件下,它的分布函数是已知的;它必须包含要检它必须包含要检验的

    29、总体参数;验的总体参数;对于给定的样本数据,能计算出该对于给定的样本数据,能计算出该检验统计量的数值。检验统计量的数值。假设检验通常是以选定的检验统计量来命名的,假设检验通常是以选定的检验统计量来命名的,例如,以例如,以u值为检验统计量的假设检验称为值为检验统计量的假设检验称为u检验,以检验,以t值为检验统计量的假设检验称为值为检验统计量的假设检验称为t检验。检验统计量检验。检验统计量的选取,因资料不同而不同。如例的选取,因资料不同而不同。如例4.2,样本均数与总,样本均数与总体均数比较,如果体均数比较,如果H0(=0)成立,成立,(0)的绝对值的绝对值应比较小,一旦很大,就认为应比较小,一旦

    30、很大,就认为H0不成立。不成立。X检验统计量可用公式检验统计量可用公式 nS/Xt0 根据自由度为根据自由度为df=n-1的的 t 分布规律作推断,称为分布规律作推断,称为 t 检验。检验。t 检验适用于小样本研究。若样本含量在检验适用于小样本研究。若样本含量在50以上以上,可选用,可选用 u 值作检验统计量,称为值作检验统计量,称为 u 检验。检验。3确定确定 P 值和作出推断结论值和作出推断结论 P 值是在值是在 H0 成立时大成立时大于等于用样本计算出的统计量值出现的概率,可以根于等于用样本计算出的统计量值出现的概率,可以根据检验统计量的分布规律估计。用据检验统计量的分布规律估计。用 P

    31、 值与检验水准值与检验水准进行比较,根据比较的结果作出统计推断。进行比较,根据比较的结果作出统计推断。实际工作中,已将多种检验统计量的分布规律编实际工作中,已将多种检验统计量的分布规律编制出相应的界值表,只需用样本检验统计量的绝对制出相应的界值表,只需用样本检验统计量的绝对值查相应的界值表,将检验统计量的绝对值与界值值查相应的界值表,将检验统计量的绝对值与界值比较,即能得出比较,即能得出 P 值值 三、假设检验的两类错误三、假设检验的两类错误 当当H0为真,则为真,则H a是假的是假的 如果我们接受如果我们接受H0,我们就做对了,我们就做对了 如果我们拒绝如果我们拒绝H0,我们就犯了错误,我们

    32、就犯了错误(型错误型错误)定义定义 P(型错误型错误)=拒绝一个真实的零假设的概率拒绝一个真实的零假设的概率 这个概率用这个概率用表示,在第表示,在第3步选择显著性水平时就确步选择显著性水平时就确定了显著性水平是指在零假设为真的情况下,作为定了显著性水平是指在零假设为真的情况下,作为拒绝拒绝H0的稀有结果的度量使用的稀有结果的度量使用0.05,在脆玉米片例,在脆玉米片例子中意思就是说:当零假设为真时,收集子中意思就是说:当零假设为真时,收集20个样本里个样本里,有,有1个特别极端,因此我们怀疑个特别极端,因此我们怀疑H0的准确性并且拒的准确性并且拒绝它,导致犯了一个绝它,导致犯了一个型错误型错

    33、误.当当H0为假,则为假,则Ha是真的是真的 如果我们接受如果我们接受H0,我们就犯了错误,我们就犯了错误 如果我们拒绝如果我们拒绝H0,我们就做对了,我们就做对了 犯这种类型的错误称为犯这种类型的错误称为型错误(型错误(Type error)定义定义5.1 P(型错误型错误)=拒绝一个虚假的零假设的概率拒绝一个虚假的零假设的概率 这个概率用这个概率用表示,评价它困难多,因为它取决于下表示,评价它困难多,因为它取决于下面讨论的一些因素面讨论的一些因素事实上当事实上当H0为假的时候,拒绝为假的时候,拒绝H0的概率就是的概率就是1,称它为检验效率(,称它为检验效率(power of the tes

    34、t)见表)见表5.1表表4.5 检验检验H0的可能结果的可能结果 检验结果检验结果 真实情形未知真实情形未知 H0为真为真 H0为假为假接受接受H0 拒绝拒绝H0 决定正确决定正确 型错误型错误 1 型错误型错误 决定正确决定正确 1 因为显著水平因为显著水平是通过实验选择的,是通过实验选择的,是受实验控是受实验控制并且已知制并且已知因此,当你拒绝因此,当你拒绝H0时,你知道犯时,你知道犯型型错误的概率错误的概率如果接受如果接受H0,确定,确定型错误就更困难型错误就更困难这是因为确定这是因为确定型错误取决于很多因素,其中一型错误取决于很多因素,其中一些在试验中未知些在试验中未知于是拒绝于是拒绝

    35、H0更安全,因为犯错误更安全,因为犯错误的概率容易计算的概率容易计算 如果显著性水平是如果显著性水平是犯犯型错误的概率型错误的概率且在控制之下,为且在控制之下,为什么不定一个更小什么不定一个更小的显著性水平(的显著性水平(水水平)来消除或减少平)来消除或减少型错误呢?例型错误呢?例4.2中为什么不用中为什么不用1/10或或1/1000代替代替1/20呢?呢?有时我们希望做得有时我们希望做得严密,但是减少严密,但是减少水水平(平(型错误)始型错误)始终要增大犯终要增大犯型错型错误的概率误的概率 小结小结:在我们控制下,显著性水平:在我们控制下,显著性水平通常取通常取0.05、0.01或或 0.0

    36、01按照按照0.05拒绝拒绝H0,我们就说结果有显,我们就说结果有显著性,也就是与我们期望著性,也就是与我们期望H0为真有显著差异;按照为真有显著差异;按照0.01拒绝拒绝H0,我们就说结果有高度显著性;按照,我们就说结果有高度显著性;按照0.001拒绝拒绝H0,我们就说结果有非常高度显著性,我们就说结果有非常高度显著性在在一次假设检验里面,我们要么接受、要么拒绝零假一次假设检验里面,我们要么接受、要么拒绝零假设设如果我们拒绝如果我们拒绝H0,我们可能犯,我们可能犯型错误(拒绝型错误(拒绝一个真实的一个真实的H0),而如果我们接受),而如果我们接受H0,我们可能犯,我们可能犯型错误(接受一个假

    37、的型错误(接受一个假的H0)因为有两类错误,因为有两类错误,在任何决定里面都有犯这种错误的潜在可能,我们在任何决定里面都有犯这种错误的潜在可能,我们绝不能够说我们绝不能够说我们“证明证明”H0是真的或是真的或H0是假的是假的证证明暗指不可能有错误明暗指不可能有错误当我们接受当我们接受H0或拒绝或拒绝H0的时的时候,正确的说法应该是:资料支持零假设,或资料候,正确的说法应该是:资料支持零假设,或资料支持备择假设支持备择假设四、可信度和检验效能四、可信度和检验效能 1可信度可信度(confidence degree)(1)称可信度。)称可信度。若总体间确无差别,按若总体间确无差别,按水准能作出正确

    38、推断的概率水准能作出正确推断的概率为(为(1),或者说),或者说H0为真时,阴性结论的可信程度为真时,阴性结论的可信程度,即不发生,即不发生型错误的概率。型错误的概率。2检验效能检验效能(power of test)(1)称为检验效能或检称为检验效能或检出能力。若总体间确有差别,按出能力。若总体间确有差别,按检验水准能将真实存检验水准能将真实存在的差异检验出来的概率,也就是不犯假阴性错误的在的差异检验出来的概率,也就是不犯假阴性错误的概率为概率为(1),或者说,或者说H0为假为假(H1为真为真)时,阳性结论的时,阳性结论的可靠程度,即除去假阴性率有可靠程度,即除去假阴性率有(1)的把握得出差别

    39、的把握得出差别有显著性意义的结论,故有显著性意义的结论,故(1)又称为把握度又称为把握度 通常取通常取0.1或或0.2,此时检验效能为,此时检验效能为0.9或或0.8。一般检验效能不宜低于一般检验效能不宜低于0.75,否则可能出现非真实的,否则可能出现非真实的阴性结果。阴性结果。检验效能检验效能(1)的大小与总体间的差别、检验水准、的大小与总体间的差别、检验水准、标准差和样本含量有关:标准差和样本含量有关:(1)(1)被试因素的效应越大,被试因素的效应越大,H H0 0和和H H1 1涉及的不同总体间涉及的不同总体间差别越大,两者在分布上的重叠面积就越小。差别越大,两者在分布上的重叠面积就越小

    40、。(2)由图由图4-2可见,在分布的重叠面积固定时,可见,在分布的重叠面积固定时,与与 呈呈反向变化,反向变化,增大,增大,减小,则减小,则(1)增大,故增大增大,故增大可可提高检验效能提高检验效能(1)。然而,假设检验的目的大多数。然而,假设检验的目的大多数是希望提示被试因素的有效性高,应当要求是希望提示被试因素的有效性高,应当要求越小越越小越好。因此,实验设计时,必须兼顾好。因此,实验设计时,必须兼顾与与。(3)标准差愈大,变量的分布愈矮胖,比较组在分布标准差愈大,变量的分布愈矮胖,比较组在分布上的重叠面积愈大,上的重叠面积愈大,(1)就越小,因此,应严格控就越小,因此,应严格控制实验条件

    41、,减小个体差异,使标准差减小到合理制实验条件,减小个体差异,使标准差减小到合理水平。水平。(4)样本含量样本含量n增大,标准误增大,标准误=s/减小,均数的抽样误差减小,均数的抽样误差减小,分布趋于集中,减小,分布趋于集中,与与 都减小。由于适当增大样都减小。由于适当增大样本可使本可使型错误型错误与与型错误型错误 均减少,所以样本含量均减少,所以样本含量应适当大些。应适当大些。第五节第五节 假设检验应注意的问题(假设检验应注意的问题(P67P67页)页)1 1要有严密的抽样研究设计要有严密的抽样研究设计 这是假设检验的前提这是假设检验的前提,应保证样本是从同质总体中随机抽取的。组间的均,应保证

    42、样本是从同质总体中随机抽取的。组间的均衡性和可比性特别重要衡性和可比性特别重要 2选用的检验方法应符合应用条件。如正态分布两选用的检验方法应符合应用条件。如正态分布两均数比较(见第五章),不同条件下采用的检验方法均数比较(见第五章),不同条件下采用的检验方法、检验统计量公式、统计软件采用的分析模型是不同、检验统计量公式、统计软件采用的分析模型是不同的,见表的,见表4-4。3假设检验所作出的推断结论是概率性的,不是绝假设检验所作出的推断结论是概率性的,不是绝对的肯定或否定,拒绝对的肯定或否定,拒绝H0,不能认为,不能认为H0肯定不成立,肯定不成立,因为在因为在H0成立的条件下,出现有检验统计值及

    43、更极端成立的条件下,出现有检验统计值及更极端情况的概率虽小,但仍有存在的可能出现,只是可能情况的概率虽小,但仍有存在的可能出现,只是可能性很小而已;同理,不拒绝性很小而已;同理,不拒绝H0,不能认为,不能认为H0肯定成立肯定成立,所比较的总体可能确有差别,只是由于样本的含量,所比较的总体可能确有差别,只是由于样本的含量太少,未能检出这种差别。而且,拒绝太少,未能检出这种差别。而且,拒绝H0可产生第一可产生第一类错误,不拒绝类错误,不拒绝H0可产生第二类错误。可产生第二类错误。4P0.01比比P0.05更有理由拒绝更有理由拒绝H0(假阳性率较小假阳性率较小),而并不表示而并不表示P0.01时比时

    44、比P0.05时实际差别更大。例如时实际差别更大。例如表表4-5资料,可见在判断被试因素的有效性时,要求在资料,可见在判断被试因素的有效性时,要求在统计上和专业上都有意义,二者必须兼而有之。统计上和专业上都有意义,二者必须兼而有之。表表4-5 两降压试验结果两降压试验结果(mmHg)xx 组组 别别A试验试验 组组 别别B试验试验nst 值值P值值nst值值P值值对照对照组组10154.53.6 2.914 0.01 对照对照组组10151.620.0 2.297 0.05时,要注意差值时,要注意差值 D 与标准差与标准差 s 的比值的比值D/s,D/s可提示研究的价值,不同研究对可提示研究的价

    45、值,不同研究对D/s要求不同。例要求不同。例如完全随机设计的两样本均数比较,临床疗效研究一如完全随机设计的两样本均数比较,临床疗效研究一般要求般要求D/s大于大于0.5以上;动物实验大多要求以上;动物实验大多要求D/s大于大于0.7以上。若样本含量足够时,以上。若样本含量足够时,D/s 低于一般要求,低于一般要求,P0.05就应当作为阴性结果无须进一步增大样本含量就应当作为阴性结果无须进一步增大样本含量研究;若样本含量并不大,而研究;若样本含量并不大,而D/s又高于一般要求,又高于一般要求,则可适当增大样本含量研究。则可适当增大样本含量研究。7P只表明假阳性率超过只表明假阳性率超过,并未涉及假

    46、阴性率,并未涉及假阴性率的的大小,如果事先未考虑适当的样本含量,假设检验出大小,如果事先未考虑适当的样本含量,假设检验出现现P 时,应考虑是否检验效能偏低,检验效能(时,应考虑是否检验效能偏低,检验效能(1-)一般不能低于)一般不能低于0.8。第六节第六节 P 时假阴性率时假阴性率的估算(的估算(P69页)页)根据根据P推断差异无统计意义,实际上包含了真阴性与推断差异无统计意义,实际上包含了真阴性与假阴性两种可能性,究竟属于真阴性还是假阴性,需要假阴性两种可能性,究竟属于真阴性还是假阴性,需要估计假阴性率估计假阴性率,才能比较合理地判断。,才能比较合理地判断。在正态分布的条件下,可以通过在正态

    47、分布的条件下,可以通过u1值查标准正态曲线值查标准正态曲线下的面积表,来估算假阴性率下的面积表,来估算假阴性率。即先按式。即先按式(4.20)计算计算u1值;以值;以u1值查标准正态曲线下的面积表值查标准正态曲线下的面积表(见附表见附表1),从附表,从附表1中查出标准正态曲线下,中查出标准正态曲线下,u1所对应的面积所对应的面积数值;再用数值;再用1减减u1所对应的面积数值,即得假阴性率所对应的面积数值,即得假阴性率 的估算值。的估算值。u1=检验统计量检验统计量 t 值或值或 u 值的绝对值值的绝对值u (4.20)检验统计量为检验统计量为 F 值或值或 2 值时,可利用值时,可利用t 2=

    48、F、u2=2(1)的关系转化为的关系转化为 t 值或值或 u 值后再估算值后再估算 1 1配对试验的假阴性率估算配对试验的假阴性率估算 例例4.3 用用10对大鼠观察两种药物对股骨长度的影响,对大鼠观察两种药物对股骨长度的影响,结果两组平均差值为结果两组平均差值为4.5mm,差值的标准差为,差值的标准差为7.8mm,配对,配对 t 检验的检验的 t 值值=1.824,P 0.05,按,按=0.05水准不水准不能拒绝能拒绝H0,结论为两组差异无统计意义。判断此结论,结论为两组差异无统计意义。判断此结论的可靠性。的可靠性。为判断结论的可靠性,计算其配对为判断结论的可靠性,计算其配对 t 检验的假阴

    49、性率检验的假阴性率值,步骤如下:值,步骤如下:(1)从附表从附表3(标准正态曲线下的面积表标准正态曲线下的面积表)中查出双侧中查出双侧u0.05=1.96,(2)按式按式(4.20)计算计算u1:u1=检验统计量检验统计量t值值u0.05=1.8421.96=0.136 (3)以以0.136查附表查附表3,从附表,从附表3中查出标准正态曲线下,中查出标准正态曲线下,u值值0.136所对应的面积数值为所对应的面积数值为0.444,估计假阴性率,估计假阴性率=10.444=0.555。故尚不能接受差异无统计意义的结论,。故尚不能接受差异无统计意义的结论,根据样本差值根据样本差值D=4.5,标准差,

    50、标准差s=7.8,比值,比值D/s=0.5770.50,提示有研究的价值,所以建议增大样本含量,提示有研究的价值,所以建议增大样本含量研究。根据差值研究。根据差值D=4.5,若要求,若要求=0.05,=0.10,利用查,利用查表法或计算法,估计约需表法或计算法,估计约需34对。对。2 2两样本均数比较的假阴性率估算两样本均数比较的假阴性率估算 例例4.4 临床研究某药的疗效,用药组为临床研究某药的疗效,用药组为n=20,均数,均数标标准差准差=1.8741.000;对照组为;对照组为n=20,均数,均数标准差标准差=1.2001.067,成组,成组 t 检验的统计量检验的统计量t值值=2.06

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:研究生-统计学讲义-第3讲-总体均数估计和假设检验课件.ppt
    链接地址:https://www.163wenku.com/p-3406953.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库