医学统计学课件:第十章 非参数检验2014.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学课件:第十章 非参数检验2014.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学课件:第十章 非参数检验2014 医学 统计学 课件 第十 参数 检验 2014
- 资源描述:
-
1、非参数检验非参数检验 Nonparametric Statistics公共卫生学院公共卫生学院沈敏沈敏主要内容主要内容p基本概念基本概念p非参数检验适用的范围非参数检验适用的范围p非参数检验的优缺点非参数检验的优缺点p几种常用的非参数检验方法几种常用的非参数检验方法p小结小结基本概念基本概念p参数检验:参数检验:(parametric test):假定随机样本来自可用):假定随机样本来自可用有限个实参数刻画的总体有限个实参数刻画的总体(如正态分布如正态分布),并对总体参数并对总体参数(如如总体均数或率)进行的检验。总体均数或率)进行的检验。p在数据分析过程中,由于种种原因,人们往往无法对总在数
2、据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为中不涉及有关总体分布的参数,因而得名为“非参数非参数”检验检验(Nonparametric tests) 。非参数检验非参数检验(no
3、nparametric test)p不符合参数检验的适用条件,样本所代表总体的分布类不符合参数检验的适用条件,样本所代表总体的分布类型未知,对总体的分布或分布位置进行检验型未知,对总体的分布或分布位置进行检验,而不是针对而不是针对总体参数进行统计推断的方法,称为非参数检验,又称总体参数进行统计推断的方法,称为非参数检验,又称为任意分布检验(为任意分布检验(distribution-free test)。)。不考虑总体分布型,也不针对总体的参数进行检验不考虑总体分布型,也不针对总体的参数进行检验。 Nonparametric methods generally specify the hypot
4、hesis in terms of the population distribution rather than parameters such as the means and the standard deviations.pParametric assumptions are replaced by more general assumptions about the population distribution, and the ranks of the observations are often used in place of the actual measurement.A
5、ssumption and HypothesespThe purpose is to test the null hypothesis that a particular population has a hypothesized median M0pAssumption: nThe continuous random variable X is symmetric about a median X.nX1,X2,Xn denotes a random sample of size n from the distribution of X.nM0 denotes an hypothesized
6、 median for X. pHypotheses: H0:M=M0 versus H1: 非参检验的适用范围非参检验的适用范围 非参数检验非参数检验(Nonparametric tests)是统计分析方是统计分析方法的重要组成部分,它与参数检验共同构成统计推断法的重要组成部分,它与参数检验共同构成统计推断的基本内容。的基本内容。p总体分布为非正态(偏态)或分布类型不明的计量资总体分布为非正态(偏态)或分布类型不明的计量资料料p等级(有序)资料等级(有序)资料p数据两端无确定数值数据两端无确定数值p相互比较的各组变异程度相差悬殊相互比较的各组变异程度相差悬殊, ,即各总体方差不齐即各总体方差
7、不齐的计量资料的计量资料 非参数检验的主要优缺点非参数检验的主要优缺点优点优点:a. 是在于它不受总体分布的限制,适用范围广;是在于它不受总体分布的限制,适用范围广;b. 资料可用资料可用“等级等级”或或“符号符号”来评定,收集资料方便。来评定,收集资料方便。c.简简便易学便易学缺点缺点:对于适合用参数检验的资料,如用非参数检验会造对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,导致检验效率下降。犯成信息的丢失,导致检验效率下降。犯第二类错误第二类错误的概率的概率要比参数检验法为大。要比参数检验法为大。(H0不真时不真时,不能灵敏地拒绝不能灵敏地拒绝H0)几种常用非参数假设检验(几种
8、常用非参数假设检验(1 1)p配对设计和单样本资料的符号秩和检验配对设计和单样本资料的符号秩和检验(Wilcoxon Signed Rank Sum Test)p完全随机化设计两组独立样本资料的秩和检验完全随机化设计两组独立样本资料的秩和检验(Wilcoxon Rank Sum Test)n两组连续变量资料的秩和检验两组连续变量资料的秩和检验n两组有序变量资料的秩和检验两组有序变量资料的秩和检验几种常用非参数假设检验(几种常用非参数假设检验(2 2)p完全随机化设计多组独立样本的秩和检验完全随机化设计多组独立样本的秩和检验(Kruskal-Wallis test)n多组连续变量资料的秩和检验多
9、组连续变量资料的秩和检验n多组有序变量资料的秩和检验多组有序变量资料的秩和检验p随机化区组设计资料的秩和检验随机化区组设计资料的秩和检验(friedman test)p多个样本间的多重比较多个样本间的多重比较一、配对设计资料的符号秩和检验一、配对设计资料的符号秩和检验(Wilcoxon Signed Rank test)p例例1 1 为研究孪生兄弟出生先后对智力是否存在差为研究孪生兄弟出生先后对智力是否存在差异异, , 对对1212对双胞胎兄弟进行某项心理测试对双胞胎兄弟进行某项心理测试, , 其测其测试得分结果见表。试得分结果见表。表表 1 121 12 对双胞胎兄弟心理测试结果对双胞胎兄弟
10、心理测试结果 对子号对子号 先出生者得分先出生者得分 后出生者得分后出生者得分 差差 值值 绝对差值秩次绝对差值秩次 秩次秩次 i xi yi di =yi -xi Ri Ri (1) (2) (3) (4) (5) (6) 1 86 88 2 3 3 2 71 77 6 7 7 3 77 76 -1 1.5 -1.5 4 68 64 -4 4 -4 5 91 96 5 5.5 5.5 6 72 72 0 - - 7 77 65 -12 10 -10 8 91 90 -1 1.5 -1.5 9 70 65 -5 5.5 -5.5 10 71 80 9 9 9 11 88 81 -7 8 -8
11、12 87 72 -15 11 -11 1 1、方法步骤:、方法步骤:v(1) 建立检验假设,确定检验水准建立检验假设,确定检验水准 假设:假设:H0: Md= 0 即差值的总体中位数等于零即差值的总体中位数等于零 H1:Md0 即差值的总体中位数不等于零即差值的总体中位数不等于零v(2)求差值)求差值 求各对数据求各对数据Xi Yi的差值的差值 di=Xi-Yi,v(3)编秩:)编秩: a. 差值按绝对值从小到大排序,编以秩次,根据差值的差值按绝对值从小到大排序,编以秩次,根据差值的正负号冠以正负号正负号冠以正负号。 b. 编秩次时遇零舍去不计,编秩次时遇零舍去不计,遇有差值绝对值相等遇有差
12、值绝对值相等(称为相称为相持持),编以平均秩次,如果符号相同可以不取平均秩次。,编以平均秩次,如果符号相同可以不取平均秩次。v(4)求秩和,并确定检验统计量)求秩和,并确定检验统计量Tv求正负差值秩次之和,分别用求正负差值秩次之和,分别用T+或或T-表示表示v任取任取T+或或T-作为检验统计量作为检验统计量T*(有的书上要求小的秩和,有的书上要求小的秩和,因为只按小的秩和编制界值表因为只按小的秩和编制界值表)。)。 T+=24.5, T-=41.5 v验证验证:T+ +T-=n(n+1)/2, n为差值不等于为差值不等于0的对子数的对子数v(5)确定)确定P值和作出推断结论。值和作出推断结论。
13、 当当n25(或(或50)时,查附表,配对设计用的)时,查附表,配对设计用的T界值表。界值表。v若若T*值在上下界值范围内,其值在上下界值范围内,其p值大于表上相应概率水平值大于表上相应概率水平v若若T*值在上下界值范围外,则其值在上下界值范围外,则其p值小于表上相应概率水平值小于表上相应概率水平2、正态近似法、正态近似法p当当n25(或(或50),可用秩和分布的正态近似法进行),可用秩和分布的正态近似法进行u检检验:验:TN),(2TT24/ ) 12)(1(5 . 04/ ) 1(nnnnnTu48)(24) 12)(1(5 . 04/ ) 1(3jjttnnnnnTu当相同差值较多时(不
14、包括当相同差值较多时(不包括0 0),用下式校正),用下式校正式中式中tj为第为第j个相同差值组的相同差值的个数个相同差值组的相同差值的个数.得出得出u值后按值后按u界值确定界值确定P的范围的范围 符号秩和检验的基本思想符号秩和检验的基本思想p如果如果H0成立,即差值的总体中位数为成立,即差值的总体中位数为0,由于抽,由于抽们误差的存在,则理论上样本的正负秩和应不一们误差的存在,则理论上样本的正负秩和应不一定相等,但差别不大,即定相等,但差别不大,即T值应为总秩和值应为总秩和n(n+1)/2的一半,即的一半,即T=n(n+1)/4pT与与n(n+1)/4的相差太大,超过了抽样误差可以的相差太大
15、,超过了抽样误差可以解释的范围时,相应的解释的范围时,相应的P值越小,当值越小,当 P时,有时,有理由拒绝理由拒绝H0二、单样本资料的符号秩和检验二、单样本资料的符号秩和检验p例:已知某地正常人尿氟含量为例:已知某地正常人尿氟含量为2.15mmol/L。今。今该地某厂随机抽取该地某厂随机抽取12名工人,测得尿氟含量名工人,测得尿氟含量mmol/L,结果见下表。问该厂工人的尿氟含量是,结果见下表。问该厂工人的尿氟含量是否高于当地正常人?否高于当地正常人?表表 12名工人尿氟含量测定结果名工人尿氟含量测定结果尿氟含量尿氟含量X差值差值d秩次秩次尿氟含量尿氟含量X差值差值d秩次秩次2.1502.62
16、0.4762.10-0.05-2.52.720.5772.200.052.52.990.8482.12-0.03-13.191.0492.420.2743.371.22102.520.2754.572.4211p求差值求差值d=xi-M0p p对这些差值进行正态性检验,对这些差值进行正态性检验,W=0.8380, P0.03,因此,因此不满足不满足t检验关于样本来自正态分布的条件,宜用检验关于样本来自正态分布的条件,宜用Wilcoxon符号秩和检验符号秩和检验7141. 0,5975. 0dsd假设检验过程假设检验过程p(1)建立检验假设)建立检验假设 ,确定检验水准,确定检验水准 H0:差值
17、的总体中位数等于:差值的总体中位数等于0,即,即Md=0 H1:差值的总体中位数等于:差值的总体中位数等于0,即,即Md0 =0.05p(2)求差值并编秩:对差值的绝对值编秩)求差值并编秩:对差值的绝对值编秩p(3)求正负秩和并确定检验统计量:)求正负秩和并确定检验统计量:pT+=62.5, T-=3.5p验证:验证:T+T-=n(n+1)/2,n为差值不等于为差值不等于0的对子数的对子数p确定样本统计量确定样本统计量T*=min(T+,T-)p(4)确定)确定p值并做出统计推断:值并做出统计推断:n查表法查表法:n=11,T=3.5,查配对设计用,查配对设计用T界值表得界值表得pTU 0.0
展开阅读全文