秩转换非参数检验-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《秩转换非参数检验-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 转换 参数 检验 课件
- 资源描述:
-
1、秩转换的非参数检验秩转换的非参数检验 参数检验:参数检验:总体分布为已知的数学形式,对总体分布为已知的数学形式,对其总体参数做假设检验。其总体参数做假设检验。非参数检验:非参数检验:是针对参数检验而言的,不是针对参数检验而言的,不依赖于总体分布的一种假设检验方法,它直接依赖于总体分布的一种假设检验方法,它直接对总体分布进行假设,不受总体分布的限制,对总体分布进行假设,不受总体分布的限制,适用范围广,而且简便易学。适用范围广,而且简便易学。参数统计方法的局限性参数统计方法的局限性v必须要先对总体分布进行确定,当总体分布未知,或分必须要先对总体分布进行确定,当总体分布未知,或分布不符合要求时无法使
2、用。布不符合要求时无法使用。例:住院时间例:住院时间v结果为有序分类变量时无法使用。结果为有序分类变量时无法使用。例:尿糖检测结果例:尿糖检测结果v样本数据两端有不确定值时无法使用。样本数据两端有不确定值时无法使用。例:仪器性能限制,超出可测量范围例:仪器性能限制,超出可测量范围以上情况下强行使用参数统计方法可能会得到错误结论以上情况下强行使用参数统计方法可能会得到错误结论 非参数检验一般不直接用样本观察值作分析,统非参数检验一般不直接用样本观察值作分析,统计量的计算基于原数据在整个样本中按大小所占位计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数值,而只保留其大次。由
3、于丢弃了观察值的具体数值,而只保留其大小次序的信息,凡适合参数检验的资料,应首选参小次序的信息,凡适合参数检验的资料,应首选参数检验。但不清楚是否适合参数检验的资料,则应数检验。但不清楚是否适合参数检验的资料,则应采用非参数检验;尤其对于难以确定分布又出现少采用非参数检验;尤其对于难以确定分布又出现少量异常值的小样本数据,非参数检验在剔除这些数量异常值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出其较好的稳健性。据前后所得结论显示出其较好的稳健性。非参数检验的适用范围:非参数检验的适用范围:计量资料不满足正态或方差齐性条件计量资料不满足正态或方差齐性条件 对于分布不知是否正态的小样本
4、资料对于分布不知是否正态的小样本资料 对于一端或两端无确定数值的资料对于一端或两端无确定数值的资料 等级资料进行等级强度差别的比较等级资料进行等级强度差别的比较非参数方法的特点:非参数方法的特点:v适用范围广,几乎可用于任何情况。适用范围广,几乎可用于任何情况。v当资料符合参数检验方法的适用条件时,当资料符合参数检验方法的适用条件时,使用非参数方法的检验效能较低。使用非参数方法的检验效能较低。v原因:无法借助总体分布得到许多推论,原因:无法借助总体分布得到许多推论,本身在利用信息上就有丢失本身在利用信息上就有丢失型错误和型错误和型错误型错误 由样本推断的结果由样本推断的结果 真实结果真实结果
5、拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 推断正确推断正确(1(1)H H0 0不成立不成立 推断正确(推断正确(1 1)型错误型错误(1 1)即)即把握度把握度(检验效能检验效能)(power of a power of a test):test):两总体确有差别,在两总体确有差别,在检验水准下检验水准下,被检被检出有差别的能力出有差别的能力(1 1)即)即可信度可信度(confidence level):confidence level):重复重复抽样时,样本区间包含总体参数(抽样时,样本区间包含总体参数(m m)的百分数的百分数已知已知总体分布类
6、型总体分布类型,对,对未知参数(未知参数(、)进进行统计推断行统计推断依赖于特定分布类依赖于特定分布类型,型,比较的是参数比较的是参数 参数统计参数统计(parametric statisticsparametric statistics)非参数统计非参数统计(nonparametric statisticsnonparametric statistics)对总体的分布类对总体的分布类型型不作任何要求不作任何要求 不受总体参数的影响,不受总体参数的影响,比较分布或分布位置比较分布或分布位置 优点:优点:1.1.适用范围广适用范围广2.2.简便,易于掌握简便,易于掌握缺点:对于符合参数统计分析缺
7、点:对于符合参数统计分析条件者,采用非参数统计分析,条件者,采用非参数统计分析,其其检验效能较低检验效能较低 预备知识预备知识 v分析方法心中有数:分析方法心中有数:当手中有了数据,首先要对它进行充分、直观的了解,当手中有了数据,首先要对它进行充分、直观的了解,直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进行探索,避免因对数据的特性缺乏了解而盲目使用一些方法行探索,避免因对数据的特性缺乏了解而盲目使用一些方法作出错误的或不合理的结论。作出错误的或不合理的结论。如果能使用参数方法,当然还是参数方法更好一些,参如果能使用参数方法,当然还是参
8、数方法更好一些,参数法效能高,方法多。数法效能高,方法多。预备知识预备知识v秩秩(Rank)(Rank):对于样本,按由小到大排成一列,若数据对于样本,按由小到大排成一列,若数据X X在这在这一列中占据第一列中占据第i i位,称位,称X X的秩为的秩为R Ri i 实际上就像是考试成绩的排名,只不过倒了过来实际上就像是考试成绩的排名,只不过倒了过来v相同秩(相同秩(TiesTies,得分相同,不分胜负,平手,得分相同,不分胜负,平手):在许多情况在许多情况下,数据中会有相同的值出现,此时如果排秩的话就会出现下,数据中会有相同的值出现,此时如果排秩的话就会出现同秩的现象,这种情况被称为数据中的相
9、同秩。同秩的现象,这种情况被称为数据中的相同秩。如:考试成绩的并列第三名如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序在默认情况下,秩和检验中的相同秩为它们按大小顺序排列后所处位置的平均值。排列后所处位置的平均值。秩转换的非参数检验(秩和检验),首先秩转换的非参数检验(秩和检验),首先将观察值从小到大,或者等级从弱到强转换为将观察值从小到大,或者等级从弱到强转换为秩次后,再计算统计量,这种秩次后,再计算统计量,这种用数据的秩代替用数据的秩代替原始数据进行假设检验的方法称为秩和检验原始数据进行假设检验的方法称为秩和检验。秩和检验对总体分布的形状差别不敏感,只对秩和检验
10、对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。总体分布的位置差别敏感。非参数检验的方法很多,有符号检验、游程非参数检验的方法很多,有符号检验、游程检验、等级相关分析、秩和检验等。秩转换的检验、等级相关分析、秩和检验等。秩转换的非参数检验(秩和检验)是在非参数检验中占非参数检验(秩和检验)是在非参数检验中占有重要地位且检验功效高的一种方法。有重要地位且检验功效高的一种方法。第一节配对样本比较的第一节配对样本比较的WilcoxonWilcoxon符号秩检验符号秩检验第二节两个独立样本比较的第二节两个独立样本比较的WilcoxonWilcoxon秩和检验秩和检验第三节第三节 完全随机设计多
11、个样本比较完全随机设计多个样本比较KruskalKruskalWallis Wallis H H检验检验第四节第四节 随机区组设计多个样本比较的随机区组设计多个样本比较的Friedman Friedman M M 检验检验第一节第一节 配对样本比较的配对样本比较的WilcoxonWilcoxon符号秩检验符号秩检验 WilcoxonWilcoxon符号秩检验可用于符号秩检验可用于1.1.配对样本差值的中位数与配对样本差值的中位数与0 0的比较的比较2.2.单个样本中位数和已知的一个总体中位数比较。单个样本中位数和已知的一个总体中位数比较。一、配对样本差值的中位数与一、配对样本差值的中位数与0
12、0的比较的比较 比较目的是推断配对样本差值得总体中位数是比较目的是推断配对样本差值得总体中位数是否为否为0 0,也可以说是推断配对的两个相关样本所来,也可以说是推断配对的两个相关样本所来自的两个总体中位数是否相等。自的两个总体中位数是否相等。例例8-18-1 对对1212份血清分别用原方法(检测时间份血清分别用原方法(检测时间2020分分钟)和新方法(检测时间钟)和新方法(检测时间1010分钟)测谷分钟)测谷-丙转氨酶,丙转氨酶,结果见表结果见表8-18-1的的(2)(2)、(3)(3)栏。问两法所得结果有无栏。问两法所得结果有无差别?差别?表表8-1 128-1 12份血清用原法和新法测血清
13、谷份血清用原法和新法测血清谷-丙转氨酶的比较丙转氨酶的比较编号编号 原法原法新法新法差值差值正秩正秩负秩负秩 1 1 6060 7676 16 16 8 8 2 2142142152152 10 10 5 5 3 3195195243243 48 481111 4 4 8080 8282 2 2 1.5 1.5 5 5242242240240-2-2 1.5 1.5 6 6220220220220 0 0 7 7190190205205 15 15 7 7 8 8 2525 3838 13 13 6 6 9 9198198243243 45 45 9 91010 3838 4444 6 6 4
14、 41111236236190190-46-46101012129595100100 5 5 3 3合计合计-54.554.5 11.5 11.5 本例为配对实验设计,对其差值进行正态性检本例为配对实验设计,对其差值进行正态性检验:验:W W=0.875=0.875,P P=0.076=0.076,不满足正态性的条件,使,不满足正态性的条件,使用符号秩检验。用符号秩检验。1 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:差值的总体中位数为:差值的总体中位数为0 0,M Md d=0=0 H H1 1:差值的总体中位数不为:差值的总体中位数不为0 0,M Md d00 =0.0
15、5=0.052 2。计算统计量。计算统计量T T 省略所有差值为省略所有差值为0 0的对子,令余下的有效对子的对子,令余下的有效对子数为数为n n本例本例n n=11=11 对剩余的差值的绝对值从小到大编秩,并根对剩余的差值的绝对值从小到大编秩,并根据差值的正负号标上符号。编秩时遇到绝对值相据差值的正负号标上符号。编秩时遇到绝对值相同时取平均秩次。同时取平均秩次。分别求正负秩次之和,用分别求正负秩次之和,用T T+和和T T-表示,并任选表示,并任选正秩和或负秩和作为统计量值。正秩和或负秩和作为统计量值。本例本例T T=T T-=11.5=11.53.3.确定确定P P值,作出统计推断值,作出
16、统计推断 查表法:查表法:n5050查界值表,若查界值表,若T T在上下界值范在上下界值范围内,围内,P P大于表中上方对应的概率水平;若大于表中上方对应的概率水平;若T T等于等于上侧界值或下侧界值,上侧界值或下侧界值,P P近似等于表中上方对应近似等于表中上方对应的概率水平;若的概率水平;若T T不在上下界值范围内,不在上下界值范围内,P P小于表小于表中上方对应的概率水平。中上方对应的概率水平。本例本例n n=11,=11,T T=T T-=11.5=11.5,查界值表:,查界值表:0.050.05P P0.105050超出界值表的范围时,超出界值表的范围时,可以使用正态近似法作可以使用
17、正态近似法作u u检验。检验。31 41212448jjTn nuttn nnt tj j为第为第j j个相同秩次的个数个相同秩次的个数 如:相同秩中有如:相同秩中有2 2个个1.51.5,5 5个个8 8,3 3个个1414,则,则t1 1=2,=2,t t3 3=5,=5,t t3 3=3=3例例 配对比较甲、乙两种方法治疗扁平足效果,记录配对比较甲、乙两种方法治疗扁平足效果,记录如下,问两种疗法是否有差别?如下,问两种疗法是否有差别?两种疗法的治疗结果两种疗法的治疗结果病例号病例号1 12 23 34 45 56 67 78 89 91010 111112121313甲甲好好好好好好 好
18、好 差差 中中 好好好好中中 差差 好好差差中中乙乙差差差差好好 中中 中中 差差 中中差差中中 差差 好好好好差差配对的等级资料配对的等级资料 符号秩和检验若用于配对等级资料,则应先将符号秩和检验若用于配对等级资料,则应先将等级从弱到强赋值,然后再进行符号秩检验。但等级从弱到强赋值,然后再进行符号秩检验。但对于等级资料,相同秩次多,小样本的检验结果对于等级资料,相同秩次多,小样本的检验结果会存在偏差,最好为大样本。会存在偏差,最好为大样本。两种疗法的治疗结果两种疗法的治疗结果病例号病例号1 12 23 34 45 56 67 78 89 91010 111112121313甲甲好好好好好好
19、好好 差差 中中 好好好好中中 差差 好好差差中中赋值赋值3 33 33 33 31 12 23 33 32 21 13 31 12 2乙乙差差差差好好 中中 中中 差差 中中差差中中 差差 好好好好差差赋值赋值1 11 13 32 22 21 12 21 12 21 13 33 31 1差值差值2 22 20 01 1-1-11 11 12 20 00 00 0-2-21 1秩次秩次7.57.5 7.57.53 3-3-33 33 37.57.5-7.5-7.53 31 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:差值的总体中位数为:差值的总体中位数为0 0,M Md d
20、=0=0 H H1 1:差值的总体中位数不为:差值的总体中位数不为0 0,M Md d00 =0.05=0.052 2。计算统计量。计算统计量T TT T+=34.5 =34.5 T T-=10.5 =10.5 T T=10.5 =10.5 3.3.确定确定P P值,作出统计推断值,作出统计推断n n=9,=9,T T=T T-=10.5=10.5,查界值表:,查界值表:P P0.100.10 按按=0.05=0.05的水准,不拒绝的水准,不拒绝H H0 0,还不能认为两,还不能认为两法治疗扁平足效果不同。法治疗扁平足效果不同。二、单样本中位数与总体中位数的比较二、单样本中位数与总体中位数的比
21、较 比较目的是推断样本来自的总体中位数比较目的是推断样本来自的总体中位数M M和某个和某个已知的总体中位数已知的总体中位数M M0 0是否相等。即推断样本各变量是否相等。即推断样本各变量值和值和M M0 0差值的总体中位数是否为差值的总体中位数是否为0 0。例例8-28-2 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30mol/L45.30mol/L 。今在该地某厂随机抽取。今在该地某厂随机抽取1212名工人,名工人,测得尿氟含量见表测得尿氟含量见表8-28-2第(第(1 1)栏。问该厂工人的尿)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?氟含量是否高于当
22、地正常人的尿氟含量?对工人尿氟含量进行正态性检验得对工人尿氟含量进行正态性检验得W W=0.845=0.845,P P=0.032=0.032,不满足正态性的条件,使用符号秩检验。,不满足正态性的条件,使用符号秩检验。表表8-2 128-2 12名工人的尿氟含量(名工人的尿氟含量(molmol/L/L)与)与45.3045.30比较比较尿尿 氟氟 含含 量量(1 1)45.3045.30正正 秩秩负负 秩秩44.2144.21-1.091.091.51.545.3045.30 0 046.3946.39 1.09 1.09 1.51.549.4749.47 4.17 4.17 3 351.05
23、51.05 5.75 5.75 4 453.1653.16 7.86 7.86 5 553.2653.26 7.96 7.96 6 654.3754.37 9.07 9.07 7 757.1657.1611.8511.85 8 867.3767.3722.0722.07 9 971.0571.0525.7525.75101087.3787.3742.0742.071111合合 计计64.564.51.51.51 1。建立假设并确定检验水准建立假设并确定检验水准 H H0 0:该厂工人尿氟含量的总体中位数为:该厂工人尿氟含量的总体中位数为45.3045.30 H H1 1:该厂工人尿氟含量的总体
24、中位数大于:该厂工人尿氟含量的总体中位数大于45.3045.30 =0.05=0.052 2。计算统计量。计算统计量T TT T+=64.5 =64.5 T T-=1.5 =1.5 T T=1.5 =1.5 3 3。确定确定P P值,作出统计推断值,作出统计推断n n=11,=11,T T=T T-=1.5=1.5,查界值表:,查界值表:P P0.0050.005 按按=0.05=0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,可以认,可以认为该厂工人尿氟含量高于当地正常人。为该厂工人尿氟含量高于当地正常人。第二节第二节 两个独立样本比较的两个独立样本比较的Wilcoxo
25、nWilcoxon秩和检验秩和检验 两组独立样本比较的秩和检验两组独立样本比较的秩和检验(WilcoxonWilcoxon秩和检验秩和检验),目的是推断计量资料或等级资料的两个独立样本代表目的是推断计量资料或等级资料的两个独立样本代表的两个总体分布是否有差别。的两个总体分布是否有差别。理论上理论上H H0 0为两总体分布相同,即两样本来自同一总为两总体分布相同,即两样本来自同一总体;体;H H1 1为两总体分布不同。由于秩和检验对两总体分为两总体分布不同。由于秩和检验对两总体分布形状的差别不敏感,对位置相同、形状不同但类似布形状的差别不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总
展开阅读全文