参数统计和非参数统计课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《参数统计和非参数统计课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 课件
- 资源描述:
-
1、医疗等本科生医疗等本科生医疗等本科生医学统计学医学统计学医学统计学第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室对于符合参数统计分析条件者,采用对于符合参数统计分析条件者,采用非参数统计分析,其非参数统计分析,其检验效能较低检验效能较低 参数检验与非参数检验s在总体的分布类型已知的条件下,对在总体的分布类型已知的条件下,对总体的参数总体的参数进行进行检验,称为检验,称为参数检验参数检验。s在总体的分布类型未知或者不考虑总体的分布的条件在总体的分布类型未知或者不考虑总体的分布的条件下,对下,对总体的分布总体的分布进行检验,称为进行检验,称为非参数检验非参数检
2、验。非参数统计方法非参数统计方法s适用范围广,特别适用于:适用范围广,特别适用于:s1.数据分布未知、偏态分布、组间的方差不齐、资数据分布未知、偏态分布、组间的方差不齐、资料中含有不确定值的料中含有不确定值的计量资料计量资料组间的比较。组间的比较。s2.当比较的数据只能用严重程度、优劣等级的当比较的数据只能用严重程度、优劣等级的半定半定量量(等级)资料组间的比较。(等级)资料组间的比较。s上述数据组间比较的统计检验方法上述数据组间比较的统计检验方法秩和检验秩和检验对于计量资料,若不满足正态和方差齐性条件,这对于计量资料,若不满足正态和方差齐性条件,这时小样本资料选时小样本资料选t检验或检验或F
3、检验是不妥的,而选秩转检验是不妥的,而选秩转换的非参数检验是恰当的。换的非参数检验是恰当的。对于分布不知是否正态的小样本资料,为保险起见对于分布不知是否正态的小样本资料,为保险起见,宜选秩转换的非参数检验。,宜选秩转换的非参数检验。注注 意意对于一端或二端是不确定数值(如对于一端或二端是不确定数值(如0.5等)等)的资料,不管是否正态分布,只能选秩转换的非参的资料,不管是否正态分布,只能选秩转换的非参数检验。数检验。对于等级资料,若选行对于等级资料,若选行列表资料的列表资料的2 2检验,只检验,只能推断构成比差别,而选秩转换的非参数检验,可能推断构成比差别,而选秩转换的非参数检验,可推断等级强
4、度差别。推断等级强度差别。 秩次与秩和 s秩次秩次(rank),秩统计量,秩统计量 是指全部观察值按某种顺序排列的位序;是指全部观察值按某种顺序排列的位序;s秩和秩和(rank sum) 同组秩次之和。同组秩次之和。编 秩 A组: 、 、+、+、+、+B组: +、+、+、+、+、+A组:组:- + + + +B组:组: + + + + + + 1 2 3 4 5 76 8 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.5 秩和s A组:组: 、 、+、+、+、 + 秩和:秩和: 1 2 4.5 4.5 4.5 8.5 TA25 s
5、B组:组: +、+、+、+、+、+ 秩和:秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB53 TA+TB=N(N+1)/2=78s秩次:在一定程度上反映了等级的高低;秩次:在一定程度上反映了等级的高低;s秩和:在一定程度上反映了等级的分布位置。秩和:在一定程度上反映了等级的分布位置。s对等级的分析,转化为对秩次的分析。秩和检验对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。就是通过秩次的排列求出秩和,进行假设检验。其特点是假设检验的结果对总体分布的形状差别其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。不敏感,
6、只对总体分布的位置差别敏感。 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第一节第一节 配对样本比较的配对样本比较的 Wilcoxon符号秩检验符号秩检验 用于配对样本差值的中位数和用于配对样本差值的中位数和0比较;还比较;还可用于单个样本中位数和总体中位数比较。可用于单个样本中位数和总体中位数比较。 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室 例例8-1 对对12份血清分别用原方法(检测时间份血清分别用原方法(检测时间20分钟)和新方分钟)和新方法(检测时间法(检测时间10分钟)测谷分钟)测谷-丙转氨酶,结果见
7、表丙转氨酶,结果见表8-1的(的(2)、)、(3)栏。问两法所得结果有无差别?)栏。问两法所得结果有无差别? 1H0:差值的总体中位数:差值的总体中位数Md=0 H1:差值的总体中位数:差值的总体中位数Md 0; =0.052求差值;依其绝对值从小到大编秩次求差值;依其绝对值从小到大编秩次(i)绝对值相等者()绝对值相等者(tie)取平均秩次;)取平均秩次;(ii) 将差值的正负标在秩次之前;将差值的正负标在秩次之前;(iii)零差值时秩次正负各半(或不参与编秩)零差值时秩次正负各半(或不参与编秩)3分别求正、负秩次之和,以绝对值较小者为分别求正、负秩次之和,以绝对值较小者为T值值4根据统计量
8、根据统计量T确定对应的确定对应的P值值(i)小样本时,查表(附表)小样本时,查表(附表9) (ii) 大样本时,正态近似大样本时,正态近似 符号秩和检验的基本思想总秩和为总秩和为TN(N+1)/2如如H0成立,则正负各半,成立,则正负各半,T+ 与与 T 均接近均接近 N(N+1)/4。如果相差太大,超出了事先规定的界值,如果相差太大,超出了事先规定的界值, 则则H0不成立。不成立。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室(i)小样本()小样本(n50)时,查附表)时,查附表9 界值的判断标准:界值的判断标准:若值在T上、下界值范围内时,时,P0.0
9、5,若T值恰好等于界值时时, P=0.05若T值在上、下界值范围外时,时,P50)时,可采用正态近似)时,可采用正态近似 n是对子数是对子数, ,t tj j为第为第j j个个相同秩次的个数。相同秩次的个数。 本例本例T=11.5,n=11;相同秩次中有两个;相同秩次中有两个1.51.5,则,则t t=2=2,代入上式计算得:,代入上式计算得: u u 1.96, 0.05,在,在 水准上接受水准上接受H H0 0,拒绝,拒绝H H1 1,结论与查,结论与查表法相同。表法相同。 05. 00H1H05. 048)(24) 12)(1(4/ ) 1(3jjttnnnnnTu91. 148)22(
10、24) 1112)(111(114/ ) 111(115 .113u 注意注意: : 符号秩检验若用于配对的等级资料,则先把等符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(级从弱到强转换成秩(1,2,3,);然后求各对秩的);然后求各对秩的差值,省略所有差值为差值,省略所有差值为0的对子数,令余下的有效对的对子数,令余下的有效对子数为子数为n n;最后按;最后按n n个差值编正秩和负秩,求正秩和个差值编正秩和负秩,求正秩和或负秩和。但对于等级资料,相同秩多,小样本的或负秩和。但对于等级资料,相同秩多,小样本的检验结果会存在偏性,最好用大样本。检验结果会存在偏性,最好用大样本。 2
11、单个样本中位数和总体中位数比较单个样本中位数和总体中位数比较 目的是推断样本所来自的总体中位数目的是推断样本所来自的总体中位数M和某个和某个已知的总体中位数已知的总体中位数M0是否有差别。用样本各变量是否有差别。用样本各变量值和值和M0的差值,即推断差值的总体中位数的差值,即推断差值的总体中位数M和和0是是否有差别。否有差别。 例例8-2 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30。今在。今在该地某厂随机抽取该地某厂随机抽取12名工人,测得尿氟含量见表名工人,测得尿氟含量见表8-2第第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的)栏。问该厂工人的尿氟含量是
12、否高于当地正常人的尿氟含量?尿氟含量? mol/L表表8-2 某某厂厂12名名工工人人的的尿尿氟氟含含量量(mol/L)与与45.30比比 较较 尿尿氟氟含含量量 (1) 45.30 按按 绝绝 对对 值值 编编 秩秩 (1) (2) 正正 秩秩 (3) 负负 秩秩 (4) 44.21 -1.09 1.5 45.30 0.00 46.39 1.09 1.5 49.47 4.17 3 51.05 5.75 4 53.16 7.86 5 53.26 7.96 6 57.37 12.07 7 63.16 17.86 8 67.37 22.07 9 71.05 25.75 10 87.37 42.07
13、 11 合合 计计 64.5 1.5 解解:1.检验假设和检验水准检验假设和检验水准:H0:该厂工人尿氟含量的总体中位数:该厂工人尿氟含量的总体中位数M=45.30=45.30H1:M45.3045.30=0.05=0.052.2.编秩、求统计量编秩、求统计量T: :所有观察值与总体中位数所有观察值与总体中位数45.3045.30之差,按绝对值由小到之差,按绝对值由小到大编秩,绝对值相同取平均秩次,然后分别计算正负秩大编秩,绝对值相同取平均秩次,然后分别计算正负秩次之和,即表次之和,即表8-2第(第(3)、()、(4)栏。)栏。0H45.30M 1H45.30M 0.051.5T 11n 11
14、n 1.5T 0.005P 0.050H1H据表据表8-2第(第(3)、()、(4)栏,)栏,T T+ +=64.5=64.5,T T- -=1.5=1.5,取取T T=1.5=1.5。3.3.查表、做结论查表、做结论有效差值个数有效差值个数n n=11=11。据。据n n=11=11和和T T=1.5=1.5查附表查附表9,得单侧,得单侧P P0.050.05,按,按=0.05=0.05水准拒绝水准拒绝H H0 0 ,接受,接受H H1 1 ,可认为该厂,可认为该厂工人的尿氟含量高于当地正常人的尿氟含量。工人的尿氟含量高于当地正常人的尿氟含量。 0H45.30M 1H45.30M 0.051
15、.5T 11n 11n 1.5T 0.005P 0.050H1H第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室第二节第二节 两独立样本差别的秩和检验两独立样本差别的秩和检验Wilcoxon rank sum test 对于计量数据,如果资料对于计量数据,如果资料方差相等方差相等,且服从,且服从正态正态分布,就可以用分布,就可以用t检验比较两样本均数。检验比较两样本均数。如如果此假定不成立或不能确定是否成立,就应采用果此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总体。秩和检验来分析两样本是否来自同一总体。 Wilcoxon秩和检验
16、(秩和检验(Wilcoxon rank sum test),用于推用于推断计量资料或等级资料的两个独立样本所来自的两个总体分断计量资料或等级资料的两个独立样本所来自的两个总体分布是否有差别。布是否有差别。 秩和检验的目的是推断两个总体分布的位置是否有差别,秩和检验的目的是推断两个总体分布的位置是否有差别,如要推断两个不同人群的某项指标值的大小是否有差别或哪如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。两个总体分布位置不同,实其指标值分布的形状有无差别。两个总
17、体分布位置不同,实际情况一般是两个总体分布形状相同或类似,这时可简化为际情况一般是两个总体分布形状相同或类似,这时可简化为两个总体中位数不等;两个总体中位数不等; 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室基本思想基本思想两样本来自同一总体两样本来自同一总体 任一组秩和不应太大或太小任一组秩和不应太大或太小 如果两如果两总体分总体分布相同布相同 假定:两组样本的总体分布形状相同假定:两组样本的总体分布形状相同 T T 与与平均平均秩和秩和 应相差不大应相差不大 2/ )1 (0Nn212121),min( ,nnRRnnT较小例数组的秩和),min(2
18、1021nnnnnN 表表85 肺肺 癌癌 病病 人人 和和 矽矽 肺肺0期期 工工 人人 的的RD值值 (cm )比比 较较 肺肺 癌癌 病病 人人 矽矽 肺肺0 0期期 工工 人人 R RD D值值 秩秩 R RD D值值 秩秩 2.78 1 3.23 2.5 3.23 2.5 3.50 4 4.20 7 4.04 5 4.87 14 4.15 6 5.12 17 4.28 8 6.21 18 4.34 9 7.18 19 4.47 10 8.05 20 4.64 11 8.56 21 4.75 12 9.60 22 4.82 13 4.95 15 5.10 16 n1=10 T1=141
19、.5 n2=12 T2=111.5 基本思想s如果如果H0 成立,即两组分布位置相同,成立,即两组分布位置相同, 则则A组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n2(N+1)/2)。 或相差不大。或相差不大。s如果相差较大,超出了预定的界值,则可认为如果相差较大,超出了预定的界值,则可认为H0不成立。不成立。第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室 H0:两样本来自相同总体;:两样本来自相同总体; H1:两样本来自不同总体(双侧):两样本来自不同总体(双侧) 或
20、或H1:样本:样本A高于样本高于样本B(单侧)(单侧) =0.05 编秩编秩:两样本混合编秩次,求得:两样本混合编秩次,求得T1、T2、T。 相同观察值(即相同秩,相同观察值(即相同秩,ties),不同组),不同组-平均秩次。平均秩次。 第四军医大学卫生统计学第四军医大学卫生统计学第四军医大学卫生统计学教研室教研室教研室 确定确定P值作结论:值作结论: 查表法查表法 (n110,n2 n110) 查附表查附表10 如果如果T位于检验界值区间内,位于检验界值区间内, ,不拒绝,不拒绝H0;否;否则,则, ,拒绝,拒绝H0 本例本例T =141.5 =141.5,取,取=0.05=0.05,查,查
21、附表附表1010得单侧检验界值区得单侧检验界值区间(间(8989,141141),),T位于区间外,位于区间外,P P0.0510,n2 n110时时,采用采用正态近似法正态近似法: )(1 (12)1(|2/)1(|33211NNttNnnNnTujjtJ是有相同秩号的数据个数 例例8-4 39名吸烟工人和名吸烟工人和40名不吸烟工人的碳氧血红蛋白名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表含量见表8-6。问吸烟工人的。问吸烟工人的HbCO(%)含量是否高于不吸烟工人含量是否高于不吸烟工人的的HbCO(%)含量?含量? 表表86 吸吸烟烟工工人人和和不不吸吸烟烟工工人人的的HbCO(%)
22、含含量量比比较较 秩秩 和和 吸吸 烟烟 工工 人人 不不 吸吸 烟烟 工工 人人 含含 量量 ( 1) 吸吸 烟烟 工工 人人 ( 2) 不不 吸吸 烟烟 工工 人人 ( 3) 合合 计计 ( 4) 秩秩 范范 围围 ( 5) 平平 均均 秩秩 ( 6) ( 7) = ( 2)( 6) ( 8) =( 3) ( 6) 很很低低 1 2 3 13 2 2 4 低低 8 23 31 434 19 152 437 中中 16 11 27 3561 48 768 528 偏偏高高 10 4 14 6275 68.5 685 274 高高 4 0 4 7679 77.5 310 0 合合计计 39(n
23、1) 40(n2) 79 1917(T1) 1243(T2) H0:吸烟工人和不吸烟工人的HbCO含量总体分布位置相同H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量 =0.05 求T值,计算u值:先确定各等级的合计人数、秩次范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;本例T=1917;用公式计算u值,n1=39,n2=40,N=39+40=79,相同秩次的个数分别为t1=3、t2=31、t3=27、t4=14、t5=4个 0H1H0.05Tu1917T u139n 240n 394079N 3333()(33)(3131)(
展开阅读全文