第章两样本的非参数检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第章两样本的非参数检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 两样 参数 检验 课件
- 资源描述:
-
1、第三章第三章 两样本非参数检验两样本非参数检验在单样本非参数检验中,研究者可以解决诸如一个在单样本非参数检验中,研究者可以解决诸如一个总体的中心是否等于一个已知的值,某个随机变量总体的中心是否等于一个已知的值,某个随机变量是否服从某种特定的分布,某个序列是否具有随机是否服从某种特定的分布,某个序列是否具有随机性等问题。然而在实际中,更受注意的往往是比较性等问题。然而在实际中,更受注意的往往是比较两个总体的位置参数。比如,两种训练方法中哪一两个总体的位置参数。比如,两种训练方法中哪一种更出成绩,两种汽油中哪一种污染更小,两种营种更出成绩,两种汽油中哪一种污染更小,两种营销策略中哪种更有效,两种药
2、物哪一种的治疗效果销策略中哪种更有效,两种药物哪一种的治疗效果更好等等,这就需要使用两样本的非参数方法,第更好等等,这就需要使用两样本的非参数方法,第三章中所介绍的方法大都适用。三章中所介绍的方法大都适用。编辑版pppt 在抽取样本时有两种形式:相关的和独立在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样本某一属性的的。若第一次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是独立同一属性的测量结果,则这种抽样是独立的,若第一次抽样的测量结果影响另一次的,若第一次抽样的测量结果影响另一次抽样测量结果,则这
3、种抽样是相关的。为抽样测量结果,则这种抽样是相关的。为了避免或者尽量减少由于其他因素影响引了避免或者尽量减少由于其他因素影响引起的两组之间的附加差异,得到更准确地起的两组之间的附加差异,得到更准确地结论,研究中通常采用两个相关的样本。结论,研究中通常采用两个相关的样本。编辑版pppt 相关样本的获取有两种方式:相关样本的获取有两种方式:1.让每一研究对象做自身的对照者让每一研究对象做自身的对照者 2.将研究对象两两配对,分别给每一对两将研究对象两两配对,分别给每一对两个成员以不同的处理。在进行配对时,应个成员以不同的处理。在进行配对时,应让每一对在可能影响处理结果的其他因素让每一对在可能影响处
4、理结果的其他因素方面尽量相似,以尽量避免和减少附加差方面尽量相似,以尽量避免和减少附加差异。一般来说,用研究对象自身作为对照异。一般来说,用研究对象自身作为对照者要优于配对方法,因为在配对过程中很者要优于配对方法,因为在配对过程中很难完全控制住其他的影响因素。两个相关难完全控制住其他的影响因素。两个相关样本的非参数检验方法主要有符号检验法样本的非参数检验方法主要有符号检验法和和Wilcoxon符号秩和检验法。符号秩和检验法。编辑版pppt 利用两个相关样本进行研究,对于某些问题是利用两个相关样本进行研究,对于某些问题是很方便的。但现实中要做到很好配对并不容易。很方便的。但现实中要做到很好配对并
5、不容易。若由于配对不当或无法配对,就要使用两个独若由于配对不当或无法配对,就要使用两个独立样本的非参数检验方法:立样本的非参数检验方法:Brown-Mood检验检验法,法,Mann-Whitney-Wilcoxon检验法,检验法,Wald-Wolfowitz游程检验法,游程检验法,检验法,检验法,Kolmogorov-Smirnov检验法等。两个独立样检验法等。两个独立样本可以各自从两个总体中随机抽选获得,也可本可以各自从两个总体中随机抽选获得,也可以对随机抽样的一个样本诸元素随机分别实施以对随机抽样的一个样本诸元素随机分别实施两种处理而形成。两种处理而形成。2编辑版pppt 本章主要介绍两个
6、相关样本和两个独立样本的非本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括:参数检验方法,包括:3.1 符号检验法(相关样本)符号检验法(相关样本)3.2 Wilcoxon符号秩和检验法(相关样本)符号秩和检验法(相关样本)3.3 Brown-Mood检验法(独立样本)检验法(独立样本)3.4 Mann-Whitney-Wilcoxon检验法(独立样本)检验法(独立样本)3.5 Wald-Wolfowitz游程检验法(独立样本)游程检验法(独立样本)3.6 检验法(独立样本)检验法(独立样本)3.7 Kolmogorov-Smirnov检验法(独立样本)检验法(独立样本)2编辑版p
7、ppt3.1 符号检验法(符号检验法(Sign Test)3.1.1 基本思路与检验步骤(同第二章)基本思路与检验步骤(同第二章)设有两个连续总体设有两个连续总体x,y,累积的分布函数分别为累积的分布函数分别为F(x),F(y)。随机的分别从两个总体中抽取数目为随机的分别从两个总体中抽取数目为n的样本数据,的样本数据,和和 将它们将它们 配对得到配对得到 若研究的问题是它们是否具有相同的分布,即若研究的问题是它们是否具有相同的分布,即F(x)=F(y)是否成立,由于是否成立,由于x,y的总体分布未知,而研究者也不关的总体分布未知,而研究者也不关心它们的具体分布形式,只是关心分布是否相同,因而心
8、它们的具体分布形式,只是关心分布是否相同,因而可以采用位置参数进行判断。若两个样本的总体具有相可以采用位置参数进行判断。若两个样本的总体具有相同的分布,则中位数应相同,即在同的分布,则中位数应相同,即在n个数对中,个数对中,Xi大于大于yi的个数与的个数与Xi小于小于yi的个数应相差不大。的个数应相差不大。)(,.2,1nxxx),(11yx),(22yx),.(nnyx12(,)ny yy编辑版pppt检验步骤检验步骤:(1)提出假设)提出假设的趋向有大于的趋向有大于单侧备择:总体中位数,则可建立中位数是否大于另一如果关心的是某一总体对某一对所有iiiiiiiiiiiiiiiiiiiixyy
9、xPyxPHyxyxPyxPHiyxPyxPHiyxPyxPH)()(:)()(:)()(:)()(:10编辑版pppt(2)计算检验统计量)计算检验统计量是各自出现的概率。;是配对数目,样分布是二项分布的抽,的配对数目相等。配对数目与的若零假设为真,差值符号为负的数目。为为检验统计量。和号检验也定义同,两个相关样本的符与单样本的符号检验相21),21,(,nSSnnBSSyxyxyxSSSiiiiii编辑版pppt(3)确定拒绝域)确定拒绝域00000011()()()()222,;,;kkiin iniiP KkKicPHHPHH如果拒绝否则不能拒绝(双侧)如果拒绝否则不能拒绝(单侧)也可
10、以查表确定拒绝域。编辑版pppt3.1.2 应用应用 例例.为帮助学生通过自学提高对知识的掌握,为帮助学生通过自学提高对知识的掌握,有关专家编辑了符合教学大纲的教学参考有关专家编辑了符合教学大纲的教学参考资料。为了研究资料。为了研究“教学参考资料对于指导教学参考资料对于指导学生自学是否有效学生自学是否有效”这一问题,随机选取这一问题,随机选取了了15名学生进行测试,学生使用参考资料名学生进行测试,学生使用参考资料前的试卷(前的试卷(A)得分与使用参考资料后的得分与使用参考资料后的试卷试卷(B)得分列在下表内(得分列在下表内(A卷与卷与B卷的范卷的范围,内容与难度相当)围,内容与难度相当):编辑
11、版pppt3.1.2 应用应用学生编号学生编号123456789101112131415A卷成绩卷成绩707070707575757575787675797275B卷成绩卷成绩758070767175828670808075808383这些资料能否说明参考资料能够促进学生掌握知识这些资料能否说明参考资料能够促进学生掌握知识0.05编辑版pppt012121201:()():()()22,10,2 1012,min(,)2(3)1.()(2)21(1 1266)0.0192874096(=BINOMiiiiiiiiiiiiHP xyP xyHP xyP xyxySSnSSap P KkP ScE
12、xcel解:()提出假设这里 为第一次测试的成绩,为第二次测试的成绩。()计算检验统计量确定拒绝域计算计算“00DIST(2,12,0.5,TRUE),.12,0.0539pHbnH,”数据不支持可以认为参考资料能够促进学生掌握知识。查表,查得界域(,),所以拒绝可以认为参考资料有用。编辑版pppt3.2 Wilcoxon符号秩和检验法(Wilcoxon Signed-Rank Test)00)0()0(,).,).(,(,1.2.3221,1DiiiiiiiiiinnMDyxyxDPDPYXyxDyxyxyxnnYXWilcoxon即,的中位数等于着全部差值的概率相等。这也意味于小的概率与大
13、于成立,即等式:具有相同的分布,则与若记)个数对(个观察值,组成分别从两个总体中抽取地具有对称的分布,随机是两个连续总体,且均设比符号检验法更精确。因此它且利用了差值的大小,个样本差值的符号,而于两异的方法。它不仅借助检验配对样本是否有差来符号秩和检验法也是用两个相关样本的基本方法与检验步骤编辑版pppt检验步骤:01_(1):0(0)(0):0(0)(0):0(0)(0):0(0)(0)(2).(1,2.),.,min(,)DiiiDiiiDiiiDiiiiiHMP DP DHMP DP DHMP DP DHMP DP Daxy innbWWWWW提出假设:或或或或计算检验统计量计算并将 个
14、绝对值排序,找出各自相应的秩。如果有相同的样本点,每个点取平均秩。求秩和和并求编辑版pppt(3)确定拒绝域 a.根据检验统计量W和a查Wilcoxon符号秩和检验表以得到在零假设下的 值 如果 小于给定的显著性水平,拒绝零假设;反之不能拒绝零假设。b.如果n很大,要用正态近似,得到一个与W有关的正态随机变量z值,再查正态分布表得到 值,最后将 与a作比较。pppp编辑版pppt例例1 根据根据3.1.2中的例题,利用中的例题,利用Wilcoxon检验法检验法检验参考资料能否促进学生掌握知识检验参考资料能否促进学生掌握知识(a=0.05)3.2.2 应用应用编辑版pppt01,01:()():
15、()()23.55.595.5 1078 11.523.5 1 11.5969min()9(3)12,90.008,0.05,iiiiiiiiHP xyP xyHP xyP xyTTTT TnTPPH ,解:()提出假设()计算检验统计量做出决策根据查表得对于值太小,数据不支持可以认为参考资料对于学生有用编辑版pppt 用用A,B两种材料生产的产品其寿命检测记两种材料生产的产品其寿命检测记录如下:录如下:例例2:编辑版pppt产品编号产品编号A材料材料B材料材料产品编号产品编号A材料材料B材料材料1160016101115201505216301550121643165031580156013
16、1530150841560157214148614705159015881514741480616201620161480147571610160517162815888165016361814921510915791590191556149010151015202016251568产品使用寿命统计表产品使用寿命统计表 单位:小时单位:小时试分析两种材料对产品的使用寿命由无显著性影响(试分析两种材料对产品的使用寿命由无显著性影响(a=0.05)编辑版pppt)计算检验统计量()的中位数命影响显著(两种材料对产品使用寿)的中位数命没有显著影响(两种材料对产品使用寿)提出假设(解:20:10:10
17、iiDHDH编辑版pppt,1914 12.5 10 11 15 122.5 16 18 171386.5986.554 1352min()(138,52)52(3)19,T52WilcoxonT(1)/40.52P(2()=2(-1.71)=0.0880.0(1)(21)/24TTTT Tnn nWwn nn 做出决策根据,由符号秩和检验指导表及大样本近似可得:)5Excel=NORMSDIST(-1.71)计算“”说明不能拒绝零假设,即两种材料对产品使用寿命没有显著影响。编辑版pppt3.3 Brown-Mood检验法 Brown-Mood检验法是一种位置参数检验,主检验法是一种位置参数检
18、验,主要用来检验两个独立样本的中位数是否相同。要用来检验两个独立样本的中位数是否相同。和位置参数相同零假设的表述方法:和位置参数相同零假设的表述方法:1.P(XY)=P(XY)=1/2 2.分布函数分布函数F(X)=F(Y)3.X+a和和Y同分布,且有:当同分布,且有:当a大于时,大于时,XY4.中位数中位数xyMM编辑版pppt假设假设 和和 是两个相互独立是两个相互独立的随机样本,来自两个总体的随机样本,来自两个总体X X和和Y Y,其相应的中位数,其相应的中位数为为 和和 。我们关注的问题是,两个总体的位置。我们关注的问题是,两个总体的位置参数参数 =是否成立。是否成立。零假设零假设 成
19、立的情况下,由成立的情况下,由m m个个X X、n n个个Y Y可以组成一个观测值数为可以组成一个观测值数为m m十十n nN N的混合样本,的混合样本,其样本中位数为其样本中位数为 ,应该对于两个总体样本应该对于两个总体样本数据说都处于中间位置。与符号检验思想相似,如数据说都处于中间位置。与符号检验思想相似,如果任何一个样本中大于果任何一个样本中大于 或小于或小于 的数目过多的数目过多或过少,我们就有理由怀疑零假设的真实性。或过少,我们就有理由怀疑零假设的真实性。xyM3.3.1 检验思想与检验方法检验思想与检验方法mxxx,21nyyy,21xMyMxMyM0H:xyMMxyMxyMxyM
20、编辑版pppt 若若a或者或者b过大或过小,则有理由怀疑原假设。令过大或过小,则有理由怀疑原假设。令A表表示列联表中左上角取值示列联表中左上角取值a的的x样本中大于样本中大于 的变量的变量,则则A为我们的检验统计量。由初等概率可知,在为我们的检验统计量。由初等概率可知,在m,n及及t固定时,固定时,A分布在零假设下为超几何分布(对于不超分布在零假设下为超几何分布(对于不超过过m的的k):):x y 总和总和 k m-k t-k n-t+k t (m+n)-t求和 m n N=m+nxyMxyM编辑版pppt()!()!()!()!()!()!ktkmntmnCCPAkCmnkmktkntkmn
展开阅读全文