书签 分享 收藏 举报 版权申诉 / 80
上传文档赚钱

类型第章两样本的非参数检验课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4256765
  • 上传时间:2022-11-23
  • 格式:PPT
  • 页数:80
  • 大小:719.72KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第章两样本的非参数检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    两样 参数 检验 课件
    资源描述:

    1、第三章第三章 两样本非参数检验两样本非参数检验在单样本非参数检验中,研究者可以解决诸如一个在单样本非参数检验中,研究者可以解决诸如一个总体的中心是否等于一个已知的值,某个随机变量总体的中心是否等于一个已知的值,某个随机变量是否服从某种特定的分布,某个序列是否具有随机是否服从某种特定的分布,某个序列是否具有随机性等问题。然而在实际中,更受注意的往往是比较性等问题。然而在实际中,更受注意的往往是比较两个总体的位置参数。比如,两种训练方法中哪一两个总体的位置参数。比如,两种训练方法中哪一种更出成绩,两种汽油中哪一种污染更小,两种营种更出成绩,两种汽油中哪一种污染更小,两种营销策略中哪种更有效,两种药

    2、物哪一种的治疗效果销策略中哪种更有效,两种药物哪一种的治疗效果更好等等,这就需要使用两样本的非参数方法,第更好等等,这就需要使用两样本的非参数方法,第三章中所介绍的方法大都适用。三章中所介绍的方法大都适用。编辑版pppt 在抽取样本时有两种形式:相关的和独立在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样本某一属性的的。若第一次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是独立同一属性的测量结果,则这种抽样是独立的,若第一次抽样的测量结果影响另一次的,若第一次抽样的测量结果影响另一次抽样测量结果,则这

    3、种抽样是相关的。为抽样测量结果,则这种抽样是相关的。为了避免或者尽量减少由于其他因素影响引了避免或者尽量减少由于其他因素影响引起的两组之间的附加差异,得到更准确地起的两组之间的附加差异,得到更准确地结论,研究中通常采用两个相关的样本。结论,研究中通常采用两个相关的样本。编辑版pppt 相关样本的获取有两种方式:相关样本的获取有两种方式:1.让每一研究对象做自身的对照者让每一研究对象做自身的对照者 2.将研究对象两两配对,分别给每一对两将研究对象两两配对,分别给每一对两个成员以不同的处理。在进行配对时,应个成员以不同的处理。在进行配对时,应让每一对在可能影响处理结果的其他因素让每一对在可能影响处

    4、理结果的其他因素方面尽量相似,以尽量避免和减少附加差方面尽量相似,以尽量避免和减少附加差异。一般来说,用研究对象自身作为对照异。一般来说,用研究对象自身作为对照者要优于配对方法,因为在配对过程中很者要优于配对方法,因为在配对过程中很难完全控制住其他的影响因素。两个相关难完全控制住其他的影响因素。两个相关样本的非参数检验方法主要有符号检验法样本的非参数检验方法主要有符号检验法和和Wilcoxon符号秩和检验法。符号秩和检验法。编辑版pppt 利用两个相关样本进行研究,对于某些问题是利用两个相关样本进行研究,对于某些问题是很方便的。但现实中要做到很好配对并不容易。很方便的。但现实中要做到很好配对并

    5、不容易。若由于配对不当或无法配对,就要使用两个独若由于配对不当或无法配对,就要使用两个独立样本的非参数检验方法:立样本的非参数检验方法:Brown-Mood检验检验法,法,Mann-Whitney-Wilcoxon检验法,检验法,Wald-Wolfowitz游程检验法,游程检验法,检验法,检验法,Kolmogorov-Smirnov检验法等。两个独立样检验法等。两个独立样本可以各自从两个总体中随机抽选获得,也可本可以各自从两个总体中随机抽选获得,也可以对随机抽样的一个样本诸元素随机分别实施以对随机抽样的一个样本诸元素随机分别实施两种处理而形成。两种处理而形成。2编辑版pppt 本章主要介绍两个

    6、相关样本和两个独立样本的非本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括:参数检验方法,包括:3.1 符号检验法(相关样本)符号检验法(相关样本)3.2 Wilcoxon符号秩和检验法(相关样本)符号秩和检验法(相关样本)3.3 Brown-Mood检验法(独立样本)检验法(独立样本)3.4 Mann-Whitney-Wilcoxon检验法(独立样本)检验法(独立样本)3.5 Wald-Wolfowitz游程检验法(独立样本)游程检验法(独立样本)3.6 检验法(独立样本)检验法(独立样本)3.7 Kolmogorov-Smirnov检验法(独立样本)检验法(独立样本)2编辑版p

    7、ppt3.1 符号检验法(符号检验法(Sign Test)3.1.1 基本思路与检验步骤(同第二章)基本思路与检验步骤(同第二章)设有两个连续总体设有两个连续总体x,y,累积的分布函数分别为累积的分布函数分别为F(x),F(y)。随机的分别从两个总体中抽取数目为随机的分别从两个总体中抽取数目为n的样本数据,的样本数据,和和 将它们将它们 配对得到配对得到 若研究的问题是它们是否具有相同的分布,即若研究的问题是它们是否具有相同的分布,即F(x)=F(y)是否成立,由于是否成立,由于x,y的总体分布未知,而研究者也不关的总体分布未知,而研究者也不关心它们的具体分布形式,只是关心分布是否相同,因而心

    8、它们的具体分布形式,只是关心分布是否相同,因而可以采用位置参数进行判断。若两个样本的总体具有相可以采用位置参数进行判断。若两个样本的总体具有相同的分布,则中位数应相同,即在同的分布,则中位数应相同,即在n个数对中,个数对中,Xi大于大于yi的个数与的个数与Xi小于小于yi的个数应相差不大。的个数应相差不大。)(,.2,1nxxx),(11yx),(22yx),.(nnyx12(,)ny yy编辑版pppt检验步骤检验步骤:(1)提出假设)提出假设的趋向有大于的趋向有大于单侧备择:总体中位数,则可建立中位数是否大于另一如果关心的是某一总体对某一对所有iiiiiiiiiiiiiiiiiiiixyy

    9、xPyxPHyxyxPyxPHiyxPyxPHiyxPyxPH)()(:)()(:)()(:)()(:10编辑版pppt(2)计算检验统计量)计算检验统计量是各自出现的概率。;是配对数目,样分布是二项分布的抽,的配对数目相等。配对数目与的若零假设为真,差值符号为负的数目。为为检验统计量。和号检验也定义同,两个相关样本的符与单样本的符号检验相21),21,(,nSSnnBSSyxyxyxSSSiiiiii编辑版pppt(3)确定拒绝域)确定拒绝域00000011()()()()222,;,;kkiin iniiP KkKicPHHPHH如果拒绝否则不能拒绝(双侧)如果拒绝否则不能拒绝(单侧)也可

    10、以查表确定拒绝域。编辑版pppt3.1.2 应用应用 例例.为帮助学生通过自学提高对知识的掌握,为帮助学生通过自学提高对知识的掌握,有关专家编辑了符合教学大纲的教学参考有关专家编辑了符合教学大纲的教学参考资料。为了研究资料。为了研究“教学参考资料对于指导教学参考资料对于指导学生自学是否有效学生自学是否有效”这一问题,随机选取这一问题,随机选取了了15名学生进行测试,学生使用参考资料名学生进行测试,学生使用参考资料前的试卷(前的试卷(A)得分与使用参考资料后的得分与使用参考资料后的试卷试卷(B)得分列在下表内(得分列在下表内(A卷与卷与B卷的范卷的范围,内容与难度相当)围,内容与难度相当):编辑

    11、版pppt3.1.2 应用应用学生编号学生编号123456789101112131415A卷成绩卷成绩707070707575757575787675797275B卷成绩卷成绩758070767175828670808075808383这些资料能否说明参考资料能够促进学生掌握知识这些资料能否说明参考资料能够促进学生掌握知识0.05编辑版pppt012121201:()():()()22,10,2 1012,min(,)2(3)1.()(2)21(1 1266)0.0192874096(=BINOMiiiiiiiiiiiiHP xyP xyHP xyP xyxySSnSSap P KkP ScE

    12、xcel解:()提出假设这里 为第一次测试的成绩,为第二次测试的成绩。()计算检验统计量确定拒绝域计算计算“00DIST(2,12,0.5,TRUE),.12,0.0539pHbnH,”数据不支持可以认为参考资料能够促进学生掌握知识。查表,查得界域(,),所以拒绝可以认为参考资料有用。编辑版pppt3.2 Wilcoxon符号秩和检验法(Wilcoxon Signed-Rank Test)00)0()0(,).,).(,(,1.2.3221,1DiiiiiiiiiinnMDyxyxDPDPYXyxDyxyxyxnnYXWilcoxon即,的中位数等于着全部差值的概率相等。这也意味于小的概率与大

    13、于成立,即等式:具有相同的分布,则与若记)个数对(个观察值,组成分别从两个总体中抽取地具有对称的分布,随机是两个连续总体,且均设比符号检验法更精确。因此它且利用了差值的大小,个样本差值的符号,而于两异的方法。它不仅借助检验配对样本是否有差来符号秩和检验法也是用两个相关样本的基本方法与检验步骤编辑版pppt检验步骤:01_(1):0(0)(0):0(0)(0):0(0)(0):0(0)(0)(2).(1,2.),.,min(,)DiiiDiiiDiiiDiiiiiHMP DP DHMP DP DHMP DP DHMP DP Daxy innbWWWWW提出假设:或或或或计算检验统计量计算并将 个

    14、绝对值排序,找出各自相应的秩。如果有相同的样本点,每个点取平均秩。求秩和和并求编辑版pppt(3)确定拒绝域 a.根据检验统计量W和a查Wilcoxon符号秩和检验表以得到在零假设下的 值 如果 小于给定的显著性水平,拒绝零假设;反之不能拒绝零假设。b.如果n很大,要用正态近似,得到一个与W有关的正态随机变量z值,再查正态分布表得到 值,最后将 与a作比较。pppp编辑版pppt例例1 根据根据3.1.2中的例题,利用中的例题,利用Wilcoxon检验法检验法检验参考资料能否促进学生掌握知识检验参考资料能否促进学生掌握知识(a=0.05)3.2.2 应用应用编辑版pppt01,01:()():

    15、()()23.55.595.5 1078 11.523.5 1 11.5969min()9(3)12,90.008,0.05,iiiiiiiiHP xyP xyHP xyP xyTTTT TnTPPH ,解:()提出假设()计算检验统计量做出决策根据查表得对于值太小,数据不支持可以认为参考资料对于学生有用编辑版pppt 用用A,B两种材料生产的产品其寿命检测记两种材料生产的产品其寿命检测记录如下:录如下:例例2:编辑版pppt产品编号产品编号A材料材料B材料材料产品编号产品编号A材料材料B材料材料1160016101115201505216301550121643165031580156013

    16、1530150841560157214148614705159015881514741480616201620161480147571610160517162815888165016361814921510915791590191556149010151015202016251568产品使用寿命统计表产品使用寿命统计表 单位:小时单位:小时试分析两种材料对产品的使用寿命由无显著性影响(试分析两种材料对产品的使用寿命由无显著性影响(a=0.05)编辑版pppt)计算检验统计量()的中位数命影响显著(两种材料对产品使用寿)的中位数命没有显著影响(两种材料对产品使用寿)提出假设(解:20:10:10

    17、iiDHDH编辑版pppt,1914 12.5 10 11 15 122.5 16 18 171386.5986.554 1352min()(138,52)52(3)19,T52WilcoxonT(1)/40.52P(2()=2(-1.71)=0.0880.0(1)(21)/24TTTT Tnn nWwn nn 做出决策根据,由符号秩和检验指导表及大样本近似可得:)5Excel=NORMSDIST(-1.71)计算“”说明不能拒绝零假设,即两种材料对产品使用寿命没有显著影响。编辑版pppt3.3 Brown-Mood检验法 Brown-Mood检验法是一种位置参数检验,主检验法是一种位置参数检

    18、验,主要用来检验两个独立样本的中位数是否相同。要用来检验两个独立样本的中位数是否相同。和位置参数相同零假设的表述方法:和位置参数相同零假设的表述方法:1.P(XY)=P(XY)=1/2 2.分布函数分布函数F(X)=F(Y)3.X+a和和Y同分布,且有:当同分布,且有:当a大于时,大于时,XY4.中位数中位数xyMM编辑版pppt假设假设 和和 是两个相互独立是两个相互独立的随机样本,来自两个总体的随机样本,来自两个总体X X和和Y Y,其相应的中位数,其相应的中位数为为 和和 。我们关注的问题是,两个总体的位置。我们关注的问题是,两个总体的位置参数参数 =是否成立。是否成立。零假设零假设 成

    19、立的情况下,由成立的情况下,由m m个个X X、n n个个Y Y可以组成一个观测值数为可以组成一个观测值数为m m十十n nN N的混合样本,的混合样本,其样本中位数为其样本中位数为 ,应该对于两个总体样本应该对于两个总体样本数据说都处于中间位置。与符号检验思想相似,如数据说都处于中间位置。与符号检验思想相似,如果任何一个样本中大于果任何一个样本中大于 或小于或小于 的数目过多的数目过多或过少,我们就有理由怀疑零假设的真实性。或过少,我们就有理由怀疑零假设的真实性。xyM3.3.1 检验思想与检验方法检验思想与检验方法mxxx,21nyyy,21xMyMxMyM0H:xyMMxyMxyMxyM

    20、编辑版pppt 若若a或者或者b过大或过小,则有理由怀疑原假设。令过大或过小,则有理由怀疑原假设。令A表表示列联表中左上角取值示列联表中左上角取值a的的x样本中大于样本中大于 的变量的变量,则则A为我们的检验统计量。由初等概率可知,在为我们的检验统计量。由初等概率可知,在m,n及及t固定时,固定时,A分布在零假设下为超几何分布(对于不超分布在零假设下为超几何分布(对于不超过过m的的k):):x y 总和总和 k m-k t-k n-t+k t (m+n)-t求和 m n N=m+nxyMxyM编辑版pppt()!()!()!()!()!()!ktkmntmnCCPAkCmnkmktkntkmn

    21、tmnt()!()!()!()!()!()!kmktmntmmnCCPAkCtmntktkmkntkmnmn编辑版pppt实际运用中p值的计算ExcelExcel中的超几何分布函数:中的超几何分布函数:HYPGEOMDIST(sample_s,number_sample,population_s,number_population)Sample_s样本中成功的次数样本中成功的次数A。Number_sample样本容量样本容量T。Population_s样本总体中成功的次数样本总体中成功的次数m。Number_population 样本总体的容量样本总体的容量N N。Hypgeomdist(A,

    22、t,m,N)=Hypgeomdist(A,t,m,N)=R R程序:程序:P(Aa)=phyper(a,m,n,a+b)P(A20,n12时,u的 抽 样 分 布 近 似 正 态 分 布,可 用 正 态 逼 近00HH。如 果 P值(双 侧 检 验 为 2P)小 于 给 定 的 显 著 性 水 平,则 拒 绝;否 则 不 能 拒 绝。编辑版pppt3.5.2 应用应用 例例 研究者想知道研究者想知道“问题按难易次序提问是否影问题按难易次序提问是否影响学生正确回答的能力响学生正确回答的能力”。今从全校学生中随机。今从全校学生中随机抽取一个班的学生,随机地将学生分为两组,让抽取一个班的学生,随机地

    23、将学生分为两组,让第一组的学生做第一组的学生做A卷(问题从易到难),第二组卷(问题从易到难),第二组学生做学生做B卷(问题从难到易)。考试被控制在完卷(问题从难到易)。考试被控制在完全相同的条件下进行,评分结果如下:全相同的条件下进行,评分结果如下:A卷卷 83 82 84 96 90 64 91 71 75 72 B卷卷 42 61 52 78 69 81 75 78 78 65 试问在试问在0.05显著性水平下显著性水平下“问题按难易次序提问问题按难易次序提问是否影响学生正确回答的能力是否影响学生正确回答的能力”?编辑版pppt3.5.2 应用应用 解:(解:(1)提出假设)提出假设 :F

    24、(X)=F(Y)(两种提问方式对学生成绩无影响两种提问方式对学生成绩无影响):F(X)F(Y)(两种提问方式会造成学生成绩的两种提问方式会造成学生成绩的差异差异)(2)计算检验统计量)计算检验统计量 u=60H1H42 52 61 64 65 69 71 72 75 75 78 78 78 81 82 83 84 90 91 96 y y y x y y x x x y y y y y x x x x x x编辑版pppt3.5.2 应用应用(3)作出决策)作出决策 根据根据m=10,n=10,=0.05查表得:查表得:因为因为 ,所以拒绝,所以拒绝 ,可以认为在,可以认为在 下提问的顺序对学

    25、生正确回答问题的下提问的顺序对学生正确回答问题的能力有影响(也可以计算或查能力有影响(也可以计算或查P值判断)。值判断)。0 0250.02512616CC。,0 025166uC。0H0.05编辑版pppt3.5.2 应用应用 注意:如果出现同分,分值来自同一样本,游程注意:如果出现同分,分值来自同一样本,游程数数u不会受到影响;但若同分值来自不同样本,不会受到影响;但若同分值来自不同样本,u就可能会受到影响,并影响最后的结论。因此,就可能会受到影响,并影响最后的结论。因此,在运用在运用Wald-Wolfowitz游程检验时,若同分值来游程检验时,若同分值来自两个不同的样本,一般应将各种排序

    26、的可能性自两个不同的样本,一般应将各种排序的可能性都进行考察,分别计算每种情况下的游程总数都进行考察,分别计算每种情况下的游程总数u,并查找相应的并查找相应的P值。如果得出的结论一致,表明值。如果得出的结论一致,表明同分没有带来什么问题;如果得出的结论不一致,同分没有带来什么问题;如果得出的结论不一致,可以将可以将n个个P值求简单平均数,以此作为是否拒绝值求简单平均数,以此作为是否拒绝H的依据。如果同分在两个样本之间多次出现,的依据。如果同分在两个样本之间多次出现,u实际上是不确定的,因而不宜采用实际上是不确定的,因而不宜采用Wald-Wolfowitz游程检验。游程检验。编辑版pppt3.5

    27、.3 练习练习 某年华北五省市区的某年华北五省市区的GDP指数为:指数为:109.2 114.3 113.5 111.0 112.7 华东七省的华东七省的GDP指数为:指数为:113.0 112.2 112.7 114.4 115.4 113.4 112.2试问:在试问:在 下下,利用利用 Wald-Wolfowitz游程检验法检验华北五省的游程检验法检验华北五省的GDP指数与华指数与华北七省的北七省的GDP指数分布是否相同指数分布是否相同?0.05编辑版pppt3.6 两样本的 检验 单样本的 检验可以推广到两个独立样本的总体差异性的检验。问题:分别从两个分布函数为 和 的总体中,随机抽取

    28、和 个样本数据,利用样本值推断两个总体是否具有某中差异。为了对假设作出判定,所需要的数据是两个样本,测量层次最低可为定类尺度。22 1Fx 2Fx1n2n编辑版pppt3.6.1 基本方法与检验步骤11,211122221121112222,1,2,1,2,rrrrijffffffeeeeeefir jrr定义符号:为第一个样本数据各个组的观察频数;为第二个样本数据各个组的观察频数;为总体中与第一个样本观察频数相对应的 期望频数;为总体中与第二个样本观察频数相对应的 期望频数;为任一样本某组的观察频数,为组数且12iiiififff大于2;为第 组两个样本的观察频数和,编辑版pppt3.6.1

    29、 基本方法与检验步骤 用联表表示为:组 别 观察频数 合计 期望频数 1 2 r合计 N1 12 11rfff12222rfff12rfff11211reee2 12 22reee1n2n1f2f1e2e1.2.1121.222.212111.112.1111;/*;/*;/*rrrrrefeNfneefeNfneefeNfne编辑版pppt3.6.1 基本方法与检验步骤011221021112()()/(iiiiiiiijijijijiiiiHifenNiffenNnfeNNfefeHfeef如 果为 真,则 第 一 个 样 本 第 组 的 期 望 频 数 第 二 个 样 本 第 组 的 期

    30、 望 频 数 观 察 频 数与 期 望 频 数应 相 等因 此,与越 接 近,表 明为 真 的 可 能 性 越 大。对 于 两 个 独 立 样 本,可 以 用和2220222211221111122)/()()()1iirrrijijiiiiiiijiiijeeHfefefeQeeeQdfr 之 和 的 大 小 来 判 定 是 否 拒 绝。记:服 从(近 似 遵 从)自 由 度的分 布。编辑版pppt3.6.1 基本方法与检验步骤012112222112020()(1)(1)(1)rijijijijHFxFxHFxFxfeQreQrHQrH 检 验 步 骤:(1)建 立 假 设 :对 于 所

    31、有 的 x :对 于 某 个 x (2)计 算 检 验 统 计 量 (3)确 定 拒 绝 域 当,拒 绝;当,不 能 拒 绝。编辑版pppt3.6.2 应用例:为了研究已婚和独身妇女请假和工作时间是否有差异,研究者随机抽取了100名已婚妇女和200名独身妇女,调查她们在一年内请假和工作的情况,得到了下列数据:注:没有工作的时间不包括正常休假(如怀孕、住院等);独身妇女一组包括离婚、分居、丧偶但身边无子女在一起生活的妇女。试问能否在0.05的显著性水平下认为已婚妇女比独身妇女更容易请假而从事的工作时间更少?无工作日数分组已婚妇女(人)独身妇女(人)03 47 811 1215 1619 20以上

    32、 60 21 11 4 2 2 130 50 10 6 3 1 合 计 100 200编辑版pppt3.6.2 应用01HH解:(1)建立假设:已婚和独身妇女年内无工作日数分布相同 :已婚妇女比独身妇女更容易请假而从事工作的时间更少?(2)计算检验统计量编辑版ppptxf1f2fi.e1e20-36013019063.33126.670.17510.08754-721507123.6747.330.30120.15068-111110217.0014.002.28571.142912-1546103.336.670.13480.067316-192352.675.330.66250.33192

    33、0以上213合计1002003003.55931.7802Q=3.5593+1.7802=5.8395 df=5-1=4Q统计量计算表2111()/fee2222()/feeNfneii/*.11编辑版pppt(3)做出决策)做出决策220.050.0502(4)9.49,0.055XQXHX由于因此调查数据支持表明在显著性水平下已婚妇女和独身妇女在年内没有工作的天数的分布没有什么不同。注意:与单样本检验一样,当两个样本中无论哪一个的某一组期望频数小于 时,应将相邻组合并,同时另一样本相应的两组也要合并,以保证两个样本的组数相等。编辑版pppt3.6.3 练习练习 学生按性别和考试成绩分组的调

    34、查数据如下:学生按性别和考试成绩分组的调查数据如下:试判断在试判断在0.05的显著性水平下学生的考试成绩是的显著性水平下学生的考试成绩是否与性别有关?否与性别有关?成绩 人数 性别 及 格 不及格 合计 男 女 2600 2180 130 90 2730 2270 合 计 4780 220 5000编辑版pppt3.7 Kolmogorov-Smirnov检验 单样本的Kolmogorov-Smirnov检验可以推广应用于两个独立样本。两样本的Kolmogorov-Smirnov检验,简称Smirnov拟合优度检验,主要用于检验主要用于检验两个独立样本是否抽自两个相同分布的总体两个独立样本是否

    35、抽自两个相同分布的总体,也为其基本思路和检验步骤与单样本的K-S检验完全一致,只是在检验时需要将前面的假设改为:0121121212maxNxHF xF xHF xF xF xF xDSxSx:对于所有的x:对于一些x和分别为两个连续总体的累积概率分布。检验统计量为:N=m+n编辑版pppt 是第一个样本的经验分布函数,它可以用第一个样本观察值小于等于的x的次数除以总次数m(m为第一个样本的数据个数)求得;是第二个样本的经验分布函数,它可以用第二个样本观察值小于等于x的次数除以总次数n(n为第二个样本的数据个数)求得。若两个总体是连续的,检验统计量 的抽样分布已知。当 为真时,应该很小,与其相

    36、应的概率和临界值可以在Smirnov检验临界值(王书第306页)中查到,它满足:。当 时,不能拒绝 ;当 时,拒绝 。1Sx 2SxNDND1NNP DD NNDDNNDD0H0H0H3.7.1 两样本K-S检验基本思想编辑版pppt,20111.3581.358111.2241.224NNm nmnDmnmnmnDmnmn当时,可用下列公式近似:=0.05 =0.1编辑版pppt 双侧检验对于总体分布的任何一种差异,如位置差异(集中趋势)、离散度差异、偏斜度差异等都很敏感。K-S检验的单侧检验则用来检验某一总体值是否大于或小于另一总体的值。其假设为:或或 其检验统计量是:012112HF x

    37、F xHF xF x:对于所有的x:对于某个x 012112HF xF xHF xF x:对于所有x:对于某个x时即当备择假设为)()()()(maxD2121xFxFHxSxS时即当备择假设为)()()()(maxD1212xFxFHxSxS编辑版pppt 例1:随即抽取9个远郊县和7个近郊县调查其近10年的人口增长速度(%):近郊县:3.1 2.1 8.2 2.7 3.4 7.9 3.2 远郊县:5.3 3.7 5.8 3.5 4.8 5.6 6.8 9.3 10.3 根据这些资料,能否认为近郊县比远郊县的人口增长速度低?解(1)提出假设=0.05 012112HFxFxHFxFx:对于所

    38、有x:对于某些x3.7.2 两样本K-S检验实例编辑版pppt例1(2)计算检验统计量计算检验统计量1f2f1f2f 1Sx 2Sx 21NDSxSx人口增长速度(%)2.12.73.13.23.43.53.74.85.35.65.86.87.98.29.310.311111000000011000000011111110011123455555555677700000123456777891/72/73/74/75/75/75/75/75/75/75/75/76/7111000001/92/93/94/95/96/97/97/97/98/91 1/7 0.149 2/7 0.2857 3/7

    39、 0.4286 4/7 0.5714 5/7 0.714338/63 0.603231/63 0.492124/63 0.381017/63 0.269810/63 0.1587 3/63 0.0476-4/63 -0.0635 5/63 0.0794 2/9 0.2222 1/9 0.1111 0 0样本1的经验分布频数样本1的累积频数编辑版pppt例1(3)作决策作决策查表得:查表得:由于由于 ,所以拒绝,所以拒绝可以认为在可以认为在 下近郊县比远郊县的人口增下近郊县比远郊县的人口增长速度低。长速度低。0.05160.328DNNDD0H=0.050.7143ND编辑版pppt例2解:(1

    40、)建立假设 (2)计算检验统计量An考试成绩(分)学生人数(人)累积人数(人)累积频率(%)60分以下 6070 7080 8090 90以上 56 198 244 99 63 80 128 328 176 88 56 254 498 597 660 80 208 536 712 8000.08480.38480.75450.90451.0000 0.1 0.26 0.67 0.89 1.00 0.0152 0.1248 0.0845 0.0145 0 合 计 660 800 Bn ASx BSx ABSxSx 012112HFxFxHFxFx:对于所有的x:对于某个xBnAn 1460max

    41、0.1248ABxDSxSx编辑版pppt例20.050.0514600.0514600(3)6608001.3580.0714660 800NDDDH1460作出决策因为D,故拒绝,可以认为两所高校在本次全市数学考试中学生考试成绩的分布有显著差异。编辑版pppt练习 某年华北五省市区的GDP指数为:109.2 114.3 113.5 111.0 112.7 华东七省的GDP指数为:113.0 112.2 112.7 114.4 115.4 113.4 112.2试问:在 下可否认为华北五省的GDP指数与华东七省的GDP指数分布相同?=0.05编辑版pppt此课件下载可自行编辑修改,供参考!此课件下载可自行编辑修改,供参考!部分内容来源于网络,如有侵权请与我联系删除!部分内容来源于网络,如有侵权请与我联系删除!编辑版pppt

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第章两样本的非参数检验课件.ppt
    链接地址:https://www.163wenku.com/p-4256765.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库