统计学非参数检验实用版课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学非参数检验实用版课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 参数 检验 实用 课件
- 资源描述:
-
1、统计学非参数检验统计学非参数检验统计学非参数检验方法的回顾方法的回顾l单个因素(两水平)的作用评价:两组比较完全随机设计下的单因素两组比较匹配设计的两组比较l单个因素(多水平)的作用评价:多组比较完全随机设计下的单因素多水平比较l两个因素的分析问题无交互作用、有交互作用l单因素两组比较:t检验完全随机两组均数比较的t检验(独立t检验)匹配设计下两组均数比较的t检验(匹配t检验)l单因素多组比较:方差分析完全随机设计下的多组均数比较局限性局限性lt检验独立t检验要求:正态、方差相等(或不相等)、个体独立匹配t检验要求:差值正态、个体独立l方差分析单因素多水平比较方差分析要求:正态、方差相等、个体
2、独立未解决问题未解决问题l两组性别结构是否相同?l疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?l如何检验样本数据来自的总体服从正态分布?l总体不是正态分布,小样本情况下,如何检验总体的集中趋势?l有6名歌手参加比赛,4名评委进行评判打分,推断评委的评判标准是否一致ll参数检验:样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值推断问题就转化为对分布族的若干个未知参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。l非参数检验(nonparametric tests)又称为任意分布检验(dis
3、tribution-free test),它不考虑研究对象总体分布具体形式,也不对总体参数进行统计推断仅仅依赖于数据观测值的相对大小(秩)等,而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。Wilcoxon符号秩检验结果(2)把 的正负号加到相应的秩上;(数据文件:家庭月收入.计算差值绝对值的秩。以下情况下应当首选非参数方法Mann-Whitney U每个数据都减去零假设中的中位数,记录其差值的符号。疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?对总体假定较少,有广泛的适用性,结果稳定性较好。Wilcoxon符号秩检验检验中涉及的数据为定类或定序数据。k是样
4、本分类的个数,表示实际观察到的频数,表示理论频数。用于两个独立样本的Wlicoxon秩和检验Wilcoxon符号秩检验Wilcoxon符号秩检验结果(1)对定类变量用c2统计量进行统计显著性检验129,双侧检验的p值为0.在K-S检验中如果使用的是小样本,则根据渐进分布计算p值的误差会增大。l非参数统计的名字中的“非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关参数;l它被称为“和分布无关”(distributionfree),是因为其推断方法和总体分布无关;不应理解为与所有分布(例如有关秩的分布)无关 l对总体假定较少,有广泛的适用性,对总体假定较少,有广泛的适用性
5、,结果稳定性较好。结果稳定性较好。假定较少假定较少不需要对总体参数的假定不需要对总体参数的假定与参数结果接近与参数结果接近l针对几乎所有类型的数据形态。针对几乎所有类型的数据形态。l容易计算容易计算在计算机盛行之前就已经发展起来。在计算机盛行之前就已经发展起来。非参数检验的优点l可能会浪费一些信息可能会浪费一些信息特别当数据可以使用参数模型特别当数据可以使用参数模型的时候的时候l大样本手算相当麻烦大样本手算相当麻烦l一些表不易得到一些表不易得到非参数检验的弱点非参数检验的特点非参数检验的特点非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面。非参数检验几乎可以处理包括定类数据和定序数
6、据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析。在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(power)要低于参数检验方法。以下情况下应当首选非参数方法以下情况下应当首选非参数方法参数检验中的假设条件不满足,从而无法应用。例如总体分布为偏态或分布形式未知,且样本为小样本时。检验中涉及的数据为定类或定序数据。所涉及的问题中并不包含参数,如判断某样本是否来自正态分布等,判断某样本是否为随机样本。常用的非参数检验方法常用的非参数检验方法l用于单个样本的c2拟合优度检验、K-S拟合优度检验、中位数的符号检验l用于两个匹配样本的Wilcoxon符号秩检验l用于两个独立样本的
7、Wlicoxon秩和检验l用于多个独立样本的Kruskal-Wallis检验。计算差值绝对值的秩。如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查120名消费者,偏好每种材料的人数应该是相等的,也就是40人。由于收入一般是右偏分布,因此不适合用t检验进行分析。独立t检验要求:正态、方差相等(或不相等)、个体独立H0:观察频数与期望频数一致它被称为“和分布无关”(distributionfree),是因为其推断方法和总体分布无关;多个独立样本的Kruskal-Wallis检验如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服
8、从均匀分布,则理论上来说,调查120名消费者,偏好每种材料的人数应该是相等的,也就是40人。单击对话框中的“精确”,选中弹出对话框中的“精确”,单击“继续”、“确定”原假设成立时,检验统计量S服从二项分布。SPSS K-S检验中检验统计量Z的计算250,自由度为2,相应的p值(渐近显著性)为0.样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值单因素多组比较:方差分析Kruskal-Wallis检验是Wlicoxon秩和检验的推广,用来对多个总体的中位数进行比较。H1:观察频数与期望频数不一致疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比
9、较?一种饮料的容器材料可以选择玻璃、塑料或者金属。缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;以下情况下应当首选非参数方法第六章第六章 非参数检验非参数检验l非参数检验概述非参数检验、特点及应用l单样本的非参数检验l两个样本和多个样本的非参数检验单样本的非参数检验单样本的非参数检验lc2拟合优度检验lK-S拟合优度检验l中位数的符号检验分类数据检验分布对中位数的推断lc2统计量用来测定定类变量之间的相关程度c2统计量的分布与自由度有关;c2统计量描述了观察值与期望值的接近程度eefff202)(c表示期望值频数表示观察值频数,其中eff002cl拟
10、合优度检验(goodness of fit test)用c2统计量进行统计显著性检验的重要内容之一;依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到对分类变量进行分析的目的。l1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有2208人,其中男性1738人,女性470人。l海难发生后,幸存者共718人,其中男性374人,女性344人,以显著性水平为0.1检验存活状况与性别是否有关?706.2)1(21.0cl提出零假设和备择假设H0:观察频数与期望频数一致H1:观察频数与期望频数不一致l计算期望频数
11、男性的期望频数 ,女性为153人l计量c2统计量l查表 (自由度为类别数-1)l做出判断:决绝原假设,认为存活状况与性别显著相关ef56522081738718220()303eefffc706.2)1(21.0cl一种饮料的容器材料可以选择玻璃、塑料或者金属。l为了比较消费者对包装材料的偏好,抽样调查了120名消费者发现,最喜欢玻璃、塑料和金属容器的分别有55、25和40人。l根据调查结果,能否认为消费者对3种材料的偏好程度是无差异的(显著性水平a=0.05)?分析分析l如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查120名消费者,偏好每
12、种材料的人数应该是相等的,也就是40人。l各组观测到的人数与理论人数(期望值)之间的差异应该都是由于抽样的随机性造成的,因此不应该太大。l如果二者之间的差异特别大,则说明我们所作的假设(消费者对3种材料的偏好程度是无差异的)很可能不成立。l检验统计量k是样本分类的个数,表示实际观察到的频数,表示理论频数。观察频数与期望频数越接近,则c2值越小。根据皮尔逊定理,当n充分大时,c2统计量渐近服从于k-1个自由度的c2分布。kiiiiEEO122)(c软件操作:数据录入软件操作:数据录入软件操作:方法设定软件操作:方法设定l选择“分析”“非参数检验”“卡方”,在弹出的对话框中将“材料”设定为检验变量
13、;单击对话框中的“精确”,选中弹出对话框中的“精确”,单击“继续”、“确定”软件操作:结果分析(软件操作:结果分析(1)观察数观察数 期望数期望数残差残差1.005540.015.02.002540.0-15.03.004040.0.0总数总数120软件操作:结果分析(软件操作:结果分析(2)材料卡方11.250df2渐近显著性.004精确显著性.003点概率.000多数非参数检验明显地或隐含地利用了秩的性质;数据中有相同的数值,称为结。k是样本分类的个数,表示实际观察到的频数,表示理论频数。当时船上共有2208人,其中男性1738人,女性470人。检验能否认为总体中儿童每周看电视的时间服从正
14、态分布(显著性水平a=0.两个样本和多个样本的非参数检验我们用Wilcoxon秩和检验来比较两个总体的中位数。如果两个总体具有相似的分布形状,并且中位数相同,那么由m个x、n个y组成的m十nN个观察值可以被看作来自同一总体的一个随机样本。统计量W的统计分布可以精确推导出来c2拟合优度检验、K-S检验、中位数的符号检验及Wilcoxon符号秩检验Wilcoxon符号秩检验结果(2)由于p值很小,所以有理由拒绝原假设,即认为这四个专业起薪的中位数不全相等。缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;在非正态总体小样本的情况下,如果要对总体分布的位置进行
15、推断,由于t检验不适用,也可使用符号检验的方法。选中“符号检验”,取消选择“Wilcoxon”,单击“确定”在两个独立样本的t检验不适用时,Wlicoxon秩和检验可以作为一种替代的非参数检验方法使用。一种饮料的容器材料可以选择玻璃、塑料或者金属。c2拟合优度检验、K-S检验、中位数的符号检验及Wilcoxon符号秩检验观察频数与期望频数越接近,则c2值越小。匹配设计下两组均数比较的t检验(匹配t检验)针对几乎所有类型的数据形态。结果分析(结果分析(3)l结论:计算出的c2统计量的值为11.250,自由度为2,相应的p值(渐近显著性)为0.004,小于a=0.05。所以检验的结论是拒绝总体中消
16、费者对3种材料的偏好程度无差异的零假设。特别说明特别说明l大样本、每个单元中的期望频数大于等于5时可以使用c2分布。l小样本时应该按照精确方法计算得到的p值得出结论。lc2检验也可以按照同样的思想对正态分布或者任何想象的其他分布进行检验,但主要用于对定性变量的检验。另外,c2检验也可以用于对两个总体分布的比较。单样本的非参数检验单样本的非参数检验lc2拟合优度检验对定类变量用c2统计量进行统计显著性检验lK-S拟合优度检验l中位数的符号检验检验分布l单样本K-S检验检验总体分布是否为理论分布(正态、Possion、均匀、指数)是以两位苏联数学家Kolmogorov 和 Smirnov 命名的,
17、全称为Kolmogorov-Smirnov检验。通过对两个分布差异的分析确定能否认为样本的观察值来自所设定的理论分布总体。l定义 ,显然若对每一个x值来说,如果经验分布函数与特定分布函数的拟合程度很高,则有理由认为样本数据来自具有该理论分布的总体。l检验统计量:l根据检验统计量的精确分布或渐进分布,可以计算出假设检验的p值,从而得出检验的结论。()()niiDF xF xmaxmax()()niiDF xF xlSPSS K-S检验中检验统计量Z的计算lSPSS K-S检验中p值的计算l有100名儿童每周看电视时间的数据(数据文件:电视时间.sav)。检验能否认为总体中儿童每周看电视的时间服从
18、正态分布(显著性水平a=0.05)。l这里K-S检验的零假设和备择假设为:H0:总体中儿童每周看电视的时间服从正态分布。H1:总体中儿童每周看电视的时间不服从正态分布。l在SPSS软件中打开数据文件,选择“分析”“非参数检验”“1样本K-S”,在弹出的对话框中将“时间”设定为检验变量;检验分布为默认的“常规”(正态分布)。单击“确定”时间N100正态参数a,b均值27.191标准差8.3728最极端差别绝对值.096正.096负-.039Kolmogorov-Smirnov Z.960渐近显著性(双侧).315根据皮尔逊定理,当n充分大时,c2统计量渐近服从于k-1个自由度的c2分布。统计量W
展开阅读全文