第16章非参数检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第16章非参数检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 16 参数 检验 课件
- 资源描述:
-
1、第16章 非参数检验n前面学过的参数估计和假设检验都是以总体分布已知或对分布作一定假设为前提的,我们称这类统计推断为参数统计。n但在许多实际问题中,我们不知道总体分布的情况,即使对总体的分布进行了假设,但很可能这类假设与真实情况不符。因此参数统计在一些情况下不再适用。n非参数统计:n对总体分布的形式不必做任何限制性假定,不以估计总体参数为目的的推断统计。n这种统计主要用于对某种判断或假设进行检验,故亦称非参数检验。n应当指出,这里所谓的“非参数”,只是指在检验的过程中,未对检验统计量服从的分布及参数做出限制,并不意味着在检验中“不涉及参数”或“不对参数进行检验”。非参数方法适用的数据测量尺度n
2、数据的集中测量尺度:n1.名义尺度(定类):表示个体属性或类别,可以用数值表示,也可用非数值表示n2.序数尺度(定序):对观测值排序或排秩,有顺序之分。n3.区间尺度(定距):数据具有顺序特性,且用于衡量数据间的差异,必须是数值型。n4.比例尺度(定比):数据具有区间特性,且数据的比例关系有意义,必须是数值型。n非参数检验可用的场合:n1.名义尺度、序数尺度(以上两类数据的方差、均值和标准差计算都没有意义)n2.在无法对总体概率分布做出假定时,用于区间尺度和比例尺度。n非参数检验的优点:n1.检验条件比较宽松,适应性强。n2.检验的方法比较灵活,用途更广泛。n3.检验计算相对简单,易于理解。n
3、非参数检验的缺点:n1.检验功效较低。n2.信息损耗较多。n结论:参数检验与非参数检验是针对不同情况提出的两种统计方法,它们各有优缺点,可互为补充。符号检验n1.定义n忽略具体量的差异,仅用差异的正负号来做判断的一种检验方法。适用于对无法以数字计量的情况进行比较。n2.检验步骤n(1)确定配对样本,分别计算差异正与负的数目,无差异记做0,并将它从样本中删除,相应减少样本容量n。n(2)建立假设:H0:P=0.5;Ha:P0.5n(3)观察样本容量:n若n20,做二项分布处理;若n20,做近似正态分布处理。n(4)设定显著性水平,查表确定临界值,进行判断和比较。n3.符号检验的小样本情形n例:某
4、软饮料公司想了解消费者对目前市场上的两种饮料(Citrus valley和Tropical Orange)的偏好情况,以确定消费者对其中一种是否偏爱。n以p表示消费者总体中偏爱Citrus Valley的比率,以符号来记录消费者个体的偏好。用“+”来表示偏爱Citrus Valley,用“-”来表示偏爱Tropical Orange。n我们检验的假设设定分别为:nH0:p=0.5;Ha:p0.5n若原假设为真,则”+”的个数(记为 )应服从p=0.5的二项分布。n若令显著性水平定为0.05,拒绝域为?n回忆二项分布的概率函数。n因为n因此,当显著水平设定为5%时,拒绝域为 9。025.0019
5、2.00161.00029.00002.0)2()1()0()9()3(PPPPP025.00729.00537.00161.00029.00002.0)3()2()1()0()8()4(PPPPPPn我们列出样本消费者对这两种饮料的偏好记录:消费者品牌倾向符号记录1Tropical Orange-2Tropical Orange-3Citrus Valley+4Tropical Orange-5Tropical Orange-6Tropical Orange-7Tropical Orange-8Tropical Orange-9Citrus Valley+10Tropical Orange-
6、11Tropical Orange-12Tropical Orange-n以p表示消费者总体中偏爱Citrus Valley的比率,的个数为2,恰好落入了之前分析的拒绝域中,因此拒绝H0的假设。即消费者对两种品牌的偏爱存在差异。消费者更偏爱的品牌是Tropical Orange.n4.大样本情形(n20)n例:60名消费者被随机选出对A、B两种牌子的洗发水打分,规定分数从5到1,分数越高说明评价越好。n收集的数据如下:消费者品牌A的得分品牌B的得分符号记录134-225-342+4330554-6220 我们将配对的样本得分之差做符号记录n汇总的结果:“+”表示A品牌的分数高于B品牌的分数,“
7、-”则相反,若两品牌的得分一致,我们给0值。“”的个数为15个,“”的个数为35个,“0”为10个。n通过这样的整理以后,问两张洗发水受欢迎程度是否不同?n令p表示为得到“”号的概率,表示为号个数n检验的假设设定为:H0:p=0.5;Ha:p0.5n统计量的选择:在大样本下,若H0为真,加号个数 服从正态分布,均值为u=0.5n,标准差为n25.0n因此,在H0为真的情况下,选择Z统计量,n服从标准正态分布。n此时的Z统计量同样可以由下式表示:n n 为样本中正号出现 n 的频率(此时需先删除0差 n 异样本点的影响)nnpnpnpz25.05.0)1(npnppppz/25.05.0)1(p
8、n拒绝规则:n如果|z|Z(a),拒绝H0。n在本例中,n计算的统计量n或3.050/15,15p83.250250505.01525.05.0)1(.nnpnpnpz83.250/25.02.0/25.05.0)1(npnppppzn在显著水平5%下,由于|z|=2.831.96拒绝H0。认为两个牌子受欢迎程度不同,B品牌洗发水更受消费者青睐。注意例题中的n取值:n=50,而不是60n假设某地区居民在经济改革前的经济状况记作变量X,改革后的经济状况记作变量Y。第j户居民改革前后的经济状况分别 和 。二者之间的变化记作 。n请注意,现在我们不关心具体数值,只关心它的符号。jjjyxdjyjxn
9、如果改革没有引起居民经济情况的变化,那么居民经济情况的前后差异就完全是由于各种随机因素的影响形成的(假定其它重要的影响因素都已控制不变),于是正差值的个数与负差值的个数会大体相等。把0差值舍去后,相当于对总体(正差值与负差值组成的总体)作二项试验,每次试验出现正号的概率是 p=0.5。n相反,如果改革引起了居民经济情况的明显好转,则正差值的个数会比负差值的个数多。对正差值与负差值组成的总体作二项试验,每次试验出现正号的概率是p 0.5。n检验所针对的原假设是:H0:改革没有引起居民经济情况的变化(总体X改革前的经济状况与总体Y改革后的经济状况没有差别),或nH0:p=0.5。n建立原假设为真前
10、提下的下列检验统计量:)1,0(/25.05.0Nnpzp表示为配对样本d为正的频率。n关于中位数的假设检验(运用符号检验对单总体位置特征的实例)n中位数是将总体分成均等两部分的一个分位数,其中50%位于中位数以上,另外50%位于中位数以下。n我们可以利用符号检定来对总体的中位数进行假设检验。n例:在62所新住宅组成的样本中,34所住宅的价格高于13万美元,26所住宅的价格低于13万美元,2所住宅的价格恰好为13美元。要求检验新住宅价格的中位数是否为13万美元?n如何利用符号进行检验?n当样本数据大于所假设的中位数时,我们用正号标注,反之用负号标注,若样本数据恰等于中位数时,我们用0标注,并将
11、其从样本中删除。n关于中位数的假设检验有如下设定:nH0:Median=13;Ha:Median13n大样本下,H0为真的前提下,样本数据大于中位数的个数 近似服从均值为0.5n,方差为0.25n的正态分布。n即选择统计量Z03.160250605.03425.05.0.nnZn根据统计量的抽样分布特点,推知当|z|Z(a)时,拒绝H0,否则,不能拒绝H0。n在显著水平5%下,由于1.031.96,因此我们不能拒绝H0。即不能否定新建住宅价格的中位数为13万美元的论断。n注意:样本容量n=60,而不是62n小结:n符号检验可用于单总体某个位置特征的检验(中位数检验);也可用于两总体位置分布特征
12、是否相同的检验。n但符号检验的缺点在于:仅利用差异方向或符号的正负做检验,而忽略了对差异多少的量的信息,因此对资料的利用不够充分。Wilcoxon检验n该检验是不做正态分布假定的利用匹配样本检验两总体间差异的方法。n该检验利用的信息:除了匹配样本间的差异符号(方向),同时考虑了差异数值的大小。同一个样本分别对两类方法进行试验,同时产生基于总体1和基于总体2的观察点。n适用性:1.数据类型为区间尺度数据。n2.假设成对观测值的差异总体服从正态分布。n检验步骤:n(1)计算带正、负号的差数dn(2)将d的绝对值按大小排序并编出等级(顺序号),相邻的等值以其为序的平均数为等级,0差异被剔除。n(3)
展开阅读全文