非参数统计第二章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《非参数统计第二章课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 第二 课件
- 资源描述:
-
1、第二章第二章 单样本问题单样本问题经典统计经典统计关心的问题:已知总体:已知总体 均值位置变量 方差、标准差、极差尺度变量非参数统计非参数统计关心的问题:已知:已知:样本 位置变量?尺度变量?nXX,1例如:在对人们的收入进行抽样之后,自然要对“人均收入”和“中间收入”等概念感兴趣。这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。也可能想要知道收入多少才能够算“最富的百分之五”之类的问题。这与分位点的推断有关系。除了位置,我们也希望通过数据知道它的趋势和走向,这都是本章要研究的内容。2.1 广义符号检验和有关的置信区间广义符号检验和有关的置
2、信区间例例2.1 下面是世界上71个大城市的花费指数(包括租金),按递增次序牌类如下(这里上海是44位,指数为63.5)27.8 27.8 29.1 32.2 32.7 32.7 36.4 36.5 37.5 37.7 38.8 41.9 45.2 45.8 46 47.6 48.2 49.9 51.8 52.7 54.9 55 55.3 55.5 58.2 60.8 62.7 63.5 64.6 65.3 65.3 65.3 65.4 66.2 66.7 67.7 71.2 71.7 73.9 74.3 74.5 76.2 76.6 76.8 77.7 77.9 79.1 80.9 81 8
3、2.6 85.7 86.2 86.4 89.4 89.5 90.3 90.8 91.8 92.8 95.2 97.5 98.2 99.1 99.3 100 100.6 104.1 104.6 105 109.4 122.4问题:(1)样本中位数M是否大于64.或者说是否指数小于64的城市的比例少于0.5(或指数大于64的比例是否大于0.5)(2)样本下四分位点(0.25分位点)是否小于64,。等价的说,是否指数小于64的城市的比例大于0.25(或指数小于64城市的比例是否小于0.75)由于中位数也是分位点(0.5分位点)。所以,这两个问题实际上都是关于分位点的检验问题,只不过一个是关于 分位点
4、,另一个是关于 分位点。这里面也出现了求 分位点 的 置信区间问题。本例中,分布未知,观察直方图5.025.0Q)%1(100 从图中很难说这是什么分布,我们根据 分位点的定义,并通过与分位点相关的Bernoulli试验及二项分布的性质得到需要的结果。如果 是总体的 分位点,那么意味着总体中约有比例 那么多的个体小于 。显然,关于 分位点的推断等价于关于比例 的推断。QQ2.1.1 广义符号检验:对分位点进行的检验广义符号检验:对分位点进行的检验广义符号检验广义符号检验:对连续变量 分位点 进行的检验。狭义符号检验狭义符号检验:仅针对中位数(或0.5分位点)进行的检验。假定检验的假设是:备择假
5、设可能是:5.0Q00:qQH010101:qQHqQHqQH:或、记样本中小于 的点数为 ,大于 的点数为 。并用小写的 和 分别代表 和 的实现值。记按照零假设,与 之比应该约为 左右,或 大约等于 ,而 与 之比应该约为 左右,或者说 大约等于 。如果 与 与此相差的很远,那么零假设可能有问题 。0q0qSSSSssssnssssnnss1n)1(n在零假设 下,应该服从二项分布 。下面就在二项分布变量的检验中如何计算p值的问题给出一个表 00:qQHS),(nBin这类检验之所以叫做“符号检验”,是因为 为用所有样本点减去 之后,差为正的个数,而 为用所有样本点减去 之后,差为负的个数
6、。S0qS0q大样本正态近似大样本正态近似 比较小时,可以用二项分布的公式来计算精确 值。但当 比较大时,也可以用正态分布来近似。如果在零假设 下,那么当 较大时,则可以认为00:qQH),(nBinKn)1,0()1(NnnKZ2.1.2 基于符号检验的中位数及分位点的置信基于符号检验的中位数及分位点的置信区间区间例2.2 下面是随机抽取的22个企业的纳税额(单位:万元)。数据已经按照升幂排列 1.00 1.35 1.99 2.05 2.06 2.10 2.30 2.61 2.86 2.95 2.98 3.23 3.73 4.03 4.82 5.24 6.10 6.64 6.81 6.86
7、7.11 9.002.2 Wilcoxon 符号秩检验,点估计和区间估计符号秩检验,点估计和区间估计Wilcoxon 符号秩检验 符号检验利用率观察值与零假设的中心位置之差的符号差的符号来检验,但没有利用这些差的大小差的大小(距 的远近)的信息。已知信息越多,结论越有效,所以把已知距离考虑进去更好,即Wilcoxon符号秩检验。宗旨:宗旨:把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。注意:注意:假定样本点 来自连续对称总体分布。此时,总体中位数=均值 其目的与符号检验一致,即检验0MnXX,100:MMH例2.3 下面是10个欧洲城镇每人每年平均消费的酒类
8、相当于纯酒精数(单位:升)。数据已经按照升幂排列。4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升。为此进行检验:设 ,即上述数据的中位数为11.160,因此备择假设为80M8:0MH8:1MH即检验为Wilcoxon 符号秩检验步骤如下:(1)对 ,计算 对于例2.3有3.88 2.19 0.37 1.74 2.39 3.92 4.32 4.89 5.54 6.45(2)把上面的 个绝对值排序,并找出它们的 个秩。如果有相同的样本点,每个点取平均秩(如1,4,4,5的秩为1
9、,2.5,2.5,4)对于例2.3有秩为 5 3 1 2 4 6 7 8 9 10(3)令 等于 的 的秩的和。等于 的 的秩的和。注意:加符号的秩为:-5 -3 -1 2 4 6 7 8 9 108:0MH8:1MHni,1|0MXinnW00MXi|0MXi|0MXi00MXiW2/)1(nnWW1)2/)1()1(knnWPkWP(4)对双边检验 在零假设下,与 应差不多。因而,当其中之一很小时,应怀疑零假设。取检验统计量类似地,对 ,取 对 ,取 例2.3,取(5)根据得到的W的值,得到零假设下的 值。如果 很大要用正态近似 如果 不是很大,可以通过软件或者查Wilcoxon符号秩检验
10、的分布表,得到 值(6)比较 与 ,若 则拒绝零假设。0100:MMHMMHWW),min(WWW0100:MMHMMH0100:MMHMMHWWWW9WWnpnppp 在零假设下的分布并不复杂。例如 时绝对值的秩只有1,2和3,共有8种可能的符号排列 出现了2次,因而W3n秩秩 符号的符号的8种组合种组合1-+-+-+2-+-+-+3-+-+01233456概率1/81/81/81/81/81/81/81/8W3W8/2)3(0WPH注意 和 的Wilcoxon分布有关系为由于Wilcoxon符号秩检验要求总体分布对称,我们现在将与的检验结果进行比较.WW1)12/)1()(1)2/)1()
展开阅读全文