第四讲-非参数统计-中文版课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四讲-非参数统计-中文版课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 参数 统计 中文版 课件
- 资源描述:
-
1、数理统计数理统计非参数统计非参数统计By 爱窝窝小组爱窝窝小组非参数统计非参数统计Kruskal-Wallis单因素方差分析单因素方差分析独立样本Mann-Whitney检验配对样本配对样本 Wilcoxon 符号秩检验符号秩检验配对样本符号检检验配对样本符号检检验目录Friedman秩方差分析秩方差分析随机游程检验随机游程检验通用两样本转移模模型通用两样本转移模模型秩相关及其检检验秩相关及其检检验绪论绪论By 爱窝窝小组爱窝窝小组非参数统计非参数统计参数统计方法v定义:样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知
2、参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。v一个典型的参数检验过程:1. 总体参数(如总体均值)2. 假定数据的形态为数值型(定比数据)3. 有很强的假定(一般要求分布正态)4. 例子: Z Test, t Test, 2 TestBy 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论2.过多无法证明的假设1.有些试验的观测值无法量化参数估计的局限By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论1老师上课的质量水平32对食物的喜爱程度1.无法量化的观测值我们之前遇到的问题中观测值都是可以量化的,我们之前遇到的问题中观测值都是
3、可以量化的,比如考试的分数,两组人的身高等等,但还有一些比如考试的分数,两组人的身高等等,但还有一些观测值是无法量化的,我们可以去比较好坏,高低观测值是无法量化的,我们可以去比较好坏,高低却无法用数字来度量却无法用数字来度量By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论v在10.8中提到,用t检验比较两个基于独立样本的均值是否相等时,有隐含的假设是两个总体都服从正态分布并且有相同的方差。v但我们无法证实在实际情况下这些假设是否成立。2.过多无法证明的假设By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论v统计学家对于非参统计没有统一的定义统计学家对于非参统计没有统一的定
4、义。但有一些是大家都认同的。但有一些是大家都认同的。v当一个样本所在的分布仅有有限个参数值当一个样本所在的分布仅有有限个参数值未知,其他条件已知时,解决相关问题的未知,其他条件已知时,解决相关问题的方法叫做参数方法。方法叫做参数方法。v而非参数方法用于除此以外的所有情况而非参数方法用于除此以外的所有情况,可以可以在一个很宽泛的假设下仍可以很好的在一个很宽泛的假设下仍可以很好的推断出关于概率分布及参数的相关信息。推断出关于概率分布及参数的相关信息。By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论v例:v当总体服从正态分布,且均值和方差未知时,我们可以运用t检验。因为除了均值和方差两个
5、参数未知外,样本所在分布的其他条件已知,所以说t检验是个参数过程。v假设相互独立的样本取自两个总体,而我们要假设相互独立的样本取自两个总体,而我们要检验两个总体分布是检验两个总体分布是否否一致一致,但但分布的分布的形状未形状未知。在这种情况下,分布是不确定的,只能靠知。在这种情况下,分布是不确定的,只能靠非参数方法来检验。非参数方法来检验。By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.1 绪论v对于前面的章节所介绍了参数统计的方法,对于前面的章节所介绍了参数统计的方法,其有效性是建立在确定的分布假设成立或其有效性是建立在确定的分布假设成立或者至少近似满足的前提下。即使所有的前者至少近似满
6、足的前提下。即使所有的前提都满足,研究表明,非参数统计几乎和提都满足,研究表明,非参数统计几乎和参数统计一样能够检测出总体间的差异。参数统计一样能够检测出总体间的差异。而当分布的假设前提不满足时,非参数统而当分布的假设前提不满足时,非参数统计或许往往是测量总体间差异最有效的方计或许往往是测量总体间差异最有效的方法。因此,有很多统计学家都更倾向于使法。因此,有很多统计学家都更倾向于使用非参数统计。用非参数统计。By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.2 通用两样本移动模型v通常,我们通常,我们会从两个总体中取得观测值来检验两会从两个总体中取得观测值来检验两个总体是否有相同的分布个总体
7、是否有相同的分布。v以正态总体为例。以正态总体为例。从两个具有相同方差,均值分从两个具有相同方差,均值分别为别为x,y的正态总体中,抽取独立的随机样本的正态总体中,抽取独立的随机样本X1,X2.Xn1和和Y1,Y2.Yn2vH0: x-y=0vHa: x-yY,v 原假设原假设H0:p= v 备择假设备择假设Ha:p (或者(或者p 时,当时,当M很大时拒绝原假设很大时拒绝原假设vHa:p 时,当时,当M很小时拒绝原假设很小时拒绝原假设vHa:p 时,当时,当M很大或者很小时拒绝原假设很大或者很小时拒绝原假设By 爱窝窝小组爱窝窝小组非参数统计非参数统计符号检验的步骤(3)vBy 爱窝窝小组爱
8、窝窝小组非参数统计非参数统计符号检验的大样本情况v N25时时v 可以用正态分布来近似估计二项分布模型可以用正态分布来近似估计二项分布模型v 符号检验的统计量改为符号检验的统计量改为:v Z=(M-np)/ npqv =(2M-n)/ nv N(0,1)v 拒绝域即为拒绝域即为:v RR:|z| z /2By 爱窝窝小组爱窝窝小组非参数统计非参数统计配对试验的Wilcoxon符号秩检验在在H0之下之下,我们期望我们期望:1.n对样本中,每对差值正负总和个数各为对样本中,每对差值正负总和个数各为n/22.正负差值的绝对值相等等概率发生正负差值的绝对值相等等概率发生 正负秩总和若存在一定差异,则意
9、味着两个分布之间存在正负秩总和若存在一定差异,则意味着两个分布之间存在平移平移总体非正态时可作为总体非正态时可作为t检验的替代检验的替代By 爱窝窝小组爱窝窝小组非参数统计非参数统计H0:随机变量随机变量X和和Y分布相同分布相同Ha:1.双边检验双边检验两总体只在位置上不同,形状相同两总体只在位置上不同,形状相同 2.单边检验单边检验两总体形状相同,两总体形状相同,X分布在分布在Y的右边的右边检验统计量检验统计量: 1.T=min(T+,T-) 2.T=T-拒绝域拒绝域: 1.双边检验双边检验-如果如果 TT0,拒绝拒绝H0 2.单边检验单边检验-如果如果 T-T0,拒绝拒绝H0 配对试验的W
10、ilcoxon符号秩检验By 爱窝窝小组爱窝窝小组非参数统计非参数统计例15.4v 一个配对试验被用来检验一个配对试验被用来检验A和和B两种混合物做成的蛋糕的差别,两种两种混合物做成的蛋糕的差别,两种蛋糕各蛋糕各6个被配对放在个被配对放在6个不同的烤箱中烘烤,检验两种蛋糕密度的个不同的烤箱中烘烤,检验两种蛋糕密度的总体分布是否有差异。数据见下表。总体分布是否有差异。数据见下表。v 解:原假设:两种蛋糕密度的总体分布相同解:原假设:两种蛋糕密度的总体分布相同v 备择假设:两种蛋糕密度的总体分布不同备择假设:两种蛋糕密度的总体分布不同v 取取=0.1,从附录,从附录3表表9中双尾检验中双尾检验T的
11、临界值为的临界值为2 v v 检验统计量不在拒绝域中,所以没有充分证据表明两个总体不检验统计量不在拒绝域中,所以没有充分证据表明两个总体不同同v 因为在因为在=0.1时不拒绝原假设,所以时不拒绝原假设,所以p-value0.12:TTRR3)18, 3min(),min(TTBy 爱窝窝小组爱窝窝小组非参数统计非参数统计例15.4数据A AB BA-BA-B差的绝对值差的绝对值 差的绝对值的差的绝对值的秩秩0.135 0.135 0.129 0.129 0.006 0.006 0.006 0.006 3 30.102 0.102 0.120 0.120 -0.018 -0.018 0.018
12、0.018 5 50.108 0.108 0.112 0.112 -0.004 -0.004 0.004 0.004 1.51.50.141 0.141 0.152 0.152 -0.011 -0.011 0.011 0.011 4 40.131 0.131 0.135 0.135 -0.004 -0.004 0.004 0.004 1.51.50.144 0.144 0.163 0.163 -0.019 -0.019 0.019 0.019 6 6By 爱窝窝小组爱窝窝小组非参数统计非参数统计15.5 独立随机样本的检验:使用秩(ranks)1.如何取秩?如何取秩?将从总体将从总体I和总体和
展开阅读全文