第十三章非参数统计分析20141225课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十三章非参数统计分析20141225课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十三 参数 统计分析 20141225 课件
- 资源描述:
-
1、第十三章第十三章 非参数统计分析非参数统计分析nonparametric testsnonparametric tests第一节 概述 非参数检验最大的缺点就是非参数检验最大的缺点就是检验效能较低检验效能较低,实际上根据国外的一项研究表明,有些方法的实际上根据国外的一项研究表明,有些方法的检验效能大约在参数检验方法的检验效能大约在参数检验方法的95%95%左右,并非左右,并非低得不能接受。低得不能接受。参数统计方法,是在已知总体分布的条件参数统计方法,是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。下,对相应分布的总体参数进行估计和检验。非参数统计方法的着眼点不是非参数统计方法的
2、着眼点不是总体参数总体参数,而,而是总体的分布情况,已知研究目标是总体的分布情况,已知研究目标总体的分布总体的分布是是否与否与已知理论分布已知理论分布相同,或者各样本所在总体的相同,或者各样本所在总体的分布位置分布位置/形状是否相同。由于这一类方法并不形状是否相同。由于这一类方法并不涉及总体参数,因而被称为非参数方法。涉及总体参数,因而被称为非参数方法。注意:非参数方法这个名称的含义指的是它的注意:非参数方法这个名称的含义指的是它的推断过程和结论均推断过程和结论均与原总体参数无关与原总体参数无关,并非说,并非说它在推断中什么分布参数都不利用,实际上,它在推断中什么分布参数都不利用,实际上,最常
3、用的秩和检验就是最常用的秩和检验就是基于秩次的分布特征基于秩次的分布特征推推导出来的,即可能会利用到秩分布的参数。导出来的,即可能会利用到秩分布的参数。nonparametric testsnonparametric tests菜单中提供了菜单中提供了8 8种非参数分种非参数分析方法,可分为两类析方法,可分为两类1.1.分布分布类型类型检验方法检验方法 :亦称拟合优度检验方法,:亦称拟合优度检验方法,即检验样本所在总体是否服从已知的总体分布即检验样本所在总体是否服从已知的总体分布包括如下过程:包括如下过程:(1 1)检验二项检验二项/多项分类变量分布多项分类变量分布的的chi-squarech
4、i-square过过程;程;(2 2)检验二项分类变量分布的)检验二项分类变量分布的binomialbinomial过程;过程;(3 3)检验样本序列随机性的)检验样本序列随机性的runsruns过程;过程;(4 4)检验样本是否服从各种常用分布的)检验样本是否服从各种常用分布的1-sample 1-sample K-SK-S过程。过程。2.2.分布位置检验方法:用于检验样本所在总体的分布位置检验方法:用于检验样本所在总体的分布位置分布位置/形状形状是否相同,最常用的一类方法。是否相同,最常用的一类方法。包括如下过程:包括如下过程:(1 1)成组资料分布位置检验的)成组资料分布位置检验的2 i
5、ndependent 2 independent samplessamples与与K independent samplesK independent samples(2 2)配对资料分布位置检验的)配对资料分布位置检验的2 related 2 related samplessamples与与K related samplesK related samplesAnalyze Analyze Nonparametric TestsNonparametric Tests(非参数检验)非参数检验)2 2 Independent Independent SamplesSamples (两独立样本比较)
6、两独立样本比较)K Independent K Independent SamplesSamples (多独立样本比较)多独立样本比较)2 2 Related SamplesRelated Samples (两相关样本比较)两相关样本比较)K K Related SamplesRelated Samples (多相关样本比较)多相关样本比较)SPSS非参数统计过程名非参数统计过程名非参数检验非参数检验两独立样本比较两独立样本比较多独立样本比较多独立样本比较两相关样本比较两相关样本比较多相关样本比较多相关样本比较第一节第一节 分布类型检验方法分布类型检验方法基本原理:算出实际分布和理论分布间的差
7、基本原理:算出实际分布和理论分布间的差异大小,然后根据某种统计量来求出异大小,然后根据某种统计量来求出P值。值。Chi-squareChi-square过程其分析目的是检验分类数据样过程其分析目的是检验分类数据样本所在总体分布(各类别所占比例)是否与已本所在总体分布(各类别所占比例)是否与已知总体分布相同,是一个单样本检验。知总体分布相同,是一个单样本检验。例:某公司准备推出一个新品牌矿泉水,现已例:某公司准备推出一个新品牌矿泉水,现已万事俱备,就是在新产品的名称上几位董事意万事俱备,就是在新产品的名称上几位董事意见尚未统一。董事会屡议不决之后,最终决定见尚未统一。董事会屡议不决之后,最终决定
8、进行抽样调查。在受访的进行抽样调查。在受访的200200人中,人中,5252人更喜人更喜欢名称欢名称A A,6161人更喜欢名称人更喜欢名称B B,8787人更喜欢名称人更喜欢名称C C,请问,请问ABCABC三种名称受欢迎的程度有无差异?三种名称受欢迎的程度有无差异?一、数据基本操作一、数据基本操作datadataWeight casesWeight cases选择此项选择此项二、基本操作过程二、基本操作过程1.1.打开主对话框打开主对话框Analyze nonparametric chi-square Analyze nonparametric chi-square 2.2.检验变量的选择
9、和设置检验变量的选择和设置在变量列表框中选择检验变量,单击右向箭头按在变量列表框中选择检验变量,单击右向箭头按钮,将其移动至右侧的钮,将其移动至右侧的“test variable listtest variable list”列列表框。表框。(1 1)Expected range(Expected range(期望范围期望范围)选项组用于选项组用于确定检验值的范围,有以下两个单选项确定检验值的范围,有以下两个单选项Get from data Get from data 默认选项,由数据的最小默认选项,由数据的最小值和最大值确定的范围。值和最大值确定的范围。Use specified range
10、 Use specified range 用户指定范围,可用户指定范围,可在被激活的在被激活的“lowerlower”和和“upperupper”参数框中键参数框中键入检验范围的下限和上限。入检验范围的下限和上限。(2 2)Expected values(Expected values(期望值期望值)选项组用于指选项组用于指定期望频数定期望频数npnp的方法的方法All categories equal All categories equal 默认选项,所有子默认选项,所有子集的期望概率值都集的期望概率值都相同相同,即检验总体是否服从,即检验总体是否服从均匀分布均匀分布Values Valu
11、es 指定分组的期望概率值。在其后的文指定分组的期望概率值。在其后的文本框内可以输入相应的大于本框内可以输入相应的大于0 0的数值。可以单的数值。可以单击击“addadd”、“changechange”、“removeremove”按钮对输入按钮对输入的数值进行增加、修改和删除。有几个类别需的数值进行增加、修改和删除。有几个类别需输入几个期望值。输入几个期望值。3.Options3.Options选项选项4.Exact tests4.Exact tests选项选项(1 1)Asymptotic only:Asymptotic only:渐进法(近似分布法),渐进法(近似分布法),默认计算显著性
12、水平的方法默认计算显著性水平的方法基本条件:渐进方法的显著性水平要求数据量足够基本条件:渐进方法的显著性水平要求数据量足够大,如果数据量比较小,或者频数过低,检验结果大,如果数据量比较小,或者频数过低,检验结果可能会失效。可能会失效。(2 2)Monte carlo Monte carlo 蒙特卡洛估计方法,精确显著蒙特卡洛估计方法,精确显著性水平的无偏估计。性水平的无偏估计。(3 3)Exact Exact 精确计算显著性水平的方法。精确计算显著性水平的方法。三、检验结果三、检验结果D De es sc cr ri ip pt ti iv ve e S St ta at ti is st t
13、i ic cs s200 2.1750.817141.003.00typeNMeanStd.DeviationMinimum Maximum1.1.描述性统计量描述性统计量2.2.期望数和观测数期望数和观测数t ty yp pe e5266.7-14.76166.7-5.78766.720.32001.002.003.00TotalObserved NExpected NResidual3.3.检验结果检验结果Test StatisticsTest Statistics9.9102.007Chi-SquareadfAsymp.Sig.type0 cells(.0%)have expected
14、frequencies less than5.The minimum expected cell frequency is 66.7.a.结论:拒绝无效假设,认为三种名称受欢迎结论:拒绝无效假设,认为三种名称受欢迎的程度不同。的程度不同。二、单样本二、单样本K-SK-S检验检验1.适用条件:连续性资料的分布情况适用条件:连续性资料的分布情况2.检验原理:它分别做出已知理论分布下的累检验原理:它分别做出已知理论分布下的累积频数分布以及观察的累积频数分布,然后对积频数分布以及观察的累积频数分布,然后对两者进行比较,从中确定两种分布的最大差异两者进行比较,从中确定两种分布的最大差异点。若样本确实服从
15、理论分布,则最大差异值点。若样本确实服从理论分布,则最大差异值不应太高,否则就应当拒绝该假设。不应太高,否则就应当拒绝该假设。基本操作如下:基本操作如下:analyzeNonparametric tests1-sample K-S1-sample K-STest variable list 框:变量名框:变量名 要检验的变量要检验的变量Grouping variable框:变量名框:变量名 分组变量分组变量Define groups:group1:1 group2:2 Continue指定所比较两组的代码指定所比较两组的代码OKK-SK-S过程的分析界面过程的分析界面【主对话框主对话框】指定需
16、要进行分布指定需要进行分布类型分析的变量,类型分析的变量,可同时指定多个,可同时指定多个,系统会分别进行分系统会分别进行分析析分析结果分析结果One-Sample Kolmogorov-Smirnov TestOne-Sample Kolmogorov-Smirnov Test742.01.819.224.216-.2241.923.001NMeanStd.DeviationNormal Parametersa,bAbsolutePositiveNegativeMost ExtremeDifferencesKolmogorov-Smirnov ZAsymp.Sig.(2-tailed)HLA-
17、ABC染色强度Test distribution is Normal.a.Calculated from data.b.第二节第二节 分布位置检验方法分布位置检验方法非参数方法的适用条件:非参数方法的适用条件:1.1.总体分布非正态分布,也无法通过适当的变量变总体分布非正态分布,也无法通过适当的变量变换达到正态分布,甚至于分布类型未知。换达到正态分布,甚至于分布类型未知。2.2.有些数据不可能精确测量,如有些数据不可能精确测量,如“50mg50mg”等。等。3.3.当数据为分类资料时,传统的参数检验方法作用当数据为分类资料时,传统的参数检验方法作用非常有限,样本量少时。非常有限,样本量少时。非
18、参数检验最大的缺点就是检验效能较低非参数检验最大的缺点就是检验效能较低一、一、2 independent samples2 independent samples与与K independent K independent samples samples 2 independent samples检验两个独立样本所在总体分布是否相同的方法检验两个独立样本所在总体分布是否相同的方法K independent samples检验多个独立样本所在总体分布是否相同的方法检验多个独立样本所在总体分布是否相同的方法Analyze nonparametric 2 independent sampleTest
19、variable list 框:变量名框:变量名 要检验的变量要检验的变量Grouping variable框:变量名框:变量名 分组变量分组变量Define groups:group1:1 group2:2 Continue指定所比较两组的代码指定所比较两组的代码OK 主对话框主对话框 1.Test variable list1.Test variable list框:指定需要进行分析的变量,可同框:指定需要进行分析的变量,可同时指定多个,系统会分别进行分析。时指定多个,系统会分别进行分析。2.Grouping variable2.Grouping variable框:指定分组变量。和两样本
20、框:指定分组变量。和两样本t t检验时检验时相同,该分组变量也必须使用相同,该分组变量也必须使用define groupsdefine groups钮详细定义进钮详细定义进行比较的两个组的变量取值。行比较的两个组的变量取值。3.Test type3.Test type复选框组合:给出四种可用来进行两组间非参复选框组合:给出四种可用来进行两组间非参数检验的方法。数检验的方法。(1(1)mann-whitney U:mann-whitney U:默认值,最常用的两样本秩和检验,默认值,最常用的两样本秩和检验,检验时利用了大小次序,要求变量至少为有序测量水平。与检验时利用了大小次序,要求变量至少为有
21、序测量水平。与wilcoxonwilcoxon秩和检验及两组比较的秩和检验及两组比较的kruskal-Walliskruskal-Wallis检验完全等检验完全等价。价。(2 2)Kolmogorov-smirnov Z:Kolmogorov-smirnov Z:检验两个独立样本是否取自同检验两个独立样本是否取自同一总体,原理是两个样本的累积频数分布曲线究竟差了多远。一总体,原理是两个样本的累积频数分布曲线究竟差了多远。(3 3)moses extreme reactions:moses extreme reactions:该检验有其该检验有其特殊用途,适用施加的处理对某些个体出现正特殊用途,
22、适用施加的处理对某些个体出现正效应,对另一些个体出现负效应时。基本思想效应,对另一些个体出现负效应时。基本思想是,在剔除了各是,在剔除了各5%5%的最大和最小值后,比较两的最大和最小值后,比较两组的极差是否相同。组的极差是否相同。(4 4)wald-wolfowitz runs:wald-wolfowitz runs:检验的是总体分检验的是总体分布情况是否相同。基于排秩后的游程检验。布情况是否相同。基于排秩后的游程检验。1 1.两独立样本比较的秩和检验两独立样本比较的秩和检验 2-2-Independent SamplesIndependent Samples例例2 2 某研究室在用药物预防高
23、原肺水肿的动物实某研究室在用药物预防高原肺水肿的动物实验中,模拟海拔验中,模拟海拔40004000m m状态下状态下1212小时后处死实验大小时后处死实验大白鼠,测得给药组与不给药(对照)组肺含水量白鼠,测得给药组与不给药(对照)组肺含水量(g gg g干重)资料,试检验两组大鼠肺含水量有无干重)资料,试检验两组大鼠肺含水量有无差别?差别?两两组组大大鼠鼠肺肺含含水水量量(g gg g 干干重重)比比较较 给给药药组组 对对照照组组 肺肺含含水水量量 秩秩次次 肺肺含含水水量量 秩秩次次 3 3.6 62 2 1 1 3 3.8 83 3 6 6 3 3.6 62 2 2 2 4 4.0 01
24、 1 9 9 3 3.6 64 4 3 3 4 4.0 04 4 1 10 0.5 5 3 3.7 75 5 4 4 4 4.0 06 6 1 12 2 3 3.8 81 1 5 5 4 4.3 31 1 1 15 5 3 3.9 94 4 7 7 4 4.4 40 0 1 16 6 3 3.9 98 8 8 8 4 4.6 64 4 1 17 7 4 4.0 04 4 1 10 0.5 5 4 4.7 72 2 1 18 8 4 4.1 15 5 1 13 3 5 5.1 15 5 1 19 9 4 4.2 23 3 1 14 4 5 5.8 88 8 2 20 0 n n1 1=1 10
25、0 T T1 1=6 67 7.5 5 n n2 2=1 10 0 T T2 2=1 14 42 2.5 5 n n行行2 2列列(指标变量、分组变量)(指标变量、分组变量)数据格式数据格式AnalyzeAnalyze Nonparametric TestsNonparametric Tests 2 2 Independent SamplesIndependent Samples 检验步骤检验步骤Two-Independent-Samples Test对话框对话框检验变量检验变量分组变量分组变量定义分组定义分组Define Groups对话框对话框点击点击“OK”,运行结果运行结果结果输出结果
展开阅读全文