统计学第13讲-第13章-非参数检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学第13讲-第13章-非参数检验课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 13 参数 检验 课件
- 资源描述:
-
1、第第13章章 非参数检验非参数检验13.1 导言导言 科研中不是所有的变量都可以采用参数检验,如科研中不是所有的变量都可以采用参数检验,如果变量严重偏离已知分布,可考虑采用非参数检验。果变量严重偏离已知分布,可考虑采用非参数检验。即便在小样本情况下,非参数检验仍然和参数检验一即便在小样本情况下,非参数检验仍然和参数检验一样有效。样有效。 在选择检验方法时要小心,如果是试探性的,可在选择检验方法时要小心,如果是试探性的,可选择一些样本,使用多种检验方法进行统计分析,选择一些样本,使用多种检验方法进行统计分析,借以了解不同检验方法的差异。借以了解不同检验方法的差异。 但是要避免下列错误做法:先搜集
2、数据,在但是要避免下列错误做法:先搜集数据,在“货货比三家比三家”后选择一个有利于自己科研结果的,并且能后选择一个有利于自己科研结果的,并且能带来统计显著性的统计方法带来统计显著性的统计方法科研中。虚无假设、备择假设、统计检验、抽样分布科研中。虚无假设、备择假设、统计检验、抽样分布以及显著性水平都必须在数据搜集之前就要确定下来以及显著性水平都必须在数据搜集之前就要确定下来。如果先搜集数据,再。如果先搜集数据,再“货比三家货比三家”地考虑统计分析地考虑统计分析方法,我们会为了方法,我们会为了“差异显著差异显著”而夸大偶然造成的差而夸大偶然造成的差异效应,会增大犯异效应,会增大犯类错误的概率。类错
3、误的概率。13.2 类别变量类别变量分类变量的数据就是计数数据,非参数检验适合小样分类变量的数据就是计数数据,非参数检验适合小样本的计数数据。但是当大样本时,计数数据也可考虑本的计数数据。但是当大样本时,计数数据也可考虑使用参数检验。使用参数检验。测量、等距、比率量表,当样本小并且分布不明朗测量、等距、比率量表,当样本小并且分布不明朗,不服从正态分布,可考虑非参数检验。,不服从正态分布,可考虑非参数检验。13.2.1 二项检验二项检验称名量表的测量水平最低,常用二分类,称名量表的测量水平最低,常用二分类,(two-category)或二分总体或二分总体(dichotomous populati
4、on)请同学举例说明有那些二分总体?请同学举例说明有那些二分总体?男女,对错,正反,阴阳,有无文化男女,对错,正反,阴阳,有无文化.定义:二分总体中,定义:二分总体中, p 为一类所占的比例,为一类所占的比例,q=1p为另一类所占比例。为另一类所占比例。例题:某大学教导主任说,自从学校禁售香烟以来例题:某大学教导主任说,自从学校禁售香烟以来,吸烟学生比例下降到,吸烟学生比例下降到70%以下。但是对其他学校以下。但是对其他学校观察发现,禁售对吸烟影响不大,仍然有观察发现,禁售对吸烟影响不大,仍然有70%的人的人在吸烟。请检验教导主任的说法是否正确。在吸烟。请检验教导主任的说法是否正确。随机抽取随
5、机抽取40名同学,询问发现其中有名同学,询问发现其中有12名吸烟。则名吸烟。则不吸烟的同学数量为:不吸烟的同学数量为: X=28用用 P0 表示总体吸烟比例表示总体吸烟比例 1. 虚无假设:吸烟学生总体比例虚无假设:吸烟学生总体比例P00.72. 备择假设:样本所在总体比例备择假设:样本所在总体比例P00.74. 统计检验统计检验: 二分总体二分总体 , 采用二项式检验采用二项式检验5. 抽样分布抽样分布: 统计量为统计量为 X , 在附表在附表N中列出中列出N50时时,不同不同p,q的单侧临界值。的单侧临界值。3. 显著水平:显著水平:=0.05,单尾检验,单尾检验6. 临界区间:参照表临界
6、区间:参照表N,N=40,p=0.30,q=0.70,发发现现0.05的临界值为的临界值为18,单尾检验。,单尾检验。7. 因为因为X=2818,拒绝,拒绝H0,认为教导主任是对的,认为教导主任是对的N p q 0.010.990.020.980.300.700.490.510.500.5020.010.051112.30.010.051222.400.010.053334.201826282628490.010.053445.212331333134表表N 当当N=249时时, =0.01和和0.05时时,p和和q各种取值下的临界值各种取值下的临界值N=40,=0.05,因为,因为X=281
7、8,拒,拒绝绝H0,认为教导主任是对的,认为教导主任是对的13.2.2 当当N比较大时,二项分布近似正态曲线比较大时,二项分布近似正态曲线当当p=q=0.5,或,或p、q接近接近0.5时,二项分布接近正时,二项分布接近正态分布态分布简便法则:当简便法则:当pq接近接近0或或1时,时,Npq至少等于至少等于9,当,当p=q=0.5时,时,N25。此时,二项变量此时,二项变量XN(Np, ) 的正态分布的正态分布NpqNpqNpXz 13-1z N(0, 1 ) ,X的概率的概率= z 对应的概率对应的概率例题例题 已知已知 X=5,N=20,p=q=0.5,=0.05,双尾检验,双尾检验。计算。
8、计算P(X5) 或或P(X15)23. 224. 2/5555 . 05 . 0205 . 0205 z当当=0.05,双尾检验时,双尾检验时,| z |1.96,所以拒绝,所以拒绝H0如果我们从附表如果我们从附表M中查找,中查找, X=5,N=20,双尾检验,双尾检验,发现:拒绝,发现:拒绝H0需要需要NX15,本题,本题NX=15,所,所以拒绝以拒绝H0。这和利用正态分布计算是一致的。表。这和利用正态分布计算是一致的。表M只列出了只列出了N=50的临界值,建议的临界值,建议N50时才使用正态分时才使用正态分布。布。13.3 单变量的单变量的2 检验检验肥胖与健康问题有关,亚特兰大疾控中心定
9、期进行全肥胖与健康问题有关,亚特兰大疾控中心定期进行全国青少年危机监督调查,对国青少年危机监督调查,对11631名男女青年名男女青年(9到到12年年级)自身体重观的部分调查结果。级)自身体重观的部分调查结果。偏瘦偏瘦正常正常过胖过胖合计合计419340219955816这个问题可以使用单变量这个问题可以使用单变量2 检验或拟合优度检验检验或拟合优度检验(goodness-of-fit test)观测值与虚无假设下的期望值之间是否存在差异?观测值与虚无假设下的期望值之间是否存在差异?观测值分布是否与理论分布相吻合?观测值分布是否与理论分布相吻合?表表13-1 女生的自身体重观女生的自身体重观偏瘦
10、偏瘦正常正常过胖过胖合计合计f1f2f35816H0: f1=f2=f3 kieeofff122)( 如果观察值与期望值比较接近,则如果观察值与期望值比较接近,则2 很小,不拒绝很小,不拒绝H0 , 否者否者2 会增大,会增大, 2 越大,则越有可能拒绝越大,则越有可能拒绝H0.在在 t 分布中,自由度与样本量有关,而分布中,自由度与样本量有关,而2 分布的自分布的自由度与类别由度与类别 k 有关,单变量,有关,单变量,df=k1。此题的。此题的k=3, df=3 1=2判断方法,如果判断方法,如果2 2临界值,则拒绝临界值,则拒绝H0。 表表13-2 2 部分临界值表部分临界值表体重偏低体重
11、偏低体重正常体重正常体重偏重体重偏重合计合计实际值实际值419(7%)3402(58%) 1995(34%) 5816期望值期望值1938.6671938.6671938.6675816 fofe-1519.6671463.66756.3330 (fofe)22309387.702141343.40 3173.41(fofe)2/fe1191.2241104.5441.3702=2297.138 表表13-3 女生对自身体重观念,女生对自身体重观念,H0下的期望值及下的期望值及2 值计算表值计算表因为因为2=2297.138 9.210,拒绝,拒绝H0。34%远远超过远远超过7%,这些,这些女
12、生有女生有80%正在减肥正在减肥13.4 独立类别变量的独立类别变量的2检验检验问题问题1. 不同社会经济背景的儿童,其暴力犯罪的概不同社会经济背景的儿童,其暴力犯罪的概率是否存在差异?率是否存在差异?暴力犯罪与社会经济背景是独立的?还是暴力犯罪暴力犯罪与社会经济背景是独立的?还是暴力犯罪部分取决于社会经济背景。部分取决于社会经济背景。问题问题2. 男女青年对于自身体重观念存在差异吗?男女青年对于自身体重观念存在差异吗?人们对自身体重的观念与性别有关吗?人们对自身体重的观念与性别有关吗?上述诸多问题归纳为两点:上述诸多问题归纳为两点:1. 对两个或多个称名变量的研究对两个或多个称名变量的研究2
13、. 每个类别的变量绘制成交叉表每个类别的变量绘制成交叉表交叉表的缺点:没有明显办法计算期望值交叉表的缺点:没有明显办法计算期望值表表13-4 22列联表,男女青年体重自我感觉列联表,男女青年体重自我感觉自我感觉自我感觉性别性别过轻过轻过重过重合计合计女性女性419(a)1995(b)2414男性男性959(c)855(d)1814合计合计137828504228H0:感觉与性别无关:感觉与性别无关 H1:感觉与性别有关感觉与性别有关如果如果H0是真实的,则预期女性自认为体重过轻的比是真实的,则预期女性自认为体重过轻的比例与行合计认为体重过轻的总比例相同,所以例与行合计认为体重过轻的总比例相同,
14、所以a单元单元格的期望次数为:格的期望次数为:8.7786137842282414 df=(行数行数-1)(列数列数-1)=(2-1)(2-1)=1表表13-5 男女青年体重自我感觉的期望次数男女青年体重自我感觉的期望次数单元格的期望次数单元格的期望次数性别性别过轻过轻过重过重合计合计女性女性786.781627.222414.00男性男性591.221222.781814.00合计合计1378.002850.004228.00表表13-6 每个单元格的体重卡方值每个单元格的体重卡方值(fofe)2/fe的计算的计算因为因为2=594.44 3.8415,拒绝,拒绝H0。性别性别过轻过轻过重过
15、重合计合计女性女性171.9283.122=594.44男性男性228.78110.62注意:使用注意:使用2检验要求每一个观察值或出现的频次都检验要求每一个观察值或出现的频次都与其他观察值相独立。你不可能对同一个体进行多次与其他观察值相独立。你不可能对同一个体进行多次观测,把它看做是不同被试身上得到的,那么造成的观测,把它看做是不同被试身上得到的,那么造成的误差使得误差使得“N增大增大”,导致犯,导致犯类错误。类错误。电影类型电影类型喜剧喜剧悲剧悲剧被试被试1男性男性61被试被试2男性男性40被试被试3女性女性13被试被试4女性女性02例如:研究两男两女例如:研究两男两女4位朋友看电影的情况
16、,位朋友看电影的情况,417,这类数据不能列成交叉表,宜用参数检验,这类数据不能列成交叉表,宜用参数检验电影类型电影类型喜剧喜剧悲剧悲剧合计合计男性男性10111女性女性156合计合计1161713.5 顺序量表变量顺序量表变量非参数检验非参数检验1. 曼曼-惠特尼惠特尼U检验检验(Mann Whitney U test)适用于独立样本,因变量可以是定量的,也可以是适用于独立样本,因变量可以是定量的,也可以是分类的,定量的不服从正态分布,用分类的,定量的不服从正态分布,用U检验代替检验代替 t 检验。检验。2. 符号检验符号检验(Wilcoxon sign test)适用于两组相关样本设计,根
展开阅读全文