第7章-群体间的差异比较-非参数检验51页PP课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第7章-群体间的差异比较-非参数检验51页PP课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 群体 差异 比较 参数 检验 51 PP 课件
- 资源描述:
-
1、第7章7.1非参数检验概述7.2单样本的非参数检验7.4双独立样本的非参数检验7.5 多独立样本的非参数检验7.6 配对样本的非参数检验7.7 多配对样本的非参数检验3u统计量:根据样本所计算出来的样本的各种描述性指标。如均数、方差、标准差等;u参数:关于总体性质的数量化描述。如通过人口普查计算得全国人口的平均年龄。u参数估计:采用抽样方法时,可以用样本得到的“统计量”对“参数”进行估计,也叫参数估计。如用样本均数来推断总体均数。u参数检验:利用样本或总体的一些数值属性构造“统计量”(如 t 统计量、F 统计量),然后利用统计量所服从的某种已知分布来评价某种情况是不是“小概率事件”,进而拒绝原
2、假设的方法。u参数检验要求样本是独立的、随机的,并且来自同一个正态总体,以便得到的统计量确实服从某种已知分布。u如果样本来源的总体并非正态的,但样本规模很大且总体的偏态不明显,参数检验也有一定的适用性;u 如果样本来源的总体并非正态的,同时样本规模很少,这时利用参数检验就会得到错误的结论。 非参数检验解决了这一问题,它也需要人为地构造一些统计量,但这些构造出来的统计量并不使用样本的均值或方差等这类对分布非常敏感的统计量,也不对总体分布的正态性提出要求,这种方法被称作“非参数检验”。7u在进行参数检验之前,可以先利用非参数检验看一下数据来自什么样的总体,即判断样本的分布形状,然后有针对性地在参数
3、检验和非参数检验之间做出选择。u 拟合优度检验:判断分布形状的非参数检验。把实际观测到的样本与一个理论上的某种分布所对应的理论预测值进行比较,检验两者是否有显著的差异。包括:n随机性检验随机性检验n正态性检验正态性检验n比例检验比例检验u用于检验样本是否是随机抽样的结果。u游程:是指样本序列中连续出现相同变量值的次数。n如投掷硬币出现正反两面的变量值序列为如投掷硬币出现正反两面的变量值序列为1011011010011000101010000111。n其中连续的其中连续的1有有9组,连续的组,连续的0有有8组,这一序列总的游程数组,这一序列总的游程数量为量为17。n如果硬币的正反面出现是随机的,
4、那么在该序列中,许多如果硬币的正反面出现是随机的,那么在该序列中,许多个个1或许多个或许多个0连续出现的可能性都不大,且连续出现的可能性都不大,且1和和0频繁交叉频繁交叉出现的可能性也非常小,因此,游程数太大或太小都将表出现的可能性也非常小,因此,游程数太大或太小都将表明变量值存在不随机的现象。明变量值存在不随机的现象。u故游程检验是对二分变量的随机检验,可用于判断观察值的顺序是否随机。u随机性检验的原假设为:总体变量值出现是随机的。分析非参数检验旧对话框游程 例:从性别的角度检验数据“手机购买.sav”是否为随机抽样。选入二分变量选入二分变量规定分界点规定分界点u结果说明概概值大于值大于0.
5、05,因此可以接,因此可以接受受Runs检验检验的原假设的原假设,即就即就性别而言,数据性别而言,数据来自一次随来自一次随机抽样。机抽样。u单样本K-S检验的原假设:样本所属的总体与指定的理论分布一致。u分析非参数检验旧对话框1-样本 K-S 例:针对“社团.sav”,分析参加社团活动的时间是否服从正态分布。正态分布正态分布均匀分布均匀分布泊松分布泊松分布指数分布指数分布u结果说明概概值小于值小于0.05,因因此拒绝原假设此拒绝原假设,即参与社团活动即参与社团活动的时间不服从正的时间不服从正态分布。态分布。u对于任何仅可分成两类的总体,如果已知其中一类事件所占的比例为P,那么另一类所占的比例必
6、定是1-P,用Q表示。u对于同一个总体,P值总是固定的。但在抽样过程中,每次抽样所得的P值都有可能不同。u二项分布就是从二分类的总体中抽得的随机样本中可观察到的两类比例的抽样分布。考察每个类别中观察值的频数与特定二项分布下的预期频数间是否存在统计学差异,是对二分类变量的拟合优度检验。u原假设:总体中第一类事件的比例是P。u二项分布检验的原假设:总体中第一类事件的比例是P。u分析非参数检验旧对话框二项式 例:针对“住房状况调查.sav”,分析外地户口的比例是否为15%。输入检验变量输入检验变量中第一类事件中第一类事件的比例。的比例。u结果说明单尾单尾 检验的概值小于检验的概值小于5%,则拒绝原假
7、设,则拒绝原假设,认为外地户口的比例不认为外地户口的比例不是是15%。从观测比例来。从观测比例来看,应小于看,应小于15%。观测比例观测比例检验比例检验比例 例:针对“住房状况调查.sav”,分析现住面积在100平米以上的是否为20%.输入检验变量输入检验变量中第一类事件中第一类事件的比例。的比例。确定分割点确定分割点18u独立样本的t 检验时,要求数据来自正态分布总体的独立随机样本。或者根据中心极限定理,样本容量足够大,其均值的抽样分布近似正态分布。u 而在样本容量较小的情况下,如果样本呈非正态分布,这时就要考虑以一种更合理的非参数检验方法来代替独立样本的t检验。即秩和检验。u假设从两个未知
8、的总体中分别独立、随机地各抽取一个样本,把两个样本中的案例合并起来,然后按照案例值的大小进行排序编号,每个数据的编号就是它的秩。u 如果混合样本中有相同的数值,就在其所在的位置将这几个相同的秩求平均,作为这几个案例值相同数值的秩。男生英男生英语成绩语成绩排序排序编号编号成绩成绩求秩求秩70117522.57532.580458555.58565.5女生英女生英语成绩语成绩排序排序编号编号成绩成绩求秩求秩80118522.58532.59044.59054.59566u分别计算来自两个样本的案例值的秩的和。u 如果两个样本具有相同分布,它们的秩和的均值应该相等。否则,则可推断两总体的分布是有差异
9、的。英语英语成绩成绩排序排序编号编号性别性别成绩求秩成绩求秩701男1752男2.5753男2.5804男4.5805女4.5856男7.5857男7.5858女7.5859女7.59010女10.59011女10.59512女12u此例适用于双独立样本的T检验。但通过正态性检验发现,数据不符合正态分布。u样本量足够大的情况下,即使违反正态性假设,T检验也适用。u此时可做完T检验后再进一步用双独立样本的非参数检验加以验证。u分析非参数检验旧对话框2个独立样本针对数据“住房状况调查.sav”,分析本市户口和外地户口的现住面积和计划面积有无显著差异。本市户口的本市户口的现住面积和现住面积和计划面积
10、都计划面积都更高。更高。本市户口和外地本市户口和外地户口的现住面积户口的现住面积差异显著,计划差异显著,计划面积差异不显著。面积差异不显著。25u我们在做自变量水平为两个以上的均值比较时,一般采用方差分析。u方差分析是一种非常稳健的统计分析方法,即在违反数据要求的情况下往往仍然能够得到科学的结果。u当数据的正态性假设不能满足的情况下,可进一步采用多独立样本的非参数检验来进一步说明问题。在对参加社团活动的时在对参加社团活动的时间做正态性检验时,发间做正态性检验时,发现现“time”变量不能通变量不能通过正态性检验。过正态性检验。例:数据社团.sav中,比较低年级学生、本科高年级学生、硕士生和博士
展开阅读全文