书签 分享 收藏 举报 版权申诉 / 51
上传文档赚钱

类型第7章-群体间的差异比较-非参数检验51页PP课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2958583
  • 上传时间:2022-06-15
  • 格式:PPTX
  • 页数:51
  • 大小:1.43MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第7章-群体间的差异比较-非参数检验51页PP课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    群体 差异 比较 参数 检验 51 PP 课件
    资源描述:

    1、第7章7.1非参数检验概述7.2单样本的非参数检验7.4双独立样本的非参数检验7.5 多独立样本的非参数检验7.6 配对样本的非参数检验7.7 多配对样本的非参数检验3u统计量:根据样本所计算出来的样本的各种描述性指标。如均数、方差、标准差等;u参数:关于总体性质的数量化描述。如通过人口普查计算得全国人口的平均年龄。u参数估计:采用抽样方法时,可以用样本得到的“统计量”对“参数”进行估计,也叫参数估计。如用样本均数来推断总体均数。u参数检验:利用样本或总体的一些数值属性构造“统计量”(如 t 统计量、F 统计量),然后利用统计量所服从的某种已知分布来评价某种情况是不是“小概率事件”,进而拒绝原

    2、假设的方法。u参数检验要求样本是独立的、随机的,并且来自同一个正态总体,以便得到的统计量确实服从某种已知分布。u如果样本来源的总体并非正态的,但样本规模很大且总体的偏态不明显,参数检验也有一定的适用性;u 如果样本来源的总体并非正态的,同时样本规模很少,这时利用参数检验就会得到错误的结论。 非参数检验解决了这一问题,它也需要人为地构造一些统计量,但这些构造出来的统计量并不使用样本的均值或方差等这类对分布非常敏感的统计量,也不对总体分布的正态性提出要求,这种方法被称作“非参数检验”。7u在进行参数检验之前,可以先利用非参数检验看一下数据来自什么样的总体,即判断样本的分布形状,然后有针对性地在参数

    3、检验和非参数检验之间做出选择。u 拟合优度检验:判断分布形状的非参数检验。把实际观测到的样本与一个理论上的某种分布所对应的理论预测值进行比较,检验两者是否有显著的差异。包括:n随机性检验随机性检验n正态性检验正态性检验n比例检验比例检验u用于检验样本是否是随机抽样的结果。u游程:是指样本序列中连续出现相同变量值的次数。n如投掷硬币出现正反两面的变量值序列为如投掷硬币出现正反两面的变量值序列为1011011010011000101010000111。n其中连续的其中连续的1有有9组,连续的组,连续的0有有8组,这一序列总的游程数组,这一序列总的游程数量为量为17。n如果硬币的正反面出现是随机的,

    4、那么在该序列中,许多如果硬币的正反面出现是随机的,那么在该序列中,许多个个1或许多个或许多个0连续出现的可能性都不大,且连续出现的可能性都不大,且1和和0频繁交叉频繁交叉出现的可能性也非常小,因此,游程数太大或太小都将表出现的可能性也非常小,因此,游程数太大或太小都将表明变量值存在不随机的现象。明变量值存在不随机的现象。u故游程检验是对二分变量的随机检验,可用于判断观察值的顺序是否随机。u随机性检验的原假设为:总体变量值出现是随机的。分析非参数检验旧对话框游程 例:从性别的角度检验数据“手机购买.sav”是否为随机抽样。选入二分变量选入二分变量规定分界点规定分界点u结果说明概概值大于值大于0.

    5、05,因此可以接,因此可以接受受Runs检验检验的原假设的原假设,即就即就性别而言,数据性别而言,数据来自一次随来自一次随机抽样。机抽样。u单样本K-S检验的原假设:样本所属的总体与指定的理论分布一致。u分析非参数检验旧对话框1-样本 K-S 例:针对“社团.sav”,分析参加社团活动的时间是否服从正态分布。正态分布正态分布均匀分布均匀分布泊松分布泊松分布指数分布指数分布u结果说明概概值小于值小于0.05,因因此拒绝原假设此拒绝原假设,即参与社团活动即参与社团活动的时间不服从正的时间不服从正态分布。态分布。u对于任何仅可分成两类的总体,如果已知其中一类事件所占的比例为P,那么另一类所占的比例必

    6、定是1-P,用Q表示。u对于同一个总体,P值总是固定的。但在抽样过程中,每次抽样所得的P值都有可能不同。u二项分布就是从二分类的总体中抽得的随机样本中可观察到的两类比例的抽样分布。考察每个类别中观察值的频数与特定二项分布下的预期频数间是否存在统计学差异,是对二分类变量的拟合优度检验。u原假设:总体中第一类事件的比例是P。u二项分布检验的原假设:总体中第一类事件的比例是P。u分析非参数检验旧对话框二项式 例:针对“住房状况调查.sav”,分析外地户口的比例是否为15%。输入检验变量输入检验变量中第一类事件中第一类事件的比例。的比例。u结果说明单尾单尾 检验的概值小于检验的概值小于5%,则拒绝原假

    7、设,则拒绝原假设,认为外地户口的比例不认为外地户口的比例不是是15%。从观测比例来。从观测比例来看,应小于看,应小于15%。观测比例观测比例检验比例检验比例 例:针对“住房状况调查.sav”,分析现住面积在100平米以上的是否为20%.输入检验变量输入检验变量中第一类事件中第一类事件的比例。的比例。确定分割点确定分割点18u独立样本的t 检验时,要求数据来自正态分布总体的独立随机样本。或者根据中心极限定理,样本容量足够大,其均值的抽样分布近似正态分布。u 而在样本容量较小的情况下,如果样本呈非正态分布,这时就要考虑以一种更合理的非参数检验方法来代替独立样本的t检验。即秩和检验。u假设从两个未知

    8、的总体中分别独立、随机地各抽取一个样本,把两个样本中的案例合并起来,然后按照案例值的大小进行排序编号,每个数据的编号就是它的秩。u 如果混合样本中有相同的数值,就在其所在的位置将这几个相同的秩求平均,作为这几个案例值相同数值的秩。男生英男生英语成绩语成绩排序排序编号编号成绩成绩求秩求秩70117522.57532.580458555.58565.5女生英女生英语成绩语成绩排序排序编号编号成绩成绩求秩求秩80118522.58532.59044.59054.59566u分别计算来自两个样本的案例值的秩的和。u 如果两个样本具有相同分布,它们的秩和的均值应该相等。否则,则可推断两总体的分布是有差异

    9、的。英语英语成绩成绩排序排序编号编号性别性别成绩求秩成绩求秩701男1752男2.5753男2.5804男4.5805女4.5856男7.5857男7.5858女7.5859女7.59010女10.59011女10.59512女12u此例适用于双独立样本的T检验。但通过正态性检验发现,数据不符合正态分布。u样本量足够大的情况下,即使违反正态性假设,T检验也适用。u此时可做完T检验后再进一步用双独立样本的非参数检验加以验证。u分析非参数检验旧对话框2个独立样本针对数据“住房状况调查.sav”,分析本市户口和外地户口的现住面积和计划面积有无显著差异。本市户口的本市户口的现住面积和现住面积和计划面积

    10、都计划面积都更高。更高。本市户口和外地本市户口和外地户口的现住面积户口的现住面积差异显著,计划差异显著,计划面积差异不显著。面积差异不显著。25u我们在做自变量水平为两个以上的均值比较时,一般采用方差分析。u方差分析是一种非常稳健的统计分析方法,即在违反数据要求的情况下往往仍然能够得到科学的结果。u当数据的正态性假设不能满足的情况下,可进一步采用多独立样本的非参数检验来进一步说明问题。在对参加社团活动的时在对参加社团活动的时间做正态性检验时,发间做正态性检验时,发现现“time”变量不能通变量不能通过正态性检验。过正态性检验。例:数据社团.sav中,比较低年级学生、本科高年级学生、硕士生和博士

    11、生参加社团活动的时间是否有差别。违反正态性假设的前提下,仍可以做方差分析。违反正态性假设的前提下,仍可以做方差分析。方差分析结果显著。此时可进一步进行非参数检验。方差分析结果显著。此时可进一步进行非参数检验。u分析非参数检验旧对话框K个独立样本利用秩次进行检验,原利用秩次进行检验,原假设为假设为K组变量都来自组变量都来自相同的一个分布,但不相同的一个分布,但不一定要求是正态的,可一定要求是正态的,可以在违反正态性假设的以在违反正态性假设的情况下代替方差分析。情况下代替方差分析。中位数检验中位数检验结果说明:秩次越高,参加社团活秩次越高,参加社团活动的时间越多。动的时间越多。各组差异显著各组差异

    12、显著u多独立样本的非参数检验(秩和检验),可以对定序变量进行多组比较,而 t 检验和方差分析的因变量只能是定距!例:利用财经节目.sav分析不同受教育程度对财经节目的喜好程度有无差异。秩次越高,对财经节目秩次越高,对财经节目的喜好程度越低。的喜好程度越低。各组差异显各组差异显著著32u 在 t 检验中,配对样本的t 检验要求前后测的数据来自正态总体。当样本不服从正态总体时,利用配对样本的t 检验便可能对结论产生严重误导。这时可以用配对样本的非参数检验方法。 例:对20个人进行了一次心理学上关于自负程度的测试,分数越高表示自负的程度也越高。对受试者自负程度先进行前测,经过一定的指导后,再进行后测

    13、,试分析这种指导是否减少自负是否有作用。数据见自负程度.sav。u进行正态性检验知,样本并不服从正态总体。因此不能采用t 检验,考虑用配对样本的非参数检验。u原假设:前后测的差值为0(这种指导没有作用)u备择假设:后测-前测0u分析非参数检验旧对话框2个相关样本lWilcoxon检验和Sign检验都是假设前后测的数据有相同的形状分布,即两个分布有同样的均值和方差。l因此,配对样本的非参数检验并不关心分布的具体类型。u结果说明P值小于值小于5%,说明前后测的说明前后测的差值是显著的。差值是显著的。36u多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在

    14、显著差异。u数据要求:n各个样本为随机样本各个样本为随机样本n各个样本的数据是配对的,即相关样本,各个样本的容量各个样本的数据是配对的,即相关样本,各个样本的容量相同。相同。n检验方法为弗瑞德曼(检验方法为弗瑞德曼(Friedman)检验和肯德尔)检验和肯德尔(Kendall)协同系数检验时,样本应是定序、定距或定)协同系数检验时,样本应是定序、定距或定比数据。比数据。n检验方法为克科伦(检验方法为克科伦(Cochran)Q检验时,样本应是二分检验时,样本应是二分变量。变量。三种促销形式下的商品销售额商品编号促销形式1促销形式2促销形式3112866.0017223.009865.002467

    15、3.005894.005220.00310480.0014461.0010072.004769.001962.00737.0056482.0013203.009423.006796.00742.00771.007843.00965.00639.0081936.001260.001793.0094694.005222.004061.0010635.00558.00542.00 例:为比较三种促销形式对商品销售的影响,收集若干种商品在不同促销形式下的月销售额数据如下。试分析三种促销形式对销售额的影响有无显著差异。见数据“促销方式.sav”u检验思路:如果三种促销形式没有显著差异,那么销售额排序后的

    16、秩和应相等。商品商品编号编号促销形式促销形式1促销形式促销形式2促销形式促销形式3形式形式1的秩的秩形式形式2的秩的秩形式形式3的秩的秩112866.0017223.009865.0023124673.005894.005220.00123310480.0014461.0010072.002314769.001962.00737.0023156482.0013203.009423.001326796.00742.00771.003127843.00965.00639.0023181936.001260.001793.0031294694.005222.004061.0023110635.005

    17、58.00542.00321秩和212514u分析非参数检验旧对话框K个相关样本u结果说明P值小于值小于5%,说明三种促销说明三种促销形式下商品的形式下商品的销售额有显著销售额有显著差异。差异。促销形式促销形式2的商的商品销售额最高。品销售额最高。 例:有6名歌手参加比赛,4名评委进行评判打分。试推断这4个评委的评判标准是否一致。数据见“评委打分.sav”。uKendall协同系数检验主要是一致性检验。商品商品编号编号1号歌手号歌手(秩)(秩)2号歌手号歌手(秩)(秩)3号歌手号歌手(秩)(秩)4号歌手号歌手(秩)(秩)5号歌手号歌手(秩)(秩)6号歌手号歌手(秩)(秩)评委18.75(1)9

    18、.6(4)9.2(2)9.65(5)9.3(3)9.8(6)评委28.9(1)9.55(4)9.25(2)9.75(5.5)9.45(3)9.75(5.5)评委38.75(1)9.7(5.5)9.25(2)9.6(4)9.3(3)9.7(5.5)评委48.8(1)9.6(4)9.25(2)9.75(5)9.4(3)9.85(6)秩和417.5819.51223 例:有6名歌手参加比赛,4名评委进行评判打分。试推断这4个评委的评判标准是否一致。数据见“评委打分.sav”。u此问题可先进行Friedman检验,考察6个歌手的水平是否存在显著差异。u如果Friedman检验显著,则进一步进行Kend

    19、all协同系数检验。uKendalls W协同系数在0-1之间,W系数越接近于1,说明越具有一致性;反之,越不具有一致性。u分析非参数检验旧对话框K个相关样本u结果说明Friedman TestKendalls W TestFriedman检验结果显著,检验结果显著,说明歌手的水平间存在说明歌手的水平间存在显著差异。此时可进一显著差异。此时可进一步进行步进行Kendall协同系数协同系数检验推断专家评分的一检验推断专家评分的一致性。致性。Kendall检验结果显著,检验结果显著,说明专家的评判标准一说明专家的评判标准一致。同时致。同时W系数接近于系数接近于1,进一步说明专家的评判进一步说明专家

    20、的评判标准一致。标准一致。uCochran Q检验主要用于二分变量的检验。 例:数据见“航空公司.sav”是15名乘客对三家航空公司是否满意的数据(1表示满意,0表示不满意)。试推断三家航空公司的服务水平是否有显著差异。uCochran Q检验的思路:如果三家航空公司的服务水平没有显著差异,则其得到乘客选1的可能性是相等的。u分析非参数检验旧对话框K个相关样本Cochran Q检验结果显著,检验结果显著,说明三家航空公司的服说明三家航空公司的服务水平存在显著差异。务水平存在显著差异。u结果说明甲公司得到的满意最多,甲公司得到的满意最多,不满意最少。不满意最少。u1、针对数据“住房状况调查.sa

    21、v”n分析学历在高中以上的比例是否为分析学历在高中以上的比例是否为80%。n分析人均面积在分析人均面积在20平方米以下的是否为平方米以下的是否为70%。u2、在电视歌手大奖赛中,同时聘请专家和群众对歌手进行打分,评分结果如下,试比较专家和群众的评分是否有显著差异。n专家:专家:90.5 91.5 93.5 94n群众:群众:93 95 96 97 98u3、某电信公司从3所大学招聘管理人员,从而来源于3所不同大学的雇员组成了3组独立的样本。半年试用期满后,人力资源部对他们进行了考核,并评出了这些雇员的表现成绩,见数据”管理业绩.sav”,人力资源部门想就此评价雇员的管理业绩在3个总体间是否存在差异,以制定下一步的招聘计划。u4、数据”学生评教.sav”是8位学生对5位老师的评教结果。n试推断试推断5 5位老师的教学水平有无显著差异位老师的教学水平有无显著差异。n试推断试推断8 8位学生的评判标准是否是一致的。位学生的评判标准是否是一致的。u5、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天三种品牌牛奶的日销售额数据。见“牛奶.sav”。n试推断大众对三种品牌的牛奶偏好有无显著差异。试推断大众对三种品牌的牛奶偏好有无显著差异。u6、数据“手机品牌”统计了不同手机品牌的使用情况n试推断消费者对手机品牌的偏好有无显著差异。试推断消费者对手机品牌的偏好有无显著差异。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第7章-群体间的差异比较-非参数检验51页PP课件.pptx
    链接地址:https://www.163wenku.com/p-2958583.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库