第八章相关性课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第八章相关性课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 相关性 课件
- 资源描述:
-
1、第八章第八章 相关性相关性8.1 引言引言l前面我们研究了描述单一随机变量的统计方法。这些描述统计量使我们能够研究一种特定的分布,解释在这种分布下的某一得分。这些描述统计量代表了所有统计方法的基础。但同时它们又存在着局限性,因为我们不能运用它们研究两个或多个随机变量之间的关系。所以我们要运用关联性研究来观察两个随机变量是否依照系统的方式单独变化或者共同变化。如果我们发现两个随机变量之间存在着相关性,就能利用这一信息来描述甚至很可能做到预测未来的行为和事件。8.2 相关性的概念相关性的概念l相关性是一个非常强而有效地检验两个或更多变量之间关系的统计量。它可以回答许多关于两变量之间关系的自然属性的
2、有趣问题。l首先相关系数告诉我们相关性的方向。相关系数可以是正值也可以是负值。正值说明随机变量之间是正相关关系;负值说明是负相关关系。一个正相关正相关(positive correlation)的数据集合就是一个随机变量的较大值对应另一个随机变量的较大值,一个随机变量的较小值对应另一个随机变量的较小值。一个数据集合可能是负相关负相关(negative correlation)的,那意味着X随机变量数值增加,Y随机变量有减少的趋势。lr=1.00表示一个严格的正相关关系;X随机变量增加与Y随机变量的增加严格匹配。相对比,r=-1.00表示一个严格的负相关;较小的X值与较大的Y值相联系,X增加Y减
3、小。注意到相关性与1.00或-1.00越接近,越多数据点落在一条直线上。当计算相关系数时,我们希望一条直线能够最好地表达这些数据,这条直线表示的是线性关系(liner relationship)。l相关性分析也使我们能够检验两个随机变量相互联系的程度。相关系数可以从0到1.00。0说明两个随机变量之间没有任何关系;1.00说明存在可能的最强的关系。取值与1.00越接近,相关关系也就越强。取值为0.85,0.90或者0.96说明相关关系越来越强。取值与0越接近,相关关系也越弱。取值为0.26,0.15与0.07就是弱相关系数的例子。l无论关系强弱,相关系数的取值都可能是正是负。当相关性r=0.9
4、时,我们可以总结为两个随机变量之间存在强的正相关关系。当r=-0.9时,仍然可以总结为存在强的相关关系,不过是负相关关系。当r=0时,两个随机变量之间不存在系统的关系。l虽然相关性是一个有用的统计量,但它本身并不能让我们推断出两个随机变量间的因果关系。在关联性研究中,研究者并不能直接控制任一个随机变量。因此,说相关系数是描述两个随机变量在多大程度上相关更加合适。要假设存在因果关系,自变量与依赖它的随机变量必须相关且数据必须来源于真实实验。8.3 其他相关系数其他相关系数l相关系数有很多种。选择不同的相关系数依赖于以下几个因素:(1)表达每一个随机变量时度量尺度的不同类型;(2)潜在分布的属性(
5、连续或者离散);(3)分布取值的特点(线性或者非线性)l定类数据:phi系数,biserial rl顺序数据:tetrachoric,Spearman rl区间或比率数据:Kendalls tau,Pearson r,多元Rl无论你使用哪一种相关性技术,它们都拥有相同的基本特点:l1.两个或多个度量的集合都获得于相同的个体(或事件),或者是基于在相同基础上成对匹配的个体。l2.相关性可以在r=-1.00到r=1.00之间取值。两个极端值表示随机变量间的严格关系,r=0.00表示不存在线性关系。l3.一个较大的相关关系本身并不意味着随机变量间存在因果关系。8.4 计算计算Pearson乘积矩相关
6、系数乘积矩相关系数lPearson r与z值 一个正的较大值的Pearson r说明每一个个体或者事件在两个随机变量上获得大约相等的z值。换句话说,每一个个体的数值在X和Y的分布中大致位于相同的位置。在严格的正相关关系中(r=1.00),两个随机变量中每个个体获得精确相同的z值。相似地,在严格的负相关关系中,两个随机变量中每个个体获得精确相同的z值,但是符号相反。lPearson相关系数r(Pearson r):Pearson乘积矩相关系数r,表示个体或事件在两个分布中占据相同相对位置的程度。l虽然用z值公式来定义r是一种有效的方法,但在实际应用中却并不可行。想象一下当N等于25或者更大时的巨
7、大计算量情况,这在行为研究中是经常碰到的。你需要为每一个数计算z值,然后计算z值的交叉乘积和,再除以数据对数。当介绍标准差与方差时,我们提到有两个公式可以被用来计算相同的统计量。计算式对于计算一个统计量是非常好的,但它对理解这个统计量的含义作用不大。定义式对于理解一个统计量的逻辑是非常有用的,但对于实际的计算价值较小。r的z值公式就是后一种,它帮助我们理解怎样思考相关系数,但是不要用它来计算r。一种更加有用且省时的计算r的方法就是Raw Score公式,现在我们来看看。8.5 Pearson乘积矩相关系数:概念的由来乘积矩相关系数:概念的由来l弗朗西斯高尔顿(Francis Galton)在1
展开阅读全文