书签 分享 收藏 举报 版权申诉 / 28
上传文档赚钱

类型第八章相关性课件.ppt

  • 上传人(卖家):ziliao2023
  • 文档编号:6016764
  • 上传时间:2023-05-22
  • 格式:PPT
  • 页数:28
  • 大小:103KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第八章相关性课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第八 相关性 课件
    资源描述:

    1、第八章第八章 相关性相关性8.1 引言引言l前面我们研究了描述单一随机变量的统计方法。这些描述统计量使我们能够研究一种特定的分布,解释在这种分布下的某一得分。这些描述统计量代表了所有统计方法的基础。但同时它们又存在着局限性,因为我们不能运用它们研究两个或多个随机变量之间的关系。所以我们要运用关联性研究来观察两个随机变量是否依照系统的方式单独变化或者共同变化。如果我们发现两个随机变量之间存在着相关性,就能利用这一信息来描述甚至很可能做到预测未来的行为和事件。8.2 相关性的概念相关性的概念l相关性是一个非常强而有效地检验两个或更多变量之间关系的统计量。它可以回答许多关于两变量之间关系的自然属性的

    2、有趣问题。l首先相关系数告诉我们相关性的方向。相关系数可以是正值也可以是负值。正值说明随机变量之间是正相关关系;负值说明是负相关关系。一个正相关正相关(positive correlation)的数据集合就是一个随机变量的较大值对应另一个随机变量的较大值,一个随机变量的较小值对应另一个随机变量的较小值。一个数据集合可能是负相关负相关(negative correlation)的,那意味着X随机变量数值增加,Y随机变量有减少的趋势。lr=1.00表示一个严格的正相关关系;X随机变量增加与Y随机变量的增加严格匹配。相对比,r=-1.00表示一个严格的负相关;较小的X值与较大的Y值相联系,X增加Y减

    3、小。注意到相关性与1.00或-1.00越接近,越多数据点落在一条直线上。当计算相关系数时,我们希望一条直线能够最好地表达这些数据,这条直线表示的是线性关系(liner relationship)。l相关性分析也使我们能够检验两个随机变量相互联系的程度。相关系数可以从0到1.00。0说明两个随机变量之间没有任何关系;1.00说明存在可能的最强的关系。取值与1.00越接近,相关关系也就越强。取值为0.85,0.90或者0.96说明相关关系越来越强。取值与0越接近,相关关系也越弱。取值为0.26,0.15与0.07就是弱相关系数的例子。l无论关系强弱,相关系数的取值都可能是正是负。当相关性r=0.9

    4、时,我们可以总结为两个随机变量之间存在强的正相关关系。当r=-0.9时,仍然可以总结为存在强的相关关系,不过是负相关关系。当r=0时,两个随机变量之间不存在系统的关系。l虽然相关性是一个有用的统计量,但它本身并不能让我们推断出两个随机变量间的因果关系。在关联性研究中,研究者并不能直接控制任一个随机变量。因此,说相关系数是描述两个随机变量在多大程度上相关更加合适。要假设存在因果关系,自变量与依赖它的随机变量必须相关且数据必须来源于真实实验。8.3 其他相关系数其他相关系数l相关系数有很多种。选择不同的相关系数依赖于以下几个因素:(1)表达每一个随机变量时度量尺度的不同类型;(2)潜在分布的属性(

    5、连续或者离散);(3)分布取值的特点(线性或者非线性)l定类数据:phi系数,biserial rl顺序数据:tetrachoric,Spearman rl区间或比率数据:Kendalls tau,Pearson r,多元Rl无论你使用哪一种相关性技术,它们都拥有相同的基本特点:l1.两个或多个度量的集合都获得于相同的个体(或事件),或者是基于在相同基础上成对匹配的个体。l2.相关性可以在r=-1.00到r=1.00之间取值。两个极端值表示随机变量间的严格关系,r=0.00表示不存在线性关系。l3.一个较大的相关关系本身并不意味着随机变量间存在因果关系。8.4 计算计算Pearson乘积矩相关

    6、系数乘积矩相关系数lPearson r与z值 一个正的较大值的Pearson r说明每一个个体或者事件在两个随机变量上获得大约相等的z值。换句话说,每一个个体的数值在X和Y的分布中大致位于相同的位置。在严格的正相关关系中(r=1.00),两个随机变量中每个个体获得精确相同的z值。相似地,在严格的负相关关系中,两个随机变量中每个个体获得精确相同的z值,但是符号相反。lPearson相关系数r(Pearson r):Pearson乘积矩相关系数r,表示个体或事件在两个分布中占据相同相对位置的程度。l虽然用z值公式来定义r是一种有效的方法,但在实际应用中却并不可行。想象一下当N等于25或者更大时的巨

    7、大计算量情况,这在行为研究中是经常碰到的。你需要为每一个数计算z值,然后计算z值的交叉乘积和,再除以数据对数。当介绍标准差与方差时,我们提到有两个公式可以被用来计算相同的统计量。计算式对于计算一个统计量是非常好的,但它对理解这个统计量的含义作用不大。定义式对于理解一个统计量的逻辑是非常有用的,但对于实际的计算价值较小。r的z值公式就是后一种,它帮助我们理解怎样思考相关系数,但是不要用它来计算r。一种更加有用且省时的计算r的方法就是Raw Score公式,现在我们来看看。8.5 Pearson乘积矩相关系数:概念的由来乘积矩相关系数:概念的由来l弗朗西斯高尔顿(Francis Galton)在1

    8、9世纪末创立了相关性的概念。l虽然高尔顿首先想到“相关性”这一指标的概念,但是数学家卡尔皮尔逊(Karl Pearson)创立了以自己名字命名的统计量的数学方法。8.6 解释相关系数解释相关系数l相关系数的大小与符号 首先要问的问题就是两个随机变量是否相互联系,它们以何种方式相互联系。第二个要问的问题就是相关系数的数值大小。有很多种方法可以用来判断相关系数的数值大小。第一种方法是按照大多数行为科学研究的一般准则。科恩(Cohen,1998)建议,相关系数可以被划分为“小”、“中”、“大”。l另一种解释相关系数的方法是将它的值平方。相关系数的平方r2被称为决定系数决定系数(coefficient

    9、 of determination)。决定系数告诉我们一个随机变量的方差有多少百分比可以被另一个随机变量解释。l一种理解决定系数的方法时可以用图来表示不同的相关关系。圆圈代表随机变量X和Y,当X和Y的相关关系为0时,两个圆圈没有重叠。当相关系数的值不断增加时,重叠区域逐渐增加。两个随机变量的决定系数用两个圆圈的重叠区域大小来表示。l现在仍有一些基本的问题还没有提到和解决。“什么叫做X与Y之间有好的相关关系?”“怎样才能知道相关系数是否显著?”这是两个非常不同的问题。第一个问题与相关系数的重要性有关。当研究者们提及相关系数的重要性时,他们是想说明相关系数帮助他们更好地理解复杂的现象。相关系数的重

    10、要性依赖于研究的种类。一个相关系数值0.2也许对一位研究者来说非常重要,但对另一位来说不值一提,这完全依赖于数据被解释的条件。8.7 需要注意的几点需要注意的几点l当解释相关系数时,有一些地方需要注意。有一些很重要的因素会导致相关系数人为地很高或者很低。这些极端值的相关性有时被称为假假性相关性相关(spurious correlation),因为它们并不代表随机变量间真实的关系,也可能是一些容易引起混淆的因素造成的结果。有时候一个相关系数可能很小或者接近零。一些研究者假设研究中一个很小的相关系数意味着两个随机变量之间关系微弱或者没有关系。l两个随机变量之间缺乏明显的相关性可以有很多原因来解释。

    11、同样很多情况可以导致两个随机变量有极强的相关性,虽然这与它们真实的关系是无关的。一位优秀的研究者将试图在做出任何关于相关系数含义的结论前,为这些不一样的解释寻找原因。下面列举一些会导致假性相关的原因。l随机变量之间缺乏线性关系l截断的区域l样本容量l离群点l多总体l极值l因果关系8.8 相关性是可靠性的一种度量相关性是可靠性的一种度量l心理学研究中一个非常重要的概念就是可靠性(reliability)。可靠性指一种度量方法能够产生相同结果的这种一致性。一种测试如果在标准化条件下进行得到一致的结果,就说它是可靠的。可靠性经常用相关系数来评估。l不要混淆可靠性与有效性的概念。有效性是一种度量手段多

    12、大程度上能够达到预先的目的。如果一项测试希望度量拼写能力,那么需要提供一种较好的评估该能力的手段。如果它是一种解决词汇问题能力的有效度量,就不能用测度阅读能力来代替。有效性和可靠性相似,也可以用相关系数来评估。一次测试中的数据与它的测度数据相关或者与另一测试相关。如果这种相关关系较强,测试就被认为是有效的。8.9 相关性矩阵相关性矩阵l有时候我们相信并没有被证实的事情。例如,我们有这样的观念,一个体重超重的儿童必然会成为一个体重超重的成年人。家长们担心他们的肥胖小宝贝会变成肥胖青少年。一些肥胖的青少年担心他们的一生都将是这样的情形。但是这样认为有经验根据吗?事实是怎样的?关联性研究经常为证实或

    13、者否定这种普遍概念提供证据。你是怎样认为的?儿童时的体重是否为你一生体重的一个可靠指标?l研究者使用一种叫做Body Mass Index(BMI)的方法研究这个有关一生体重的问题。这个指标考虑到体重相对于身高的关系。出于我们的目的,我们可以将它认为是肥胖程度的一种度量。一组测试者被跟踪调查40年,他们的体重在不同时间被采集儿童,青少年,18岁,30岁和40岁。这些不同时间收集到的数据彼此相互关联。8.10 定序尺度变量与定序尺度变量与rsl度量结果是一个顺序数据。虽然能从排序数据中得到Pearson r,我们还有另外一种乘积矩系数叫做Spearman r,rs,或者叫做等级相关等级相关系数系

    14、数(rank correlation coefficient)。等级数据的相关系数降低了获取相关系数的计算工作。Spearman r对于数据中一方是顺序数据而另一方是顺序数据或者区间/比例数据的情况非常合适。在数据偏度较大时,Spearman r也是相关性的一种较好的度量。lSpearman r与Pearson r本质的不同是它们处理数据的方法不同。正如我们前面复习的,Pearson r是将数据转换为z值。因此,结果所得的数据表示它们与均值的距离。相应地,Spearman r将数据转换为等级数据。因此,变形后的数据表示从低到高的等级顺序。假设高度相关的随机变量将会拥有相同或相似地等级顺序,让我们用例子来更详细地研究这个统计量。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第八章相关性课件.ppt
    链接地址:https://www.163wenku.com/p-6016764.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库