信度与效度分析(qiang)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《信度与效度分析(qiang)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信度 分析 qiang 课件
- 资源描述:
-
1、第十七章 信度与效度分析 在科学研究中采用的主要方法有调查研究(survey)和实验研究(experimental study),尤其是调查研究被广泛用于公共卫生、临床医学、社会学、教育学等领域。调查研究的重要内容之一就是制定调查表或问卷。问卷以及调查质量反映在调查结果的真实性和可靠性两个方面,应采用一定的统计指标和方法加以定量考评。本章主要介绍信度(reliability)和效度(validity)分析方法,特别适合于各项目均为线性方式或等级方式的问卷或量表,如心理测量、教育测量、态度测量、生命质量测量等的标准化测定量表。第一节 信度及其评价方法一、信度的概念 信度,指量表测量某种特质(属性
2、)或概念的结果的可靠性(dependability)、稳定性(stability)和一致性(consistency)。关于信度尚无公认的定义,一般认为信度是指测量结果反映出系统中偶然误差引起的变异程度,也就是多次重复测量中结果的重现性,换言之,随机误差的变异。信度的大小用信度系数(reliability coefficient)来衡量。二、信度的数学模型 在经典测量理论中,Spearman 分数模型起着重要的作用。该模型指出任何测量所得的分数(X)都是由反映对象稳定特质的真分数(T)和由随机因素造成的误差分数(e)构成,即:(17.1)并假定:(1)e 满足标准正态分布;(2)T,e相互独立;
3、(3)T,e 以简单的线性可加性结合。eTX 这样,实测分数的方差可分解为真实分数的方差与误差分数的方差之和,即:(17.2)于是,信度可定义为真实方差与实测方差的比值,也就是总方差中真实方差所占的比例:(17.3)222eTX22/XTr 显然,r越大,说明随机误差的作用越小,测定结果越可靠。由于真实分数的方差无法得到,因此上式可转化为:(17.4)22/1Xer三、信度的评价方法 (一)重测信度 重测信度(test-retest reliability)是在一定时间间隔(所测定的特质或概念尚未发生改变)中运用同一量表作重复测量所得的信度系数,也称为稳定系数,因为它说明了使用同一测量工具重复
4、测量时个体分数的稳定性。重测信度一般用两次测定间的相关系数来衡量。根据所测定的特质的数据表现方式可采用积矩相关系数、等级相关系数、列联系数等来表示(参见相关分析有关章节)。对于标准化的测定量表,所测定的特质均以量化分的方式给出,而且多半服从正态分布,因此可直接计算积矩相关系数。值得注意的是,重测信度考评中,不同种类的受试者重测间隔期限不尽相同,原则上应在其特质无变化的期间内进行。(二)复本信度 复本信度(equivalent-form reliability)也称替代信度(alternative-form reliability)或平行信度(parallel-form reliability)
5、,是以两份等效量表分别做出测量来评价信度系数。即使用相同难度、内容和形式而具体条目不同的两份量表(互为复本)来评价信度。两量表测定结果的相关系数即为复本信度系数。该法弥补了重测信度采用完全相同的测量所带来的一些弊端。但对于量表的设计要求较高,实际中很难得到两份等价的量表,使其应用大受限制。(三)分半信度 前述的重测信度或复本信度,要对每个个体进行两次测定,这较麻烦,而且要求受测者参加两次内容相似的测量也比较困难。为此,人们更愿意采用一次性测定的评价方法,分半信度(split-half reliability)正是如此。分半信度是在一次测量后将条目分为相等的两部分,分别计算两部分的得分并以其相关
6、系数作为信度指标。这实际上考察的是指标的一致性,但因测量同一特征的指标间应关系密切,故具有一致性则说明结果可信。显然,k个条目的量表分半方法可有k!/(k/2)!(k/2)!种,如10个条目的量表有252种分法。那么,采用哪种分法呢?实际上各种分法得到的结果应很接近,因此可随机地抽取一种分法。通常采用奇数条目为一组,偶数条目为一组的分法。此外,两部分直接算出的相关系数()只表明一半条目的信度,需用Spearman-Brown公式来确定整个量表的信度(r):(17.5)rh)1/(2hhrrr 值得注意的是,评价分半信度时,需要奇偶项的条目在难度、内容、得分变异等方面相似。否则可用下面的公式来计
7、算:(17.6)1(222221SSSr 式中,分别为第一,二部分条目得分总和的方差,为全部条目得分之和的方差。实际上,该式是下面的 系数公式在分半法中的应用(取K=2)。SS1222,S2 (四)内部一致性信度 内部一致性信度(internal consistent reliability)是目前比较流行的信度评价方法,是分半信度的推广。它无需将条目分为两个部分,而是从量表的构思层次入手,以内部结构的一致性程度对信度作出估计。内部一致性信度主要有Kuder-Richardson公式和克朗巴赫系数(Cronbachs alpha)。其中,Kuder-Richardson公式是克朗巴赫系数的的特
8、殊情况,仅适用于两分类条目。克朗巴赫系数 为:(17.7)式中,K为整个量表或子量表的条目数,为第i个条目的方差,为整个量表或子量表得分的方差。)1(122SSKKiSi2S2 系数根据一次测定即可计算,使用简便,利用的信息也充分,因此,在实际工作中广为采用。因此,系数最好用于量表的低层结构(如领域、方面等子量表)的信度考察,通过每个子量表的考察结果再来综合反映整个量表的情况,而不宜仅计算一个总量表的 系数。原因是低层结构中的条目都是反映同一方面的特征,相关性较高,而总量表要考虑一定的“覆盖面”,因而具有一定的“异质性”。如在生命质量测定中可以分别计算心理功能、躯体功能等领域的 系数,在心理测
9、量中可以分别计算焦虑、抑郁、孤独等方面的 系数。(五)评价者信度 如果量表是他评而不是自评,则还要计算评价者间的一致性,此即评价者信度(inter-rater reliability),也称评分者信度(inter-scorer reliability)。一致性的考察有多种方法,如常用的kappa系数(参见有关章节)、Kendall和谐系数W等。其中,kappa系数用于定性资料,和谐系数W用于等级资料。12/)(/)(322112NNKNRRWNiiNii 在标准化测量中,不论条目形式如何,一般均转化为计量的得分值来处理,因此可用方差分析的办法来计算评价者信度,也即用组内相关系数ICC(intr
10、a-class correlation coefficient)来评价。WMSKBMSWMSBMSICC)(1此外,前述的 系数也可用于考察评价者信度,不过式(17.7)中符号的意义应重新确定。其中的K不再是量表的条目数,而是评价者人数,为第i个评价者的评分方差,为被测者在所有评价者上所得总分的方差。Si2S2四、影响信度的因素 前已述及,信度分析在理论基础上来源于经典测验理论,特定于测定样本和条目特征。因此,样本的特点(如同质性)和条目的特点(如难度等)都影响着测定的信度。此外,信度还受以下因素影响:(一)测定的具体方式和程序 比如采用测试者与被测者面对面的一一测定方式还是采用发放以后一定时
11、间再收回的方式、指导语是否清楚易懂、测定的场地及环境等都影响着测量的信度。(二)测定条目数的多少 凭经验,只有一个条目的测验不如有10个条目的测验可靠。研究表明,在一定限度内,测验的条目越多信度越高。前述的分半信度需要进行校正就是因为由一半条目构成的量表条目数减少,低估了信度。(三)测定者与被测者 测定者的身份和态度不同,常能影响测定的信度,如在我们进行的生命质量评定中,测定者以研究人员的身份和以医生的身份出现是不一样的,后者给被测者的感觉是为了了解其健康情况,是为他们着想。受测者的特征(如文化程度、对测定的认识等)也都影响着测定的信度。(四)分数分布范围的影响 信度是用相关系数来进行评价,而
12、相关系数受变量的取值范围(全距)影响。测验得分的分布范围越大,信度越高。因此,在测验中往往要选取不同层次的被试者,一方面增加样本的代表性,另一方面也增加测验的信度。第二节 效度及其评价方法一、效度的概念 效度即测量工具(如量表)的有效性和正确性,亦即准确度(accuracy)。意指量表测定了它打算(所要)测定的特质或功能(而不是其它特质或功能)以及测定的程度。它包含两层意思:(1)测量了什么;(2)测的程度。比如量表是否测量了生命质量,躯体功能分量表是否测量了躯体功能,其程度怎样。效度具有特殊性和相对性,即每个测量工具只对某特殊目的有效,仅能对其特定项目作正确的度量,或者说测验的效度总是针对着
展开阅读全文