第四章-心理测验的信度与效度课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四章-心理测验的信度与效度课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 心理 测验 信度 课件
- 资源描述:
-
1、第四章 心理测验的信度与效度任滨海任滨海2提纲v信度信度信度概述信度概述信度的类型信度的类型影响信度的因素影响信度的因素v效度效度效度概述效度概述效度的类型效度的类型影响效度的因素影响效度的因素3SV2SI2SE2SX2ST2 4第一节 信 度一、信度定义一、信度定义v 1、通俗的定义、通俗的定义信度,即测量的可靠性,多次测量结果保持一致性的程信度,即测量的可靠性,多次测量结果保持一致性的程度。度。5v2、测量学定义:、测量学定义:信度为一组测量分数的真分数方差和总方差(实得分数信度为一组测量分数的真分数方差和总方差(实得分数的方差)的比率。的方差)的比率。l信度乃是一个被试群体的真分数与实得
2、分数的相关系数信度乃是一个被试群体的真分数与实得分数的相关系数的平方。的平方。l信度乃是一个测验信度乃是一个测验X与它的任意一个平行测验与它的任意一个平行测验Y的相关系的相关系数。数。信度只受随机误差影响,系统误差不影响信度信度只受随机误差影响,系统误差不影响信度6二、信度的指标二、信度的指标 信度以信度以信度系数信度系数为指标,常用相关系数表示,表示实得为指标,常用相关系数表示,表示实得分数的变异数中有多少比例是由真分数的变异决定的,分数的变异数中有多少比例是由真分数的变异决定的,v信度系数信度系数以相关系数为指标,以相关系数为指标,r rxxxx=r=rxTxT2 2=S=ST T2 2/
3、S/SX X2 2v信度的平方根就是信度的平方根就是信度指数信度指数,r rxTxT=S=ST T/S/SX X7信度指数(rxT)与信度系数(rXX)实得分数 x2真实分数 T2rxx 信度系数(百分比)rOT2信度指数(实得分数与真实分数的相关)rxx=rxT28v信度定理:信度定理:定理定理 1:如果满足独立性条件:如果满足独立性条件(即误差分数与真分数无关即误差分数与真分数无关)时,真分数方差与观察分数方差之时,真分数方差与观察分数方差之 比比(信度系数信度系数)等于真等于真分数与观察分数之间的相关系数的平方。分数与观察分数之间的相关系数的平方。定理定理 2:如果满足平行测验条件:如果
4、满足平行测验条件 时,真分数方差与观察时,真分数方差与观察分数方差之比分数方差之比(信度系数信度系数)等于两个平行测验的观察分数之等于两个平行测验的观察分数之 间的相关系数间的相关系数。补充补充:信度系数、信度指数、测定系数的讨论:信度系数、信度指数、测定系数的讨论Baidu 测定系数测定系数 信度系数信度系数 搜索搜索。9三、信度的评估方式三、信度的评估方式v(一)重测信度(一)重测信度v(二)复本信度(二)复本信度v(三)内在一致性信度(三)内在一致性信度v(四)评分者信度(四)评分者信度10(一)重测信度(一)重测信度1、定义:用同一个测验对同一组被试在不同时间施测两次所得结、定义:用同
5、一个测验对同一组被试在不同时间施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。又称稳定性信度、再测信度、施测皮尔逊积差相关系数。又称稳定性信度、再测信度、施测再施测再施测信度、跨时间一致性。信度、跨时间一致性。11图图1 1 重测信度图式重测信度图式 10名学生幸福感调查的两次施测分数名学生幸福感调查的两次施测分数重测信度的计算举例重测信度的计算举例ABCDEFGHIJ161513131110109871516141210911867X1X2132、注意事项:、注意事项:v所测量的心理特性必须
6、是稳定的。所测量的心理特性必须是稳定的。v遗忘和练习的效果基本上是相互抵消的。遗忘和练习的效果基本上是相互抵消的。v在两次施测的间隔时期内,被试在所要测验的心理特在两次施测的间隔时期内,被试在所要测验的心理特质方面没有获得的更多的学习和训练。质方面没有获得的更多的学习和训练。v易受练习和记忆的影响,两次测试的时间间隔要适当,易受练习和记忆的影响,两次测试的时间间隔要适当,一般是一般是24周较宜,间隔时间最好不超过周较宜,间隔时间最好不超过6个月。个月。14(二)复本信度(二)复本信度1、定义:又称等值性系数,是以两个等值但题目不同的、定义:又称等值性系数,是以两个等值但题目不同的测验(复本)来
7、测量同一群体,然后求得被试者在两个测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。测验上得分的相关系数。2、方法:为排除施测顺序的影响,在实施时,可将被试、方法:为排除施测顺序的影响,在实施时,可将被试先分为两组,一组人先作先分为两组,一组人先作A型测验,再作型测验,再作B型测验;另一型测验;另一组人则反之。组人则反之。15图图2 2 复本信度图式复本信度图式 10名学生创造力的复本测验结果名学生创造力的复本测验结果复本信度的计算举例复本信度的计算举例ABCDEFGHIJX1X220191818171614121210202019161617121113917v3、注意事
8、项、注意事项要构造真正的平行测验要构造真正的平行测验 v 复本测验必须在题目的内容、数量、形式、难度、复本测验必须在题目的内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式、测验区分度、指导语、时限以及所用的例题、公式、测验其它方面都相同或相似。其它方面都相同或相似。被试有条件接受两个测验。被试有条件接受两个测验。18(三)内部一致性信度(三)内部一致性信度v1 1、定义:、定义:反映的是题目之间的关系,表示测验能够测量相同内容反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。或特质的程度。v2 2、方法:、方法:(1)(1)分半信度分半信度:v通常是先把一份测验按题
9、目的奇偶顺序或其它方法分通常是先把一份测验按题目的奇偶顺序或其它方法分成两个尽可能平行的半份测验,然后计算两半之间的成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。相关,即得到分半信度系数。19v两半变异数相等:两半变异数相等:积差相关积差相关斯皮尔曼布朗公式校正斯皮尔曼布朗公式校正 hhxxhh2rr1 r20l变异数不相等:l弗朗那根(Flanagan)公式:l卢伦(Rulon)公式:22xx2r2 1abxsss2xx21rdxss21(2)(2)同质性信度同质性信度:v测验内部所有题目间的一致性。测验内部所有题目间的一致性。用每个题目和其它题目平均数用每个题目和
10、其它题目平均数的相关。的相关。当各测题得分有较高的正相关时,即为同质;相反,当各测题得分有较高的正相关时,即为同质;相反,测题间相关很低或为负相关则为异质。测题间相关很低或为负相关则为异质。v0 0、1 1计分项目(库德计分项目(库德(Kuder(Kuder)-)-理查逊理查逊(Richardson)(Richardson)方法)方法)v非非0 0、1 1计分项目(计分项目(系数或克伦巴赫系数或克伦巴赫(Cronbach(Cronbach)公式公式 )211i ixxxkpqrks2211ixxxskrks22注意事项注意事项v 在一个测量多种特质的问卷中,不同的因子的同质在一个测量多种特质的
11、问卷中,不同的因子的同质性信度应该分开计算。性信度应该分开计算。v克伦巴赫克伦巴赫系数相当于计算了所有项目间的一致性系数相当于计算了所有项目间的一致性程度,避免了分半信度由于分半方式不同所造成的程度,避免了分半信度由于分半方式不同所造成的分半系数不一致的问题。分半系数不一致的问题。23(四)评分者信度(四)评分者信度v1、定义:用于测量不同评分者之间所产生的误差。、定义:用于测量不同评分者之间所产生的误差。是由多个评分者给一组测验结果评分,所得各个分是由多个评分者给一组测验结果评分,所得各个分数之间的一致性。数之间的一致性。l对于客观性试题,评分所引起的误差或忽略不计对于客观性试题,评分所引起
12、的误差或忽略不计l对于主观性题目来说,不同评分人员对相同被试的评分存在差异。对于主观性题目来说,不同评分人员对相同被试的评分存在差异。如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的面试等。面试等。l一般要求在成对的受过训练的评分者之间平均一致性达一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,以上,才认为评分是客观的。才认为评分是客观的。24v2、计算、计算当评分者为当评分者为2人时,可以积差相关或等级相关人时,可以积差相关或等级相关当评分者多于当评分者多于2人时,可以使用肯德尔和谐系数人时,可以使用肯德尔和谐
13、系数NNKNRRWii3222/1225如有如有A A、B B、C C三位专家给三位专家给6 6位应聘者的面试评分,结位应聘者的面试评分,结果如下,试求评分者信度。果如下,试求评分者信度。ABC175664529072603816354460604258475636969066 ABCRi15451422237345413466618533286111326=14+7+13+18+8+3=63 =142+72+132+182+82+32=811 iR2iR由题意知由题意知 K=3,N=6,将上述值代入公式有将上述值代入公式有:W=0.95 如在评定中有相同的等级时,用下式校正。其中如在评定中有
14、相同的等级时,用下式校正。其中n为为相同等级的个数相同等级的个数 6636/638111232212/1232222nnKNNKNRRWii27四、信度对测验分数的意义四、信度对测验分数的意义v1 1、解释真实分数与实得分数的相关、解释真实分数与实得分数的相关 信度系数可以解释为测验的总变异中,真分数造成的变信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。如,当异占百分之几。如,当rxxrxx=0.90=0.90时,我们可以说实得分时,我们可以说实得分数中有数中有90%90%的变异是真分数造成的,仅的变异是真分数造成的,仅10%10%来自测验的误来自测验的误差。差。rxxrxx=
15、1.00=1.00,则表示完全没有测量误差,所有的变异,则表示完全没有测量误差,所有的变异均来自真实分数;同样,信度系数也告诉测量的误差比均来自真实分数;同样,信度系数也告诉测量的误差比例是多少。例是多少。28v2 2、确定信度可以接受的水平、确定信度可以接受的水平 一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情况是况是rxxrxx=1.00=1.00,但实际上是办不到的。根据多年的研究结果,一般,但实际上是办不到的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在的能力测验和成就测验的信度系数都在0.900.90
16、以上,有的可以达以上,有的可以达0.950.95;而人格测验、兴趣、态度、价值观等测验的信度一般在而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.850.800.85或或更高些。一般原则是:当更高些。一般原则是:当rxxrxx0.700.70时,测验不能用于对个人做出评时,测验不能用于对个人做出评价或预测,而且不能作团体比较;当价或预测,而且不能作团体比较;当0.70rxx0.850.70rxx0.85时,可用于团时,可用于团体比较;当体比较;当rxx0.85rxx0.85时,才能用来鉴别或预测个人成绩或作为。时,才能用来鉴别或预测个人成绩或作为。29v3 3、解释个人分数的意义(
17、区间估计)、解释个人分数的意义(区间估计)从信度可以解释个人分数的意义,这就是测量标准误的从信度可以解释个人分数的意义,这就是测量标准误的应用。它有两个作用应用。它有两个作用v其一是估计真实分数的范围;其一是估计真实分数的范围;v其二是了解实得分数再测时可能的变化情形。其二是了解实得分数再测时可能的变化情形。30v由于误差的存在,一个人通过测量得到的分数很难由于误差的存在,一个人通过测量得到的分数很难等于真分数。理论上,我们可以对一个人施测无数等于真分数。理论上,我们可以对一个人施测无数次,然后求得所得分数的平均数和标准差。在这个次,然后求得所得分数的平均数和标准差。在这个假设的分布里,平均数
18、就是这个人的真分数,标准假设的分布里,平均数就是这个人的真分数,标准差则为误差大小的指标。差则为误差大小的指标。31X32v在实际工作中,我们用一组被试(人数足够多)两在实际工作中,我们用一组被试(人数足够多)两次施测的结果来代替对同一个人反复施测,以估计次施测的结果来代替对同一个人反复施测,以估计测量误差的变异数。此时,个人在两次测验中的分测量误差的变异数。此时,个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差(这个分布的标准差(误差分布的标准差)我们称之)我们称之为为测量的标准误,是表示测量误差的大小的指标,是
19、表示测量误差的大小的指标,其计算公式为:其计算公式为:v (公式(公式5 54 4)v式中式中SESE表示测量的标准误,即误差分布的标准差;表示测量的标准误,即误差分布的标准差;S Sx x表示一次测量分数的标准差;表示一次测量分数的标准差;r rxxxx表示信度系数。表示信度系数。xxxrSSE133v我们可以用测量的标准误来估计个人测验的真分数我们可以用测量的标准误来估计个人测验的真分数的大小。的大小。v如果选用如果选用9595的可靠性水平(置信水平),即显著的可靠性水平(置信水平),即显著性水平(性水平(a a值)为值)为.05.05,真分数有,真分数有9595的可能落入的可能落入X X
20、 1.96SE 1.96SE,即,即X X 1.96 SE1.96 SE的范围之内,也可以的范围之内,也可以写成写成X X1.96SE 1.96SE T T X X1.96 SE1.96 SE,SESE则用公式则用公式5 54 4代入。或有代入。或有5 5的可能落入这范围之外。这实际的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。上也表明了再测时分数改变的可能范围。2Z34v例例1 1,已知,已知WISC-RWISC-R的标准差为的标准差为1515,信度系数为,信度系数为0.950.95,对一名,对一名1212岁的儿童实施该测验后,岁的儿童实施该测验后,IQIQ为为110110
21、,那么他的真分数在,那么他的真分数在9595的可靠度要求下,的可靠度要求下,变动范围应是多大?变动范围应是多大?35xxxErSS135.395.0115=110tX35.396.111035.396.1110X103.4 116.6X36v注意几点:注意几点:v(1 1)SESE对真分数做的是区间估计,不可能由对真分数做的是区间估计,不可能由此得到一个确切的点。这就是说,测验分数不此得到一个确切的点。这就是说,测验分数不是一个定点,而是具有一定的分布范围。因此,是一个定点,而是具有一定的分布范围。因此,两次测验分数之间存在差异是很正常的。两次测验分数之间存在差异是很正常的。v(2 2)置信水
22、平确定后,估计的精度主要取决)置信水平确定后,估计的精度主要取决于于SESE,SESE越小,范围越小,估计就越精确,反越小,范围越小,估计就越精确,反之也然。之也然。v(3 3)真分数不能等同于真正能力或心理特质,)真分数不能等同于真正能力或心理特质,真分数中包括了系统误差。真分数中包括了系统误差。37v4 4、比较不同测验分数的差异、比较不同测验分数的差异测量标准误和测验信度在评价两个不同测验的分数是测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。分数的差别和
23、同一被试在两个测验上的差别。38v我们可以用我们可以用“差异的标准误差异的标准误”来检验差异的显著性。来检验差异的显著性。v差异的标准误的公式为:差异的标准误的公式为:v (公式(公式55)v 为差异的标准误,为差异的标准误,S为相同尺度的标准分数的标准差,为相同尺度的标准分数的标准差,Z分数为分数为1,T分数为分数为10。、分别为两个测验的信度系分别为两个测验的信度系数。数。v先将原始分数化成标准分数,然后将两个标准分数的差异先将原始分数化成标准分数,然后将两个标准分数的差异与与1.96SEd(0.05显著性水平)进行比较,如果其绝对值显著性水平)进行比较,如果其绝对值大于此值,则差异显著,
24、否则差异不显著。大于此值,则差异显著,否则差异不显著。yyxxdrrSSESESE22221dSEyyrxxr39例题例题v某被试在韦氏成人智力测验中言语智商为102,操作智商为110。假设言语测验和操作测验的信度分别为0.87和0.88,则该被试的操作智商与言语智商有显著性差异吗?v解答一:21520.870.887.5dtxxyydSESrrSE标准分数差异的范围(标准分数差异的范围(95%95%):):-1.96-1.967.57.51.961.967.57.5-14.7-14.714.714.7所以被试的操作智商与言语智商无显著性差异所以被试的操作智商与言语智商无显著性差异40解答二4
25、1v例,某校五年级进行了两次数学测验,小张第一例,某校五年级进行了两次数学测验,小张第一次考了次考了8585分,此次数学测验年级平均分是分,此次数学测验年级平均分是7777分,分,标准差是标准差是8 8分,此次测验的信度系数是分,此次测验的信度系数是0.840.84;第;第二次考了二次考了9595分,此次数学测验年级平均分是分,此次数学测验年级平均分是8181分,分,标准差是标准差是1010分,此次测验的信度系数是分,此次测验的信度系数是0.910.91;问;问小张这两次数学测验的成绩是否有显著差异?小张这两次数学测验的成绩是否有显著差异?v 42五、影响信度的因素五、影响信度的因素v样本的影
展开阅读全文