旧版心理与教育测量4-7课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《旧版心理与教育测量4-7课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 旧版 心理 教育 测量 课件
- 资源描述:
-
1、第四章测量信度测量信度1第一节 信度概述 什么是信度?什么是信度?信度(信度(reliabilityreliability)是指测量结果的稳定性程度,也叫测量的可靠)是指测量结果的稳定性程度,也叫测量的可靠性。性。操作定义:操作定义:r rxxxx=S=ST T2 2/S/Sx x2 2 r rXXXX=TXTX2 2 r rXXXX=XXXX 注意:注意:信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性;性;真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概真分数的变异数是不能直接测量的,因此信度是一个理论上
2、构想的概念,只能根据一组实得分数作出估计。念,只能根据一组实得分数作出估计。2 信度系数与信度指数信度系数与信度指数 信度指数:相关系数信度指数:相关系数 信度系数:相关系数的平方信度系数:相关系数的平方 注意:注意:信度系数有多种。信度系数有多种。同一种信度系数也会因样本、测查时间不同而有多个。同一种信度系数也会因样本、测查时间不同而有多个。信度系数只是对测量分数一致性的估计,但并没有指出不一致的原因。信度系数只是对测量分数一致性的估计,但并没有指出不一致的原因。获得较高的信度只是测验有效的必要条件。获得较高的信度只是测验有效的必要条件。3 三、信度的作用三、信度的作用 信度是测量过程中所存
3、在的随机误差大小的反映信度是测量过程中所存在的随机误差大小的反映 信度可以用来解释个人测验分数的意义信度可以用来解释个人测验分数的意义 SE=SSE=SX X1-1-r rXXXX 真分数的置信区间(真分数的置信区间(95%95%)=X=X1.96SE1.96SE 信度可以帮助进行不同测验分数的比较信度可以帮助进行不同测验分数的比较4 假设在一个智力测验中,某个被试的假设在一个智力测验中,某个被试的IQIQ为为100100,这是否反映了他,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该测验的真实水平?如果再测一次他的分数将改变多少?已知该测验的标准差为的标准差为1515,信度
4、系数为,信度系数为0.840.84、某被试在韦氏成人智力测验中言语智商为某被试在韦氏成人智力测验中言语智商为102102,操作智商为,操作智商为110.110.已知两个分数都是以已知两个分数都是以100100为平均数,为平均数,1515为标准差的标准分数。假为标准差的标准分数。假设言语测验和操作测验的分半信度分别是设言语测验和操作测验的分半信度分别是0.870.87和和0.88.0.88.问其操作问其操作智商是否显著高于言语智商呢?智商是否显著高于言语智商呢?5 一个测验可以有多个信度估计值,因而其误差估计值也会有多一个测验可以有多个信度估计值,因而其误差估计值也会有多个,在实际工作者要注意选
5、择。个,在实际工作者要注意选择。本理论假定同一个团体中所有人的测量误差都是相同的,但实本理论假定同一个团体中所有人的测量误差都是相同的,但实际上水平高的人与水平低的人在做测量时会有不同的随机误差。际上水平高的人与水平低的人在做测量时会有不同的随机误差。测量的结果不能僵硬地看成一个点,而应看成是一个以该点为测量的结果不能僵硬地看成一个点,而应看成是一个以该点为中心,以中心,以SESE的某个倍数为半径上下波动的一个范围(区间估计)的某个倍数为半径上下波动的一个范围(区间估计)6第二节 信度的估计方法 一、重测信度一、重测信度 含义和计算含义和计算 重测信度(重测信度(test-retest rel
6、iabilitytest-retest reliability)是指用同一量表对同一组被)是指用同一量表对同一组被试施测两次所得结果的一致性程度。试施测两次所得结果的一致性程度。皮尔逊积差相关系数皮尔逊积差相关系数 (教材教材p48)p48)使用的前提条件使用的前提条件 所测量的心理特质必须是稳定的;所测量的心理特质必须是稳定的;练习和遗忘的效果基本上相互抵消;练习和遗忘的效果基本上相互抵消;在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。得更多的学习和训练。7 使用重测信度时应注意使用重测信度时应注意 两
7、次测验的时间间隔要适当(研究报告中需要说明)。两次测验的时间间隔要适当(研究报告中需要说明)。再测信度适用于速度测验或人格测验,不适用于难度测验。再测信度适用于速度测验或人格测验,不适用于难度测验。重测时应注意提高被试的积极性。重测时应注意提高被试的积极性。优缺点优缺点 用再测法估计信度的优点是能提供测验结果是否随时间而变化的用再测法估计信度的优点是能提供测验结果是否随时间而变化的资料,可作为预测被试将来行为的依据。资料,可作为预测被试将来行为的依据。其缺点是易受练习和记忆的影响。其缺点是易受练习和记忆的影响。8SPSS计算 求出两次测量的总分求出两次测量的总分 Analyze-Correla
8、te-Analyze-Correlate-BivariateBivariate9 二、复本信度二、复本信度 1 1含义和计算含义和计算复本信度(复本信度(Alternate-form reliabilityAlternate-form reliability)指的是两个)指的是两个平行的测验测量平行的测验测量同一批被试所得结果的一致性程度,其值等于同一批被试在两个复本测同一批被试所得结果的一致性程度,其值等于同一批被试在两个复本测验上所得分数的积差相关系数。复本信度又称为验上所得分数的积差相关系数。复本信度又称为等值性系数等值性系数 测验实施的时间不同,复本信度所表达的含义略有不同。测验实施的
9、时间不同,复本信度所表达的含义略有不同。如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数数。如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数为稳定性与等值性系数。10 使用的前提条件使用的前提条件 两测验真正平行;两测验真正平行;被试要有条件接受两个测验。被试要有条件接受两个测验。优点优点 避免记忆效果和学习效应避免记忆效果和学习效应11 复本信度的局限性复本信度的局限性 如果所考虑的行为机能受到练习的影响很大,那么使用复如果所考
10、虑的行为机能受到练习的影响很大,那么使用复本只能减少但不能消除这种影响。本只能减少但不能消除这种影响。测验的性质会由于重复而有所改变,比如迁移的影响测验的性质会由于重复而有所改变,比如迁移的影响 编制真正的等值测验实际困难重重,因此许多测验没有复编制真正的等值测验实际困难重重,因此许多测验没有复本。本。12内部一致性信度(1)三、分半信度三、分半信度 含义和计算含义和计算 分半信度(分半信度(split-half reliabilitysplit-half reliability)是指将一个测验分)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性成对等的两半后,所有被试在这两
11、半上所得分数的一致性程度。由于分半信度描述的是两半题目间的一致性,所以程度。由于分半信度描述的是两半题目间的一致性,所以有时也被称作内部一致性系数有时也被称作内部一致性系数。计算方法:皮尔逊积差相关 校正公式:斯皮尔曼校正公式:斯皮尔曼-布朗公式布朗公式 r rxxxx=2=2 r rhhhh/(1+1+r rhhhh)13 斯布公式只有在两半测验分数的斯布公式只有在两半测验分数的时才能使用,否时才能使用,否则,应选择下面两个等价的公式之一:则,应选择下面两个等价的公式之一:弗郎那根(弗郎那根(FlanaganFlanagan)公式:)公式:r rxxxx=2 1-=2 1-(S Sa a2
12、2 +S +Sb b2 2)/S/Sx x2 2 ,S Sa a2 2 ,S Sb b2 2 ,S Sx x2 2 分别为分半测验的方差和总分的方差分别为分半测验的方差和总分的方差 卢仑(卢仑(RulonRulon)公式)公式r rxxxx=1-S=1-Sd d2 2/S/Sx x2 2 ,S Sd d2 2 是两分半测验之差的方差是两分半测验之差的方差14 应用前提及范围应用前提及范围 分半信度通常是在只能施测一次或没有复本的情况下使用。分半信度通常是在只能施测一次或没有复本的情况下使用。15 常见的分半方法是按测题序号奇偶分半:常见的分半方法是按测题序号奇偶分半:测验题目按某种顺序(如难度
13、)排列;测验题目按某种顺序(如难度)排列;如果是随机排列的题目,则必须是所有题目是平等的(要如果是随机排列的题目,则必须是所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的);么难度相等,要么性质一致,是测同一个心理特质的);如果测验有多个分量表,应在分量表内部排好顺序,再把如果测验有多个分量表,应在分量表内部排好顺序,再把各分量表的两半组合起来求相关。各分量表的两半组合起来求相关。16SPSS计算第一种算法第一种算法 题目排序,分半题目排序,分半 求积差相关求积差相关 进行斯进行斯-布公式校正布公式校正第二章算法第二章算法 直接求分半系数直接求分半系数17内部一致性信度(2)
14、四、同质性信度四、同质性信度 含义含义 同质性信度(同质性信度(homogeneity reliabilityhomogeneity reliability)也叫内部一致)也叫内部一致性系数,它是指测验内部所有题目间的一致性程度。性系数,它是指测验内部所有题目间的一致性程度。同质性信度是指一个测验所测内容或特质的相同程度。同质性信度是指一个测验所测内容或特质的相同程度。18 题目间的一致性含有两层意思:其一是指所有题目题目间的一致性含有两层意思:其一是指所有题目都测的是同一种心理特质都测的是同一种心理特质,其二是指所有题目得分其二是指所有题目得分之间都具有较高的正相关之间都具有较高的正相关。值
15、得注意的是,一些表面上看起来是测量同一种心值得注意的是,一些表面上看起来是测量同一种心理特质的题目,如果其题目间不具有较高的正相关,理特质的题目,如果其题目间不具有较高的正相关,则不能认为它们具有同质性。则不能认为它们具有同质性。19 计算及适用范围计算及适用范围r rxxxx=K =K r rijij/1+/1+(K-1K-1)r rijij ,其中其中K K为一个测验的题目个数,为一个测验的题目个数,r rijij 为项目间相关系数的平均数为项目间相关系数的平均数 (1 1)KRKR2020公式:公式:r rxxxx=K/=K/(K-1K-1)1-1-(ppi iq qi i)/S/Sx
16、x2 2 p pi i为答对第为答对第i i题的人数的比例;题的人数的比例;q qi i为答错第为答错第i i题的人数的比例。题的人数的比例。K K为题目数,为题目数,S Sx x2 2为测验总分的变异。仅适用于(为测验总分的变异。仅适用于(0 0,1 1)记分的测验。)记分的测验。(2 2)KRKR2121公式:公式:r rxxxx=K/=K/(K-1K-1)1-1-(K p q K p q)/S/Sx x2 2 只有当所有题目的难度接近时才适用只有当所有题目的难度接近时才适用20(3 3)克龙巴赫)克龙巴赫系数:系数:=K/=K/(K-1K-1)1-1-(SSi i2 2)/S/Sx x2
17、 2 克伦巴赫系数可以处理任何测验的内部一致性系数的计算问题。克伦巴赫系数可以处理任何测验的内部一致性系数的计算问题。实际上,实际上,K-RK-R 20 20 和和K-RK-R 21 21 只是只是系数的特例。系数的特例。系数是所有可能的分半信度的平均值。系数是所有可能的分半信度的平均值。是测量信度的下界的一个估计值。即是测量信度的下界的一个估计值。即值大,必有测量信度高,但值大,必有测量信度高,但值小时,却不能断定测量信度不高。值小时,却不能断定测量信度不高。21 计算步骤:计算步骤:按一定要求抽取按一定要求抽取n n个被试的试卷,计算几个人测验总分的方差个被试的试卷,计算几个人测验总分的方
18、差 这几个人在每一个题上都会有一个得分,分别求出这几个人在每道题这几个人在每一个题上都会有一个得分,分别求出这几个人在每道题上得分的方差。上得分的方差。代入公式,最后求出代入公式,最后求出。22SPSS计算 Analyze-Scale-Reliability AnalysisAnalyze-Scale-Reliability Analysis 单击单击“Statistics”Statistics”出现出现reliability Analysisreliability Analysis:StatisticsStatistics 在在DescriptivesDescriptives for for
19、 方框中选取方框中选取“item”item”、“scale”scale”、“scale if item deleted”scale if item deleted”在在“inter-item”inter-item”,单击,单击“correlations”correlations”,单击,单击“continue”continue”按钮回到按钮回到“reliability Analysis”reliability Analysis”对话框,单击对话框,单击“ok”ok”按钮。按钮。23 当研究者采用试题的标准分数总和作为量表分数时,此情况应当研究者采用试题的标准分数总和作为量表分数时,此情况应该选
20、用标准化该选用标准化系数;系数;当研究者采用试题的标准分数总和作为量表分数时,则不选用当研究者采用试题的标准分数总和作为量表分数时,则不选用标准化标准化系数系数24(4 4)荷伊特信度)荷伊特信度 测试分数的总变异可分解为被试间变异、项目间变异和人与试题交互测试分数的总变异可分解为被试间变异、项目间变异和人与试题交互作用三部分。荷伊特认为可用作用三部分。荷伊特认为可用MSMS人人作为被试方差估计值,用作为被试方差估计值,用MSMS人人题题作作为误差方差估计值。为误差方差估计值。R Rxxxx=1-MS=1-MS人人题题/MS/MS人人 一般用于预测的测验或学绩测验可不考虑同质性。而验证理论一般
21、用于预测的测验或学绩测验可不考虑同质性。而验证理论构想时必须考虑同质性。因此,同质性不但与信度有关,还与构想时必须考虑同质性。因此,同质性不但与信度有关,还与效度有关。效度有关。25 五、评分者信度五、评分者信度 含义含义 评分者信度(评分者信度(scorer reliabilityscorer reliability)是指多个评分者给同一批人的答)是指多个评分者给同一批人的答卷进行评分的一致性程度。卷进行评分的一致性程度。计算计算 2 2人时:相关系数人时:相关系数 多人时:肯德尔和谐系数多人时:肯德尔和谐系数 W=12 R W=12 R i i2-2-(R R i i)2/N/K22/N/
22、K2(N3-NN3-N)(K=3K=32020;N=3N=37 7时,查时,查W W表检验)表检验)K K是评分者人数,是评分者人数,N N是被评的对象数,是被评的对象数,R R I I为第为第i i个被试被评的水平等级个被试被评的水平等级之和之和26 将数据导入到将数据导入到SPSSSPSS中,点击:中,点击:analyse-nonparametricsanalyse-nonparametrics tests-K related samples tests-K related samples 把所有变量选中(所有作品的列)把所有变量选中(所有作品的列)再选中再选中Kendalls W,Ok
23、Kendalls W,Ok 结果出来了,结果出来了,主要看最下面一个表的数据,一个是主要看最下面一个表的数据,一个是Kendalls Kendalls WaWa,这个数字这个数字应该在应该在0.70.7以上,另一个是以上,另一个是AsympAsymp,这个数字应该小于这个数字应该小于0.05,0.05,如果如果结果不是符合这两个规则的话,一致辞性检验不通过,成绩要结果不是符合这两个规则的话,一致辞性检验不通过,成绩要重新打分。重新打分。27重测信度重测信度在两个时间点上对同一在两个时间点上对同一群人实施测验群人实施测验皮尔逊积差相关皮尔逊积差相关复本信度复本信度对同一群人实施一个测对同一群人实
24、施一个测验的两个版本验的两个版本皮尔逊积差相关皮尔逊积差相关内部一致性(分半)内部一致性(分半)一次性施测,然后分为一次性施测,然后分为两半计分两半计分皮尔逊积差相关,用斯皮尔逊积差相关,用斯皮尔曼皮尔曼-布朗公式校正布朗公式校正内部一致性(同质性)内部一致性(同质性)一次施测,然后比较所一次施测,然后比较所有可能的分半法有可能的分半法系数或系数或KR-20KR-20评判间信度评判间信度一次施测,由两个评分一次施测,由两个评分者或两种方法评分者或两种方法评分皮尔逊积差相关皮尔逊积差相关评判间信度评判间信度一次施测,由多个评分一次施测,由多个评分者或两种方法评分者或两种方法评分肯德尔和谐系数肯德
25、尔和谐系数28 评判间一致性系数评判间一致性系数 给出一个评分说明,让两个或更多人来打分,分数是顺序或者称名给出一个评分说明,让两个或更多人来打分,分数是顺序或者称名(等级或者是(等级或者是/否)否)公式公式 Cohens kappaCohens kappa 参考参考心理测量心理测量骆方骆方 孙晓敏译孙晓敏译 中国轻工业出版社中国轻工业出版社 评分者内部一致性系数评分者内部一致性系数 计算一个评分者在给不同测验打分时分数的一致性计算一个评分者在给不同测验打分时分数的一致性 系数或系数或KR-20KR-2029各种信度系数相应误差变异的来源信度信度误差变异来源误差变异来源重测信度时间取样复本信度
展开阅读全文