教育测量和评价讲义第三章教育测量和评价质量特性课件(PPT 31页).pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《教育测量和评价讲义第三章教育测量和评价质量特性课件(PPT 31页).pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育测量和评价讲义第三章教育测量和评价质量特性课件PPT 31页 教育 测量 评价 讲义 第三 质量 特性 课件 PPT 31
- 资源描述:
-
1、第三章教育测量与评价的质量特性第三章教育测量与评价的质量特性l 教育测量与评价的信度教育测量与评价的信度l 教育测量与评价的效度教育测量与评价的效度l 教育测量与评价中项目的难度教育测量与评价中项目的难度l 教育测量与评价中项目的区分度教育测量与评价中项目的区分度教育测量和评价讲义第三章教育测量和评价质量特性第1页,共31页。信度的意义信度的意义 信度是指测量结果的稳定性程度,记为信度是指测量结果的稳定性程度,记为rXX。换一句话说,信度是换一句话说,信度是指用同一测量工具反复测量同一种物质对象所得多次测量结果间的指用同一测量工具反复测量同一种物质对象所得多次测量结果间的一致性程度。一致性程度
2、。测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能的重要质量指标。如果测验本身抗干扰能力强,测验实施过程各方面误差的重要质量指标。如果测验本身抗干扰能力强,测验实施过程各方面误差因素都控制得好,多次施测所得分数(测值)的一致性就高,那么测量信因素都控制得好,多次施测所得分数(测值)的一致性就高,那么测量信度高,人们在使用所得测值时就会感觉可靠。度高,人们在使用所得测值时就会感觉可靠。教育测量和评价讲义第三章教育测量和评价质量特性第2页,共31页。信度的统计定义信度的统计定义 定义定义1:信度是一个被测团体真分数方差与观察分
3、数方差之比。即:信度是一个被测团体真分数方差与观察分数方差之比。即:XX=2T/2X 定义定义2:信度是一个被试团体的真分数与观察分数的相关系数的:信度是一个被试团体的真分数与观察分数的相关系数的平方。即:平方。即:XX=2TX 定义定义3:信度是一个被试团体在测验信度是一个被试团体在测验X(A卷)上的观察分数卷)上的观察分数与在测与在测验验X的任意一个的任意一个“平行测验平行测验”X(B卷)上观察分数的相关系数。即:卷)上观察分数的相关系数。即:XX=XXXX 教育测量和评价讲义第三章教育测量和评价质量特性第3页,共31页。重测信度(稳定性系数)重测信度(稳定性系数)(1)重测信度是指用一个
4、量表(测验或评价表)对同一组被)重测信度是指用一个量表(测验或评价表)对同一组被施测两次所得结果的一致性程度,其大小等于同一组被试在两次施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。测验上所得分数的相关系数。(2)重测信度基本假设:某测验所要测量的潜在特质,短期)重测信度基本假设:某测验所要测量的潜在特质,短期内不会随着时间推移而改变。内不会随着时间推移而改变。(3)重测信度适用于异质性测验(一个测验包括几个不同的部)重测信度适用于异质性测验(一个测验包括几个不同的部分,这几个部分分别测量几个不同的心理特质,它们之间可能并不分,这几个部分分别测量几个不同的心
5、理特质,它们之间可能并不存在相关或相关较低),也适用于速度测验和运动技能测验。存在相关或相关较低),也适用于速度测验和运动技能测验。教育测量和评价讲义第三章教育测量和评价质量特性第4页,共31页。复本信度(等值性系数或等值稳定性系数)复本信度(等值性系数或等值稳定性系数)(1)复本信度是指两个平行测验(在试题格式、题数、难度、指导语说明、施测要求等)复本信度是指两个平行测验(在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验)测量同一批方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验)测量同一批被试所得结果的一
6、致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。(2)实施复本测验的方式:一是在同一个时间连续施测(此时所得的复本信度叫等值性)实施复本测验的方式:一是在同一个时间连续施测(此时所得的复本信度叫等值性系数),二是间隔一段时间后施测(此时所得复本信度叫等值稳定性系数)。系数),二是间隔一段时间后施测(此时所得复本信度叫等值稳定性系数)。(3)使用复本信度首先要构造出两份或两份以上的真正的平行测验。这是)使用复本信度首先要构造出两份或两份以上的真正的平行测验。这是一个很难达到的条件。另外,重测信度的
7、一些不足,在复本信度中仍然存在,一个很难达到的条件。另外,重测信度的一些不足,在复本信度中仍然存在,需要加以克服。需要加以克服。(4)复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。)复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。教育测量和评价讲义第三章教育测量和评价质量特性第5页,共31页。(1)同质性信度(内部一致性信度)是指测验内部所有题目间的一致性程)同质性信度(内部一致性信度)是指测验内部所有题目间的一致性程度。这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理度。这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理特质;其二是所有题目
8、得分之间都具有较高的正相关。特质;其二是所有题目得分之间都具有较高的正相关。(2)同质性信度的基本假设:当一个测验具有较高的同特性信度时,说明测验主要)同质性信度的基本假设:当一个测验具有较高的同特性信度时,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。质水平的反映。(3)同质性信度不适用于异质测验和速度测验。)同质性信度不适用于异质测验和速度测验。同质性信度的概念同质性信度的概念教育测量和评价讲义第三章教育测量和评价质量特性第6页,共31页。(1)分半信度分
9、半信度 分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的一分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。致性程度。分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个“半测验半测验”上得上得分的相关系数,只是半个测验的信度,还必须用斯皮尔曼分的相关系数,只是半个测验的信度,还必须用斯皮尔曼布朗公式加以校布朗公式加以校正正 。(2)库德理查逊信度库德理查逊信度 该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。常用的库德理该方法适合于测验
10、题目全部为二分记分题的测验的内部一致性信度分析。常用的库德理查逊公式有:查逊公式有:和和 (3)克龙巴赫系数)克龙巴赫系数 当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计算公式为:算公式为:(4)荷伊特信度荷伊特信度 1941年荷伊特提出用方差分量比来估计测验内部一致性的方法,其估计值为:年荷伊特提出用方差分量比来估计测验内部一致性的方法,其估计值为:同质性信度的估计方法同质性信度的估计方法2211xissKKhhhhxxrrr1222011xiisqpKKKR22111xKsXKXKKKR人
11、题人MSMSrxx1教育测量和评价讲义第三章教育测量和评价质量特性第7页,共31页。评分者信度评分者信度 评分者信度的含义评分者信度的含义 评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。评分者信度的计算评分者信度的计算 (1)当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评)当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评分数的相关系数。依据数据形式,可采用不同的相关系数计算方法。分数的相关系数。依据数据形式,可采用不同的相关系数计算方法。(2)当评分者人数多于两人时,评分者信
12、度可用肯德尔和谐系数进行估计。)当评分者人数多于两人时,评分者信度可用肯德尔和谐系数进行估计。NNKsW32121教育测量和评价讲义第三章教育测量和评价质量特性第8页,共31页。()百分比一致性指标()百分比一致性指标(PA)百分比一致性指标是指同一测验或两平行测验先后两次施测,其对被试的分类结百分比一致性指标是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。其计算公式为:果一致的比例。其计算公式为:()()K一致性系数一致性系数 K一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次
13、数百分比的比率。其计算公式:数百分比的比率。其计算公式:(其中其中 )()()K2 指数指数 标准参照测验关注决断的可靠性,而这种决断显然与被试团体的平均水平密切标准参照测验关注决断的可靠性,而这种决断显然与被试团体的平均水平密切相关。在考虑到这个因素的基础上,心理统计学家莱芬斯顿提出了相关。在考虑到这个因素的基础上,心理统计学家莱芬斯顿提出了K2指数作为考察标指数作为考察标准参照测验信度的指标。其计算公式为:准参照测验信度的指标。其计算公式为:或或 或或 标准参照测验的信度分析标准参照测验的信度分析2222XSXSKXXNdaPACCAPPPK1222202XSXKRSKXX22222XTK
14、NdbNdcNcaNbaPC教育测量和评价讲义第三章教育测量和评价质量特性第9页,共31页。测量标准误测量标准误 测量标准误的含义测量标准误的含义 测量标准误是指测验中所得测值偏离真分数的程度,记为测量标准误是指测验中所得测值偏离真分数的程度,记为SESE。测量标准误与测验信度的关系测量标准误与测验信度的关系 测量标准误的意义测量标准误的意义 测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解释测验分数的科学依据。释测验分数的科学依据。XXXrSSE1教育测量和评价讲义第三章教育测量和评价质量特性第10页,共
15、31页。效度的概念效度的概念 效度的意义效度的意义 效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们可以从以下几个方面来理解可以从以下几个方面来理解:效度始终是针对一定测量目的而言的;效度始终是针对一定测量目的而言的;效度只有程度上的差异;效度只有程度上的差异;效度是针对测量结果而言的;效度是针对测量结果而言的;评价一个测量是否有效要多角度、多方面地收集证据。评价一个测量是否有效要多角度、多方面地收集证据。效度的统计定义效度的统计定义 效度可定义为目标真分数方差与观察分数方差之比:效度可定义为目标真
16、分数方差与观察分数方差之比:XY=2V/2X 效度与信度的关系效度与信度的关系 ()信度高是效度高的必要而非充分条件()信度高是效度高的必要而非充分条件 ()效度系数不会大于信度系数的平方根()效度系数不会大于信度系数的平方根教育测量和评价讲义第三章教育测量和评价质量特性第11页,共31页。如何理解如何理解“效度效度”的意义?的意义?思考题思考题教育测量和评价讲义第三章教育测量和评价质量特性第12页,共31页。效度是指一个测验或量表实际能测出其所要测量效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们可以从以下几个方面来理的特性的程度。对这一概念,我们可以从以下几个方面来
17、理解:解:(1 1)效度始终是针对一定测量目的而言的;)效度始终是针对一定测量目的而言的;(2 2)效度只有程度上的差异;)效度只有程度上的差异;(3 3)效度是针对测量结果而言的;)效度是针对测量结果而言的;(4 4)评价一个测量是否有效要多角度、多方面地收集证)评价一个测量是否有效要多角度、多方面地收集证据。据。答答:教育测量和评价讲义第三章教育测量和评价质量特性第13页,共31页。内容效度内容效度 内容效度的含义及应用范围内容效度的含义及应用范围 内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。如果是教学情内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。如果是教学
18、情境下的成就测验,那么其内容效度就是看测验题目样本能体现教学目标与教材要求的程境下的成就测验,那么其内容效度就是看测验题目样本能体现教学目标与教材要求的程度。度。内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职业测验,但不适合某些心理测验(如智力测验、人格测验)。业测验,但不适合某些心理测验(如智力测验、人格测验)。内容效度的分析方法内容效度的分析方法 逻辑分析的方法逻辑分析的方法 内容效度的逻辑分析法,即依靠有关专家对测验题目与应测内容范围的吻合程度作出判断。内容效
19、度的逻辑分析法,即依靠有关专家对测验题目与应测内容范围的吻合程度作出判断。内容效度的量化分析方法内容效度的量化分析方法 该方法要求专家在仔细审阅测验目标的基础上,独立地对测验的每个题目作出判断:该方法要求专家在仔细审阅测验目标的基础上,独立地对测验的每个题目作出判断:“该该题目实际测到的内容与其欲测量的目标内容之间相关程度如何,并用四点量表(用完全无关、题目实际测到的内容与其欲测量的目标内容之间相关程度如何,并用四点量表(用完全无关、有点相关、相关较密切、完全相关来表示)来表示这种相关的程度大小有点相关、相关较密切、完全相关来表示)来表示这种相关的程度大小”;当两位专家完成此;当两位专家完成此
20、项工作后,统计弱相关(完全无关、有点相关)、强相关(相关较密切、完全相关)的题目数,项工作后,统计弱相关(完全无关、有点相关)、强相关(相关较密切、完全相关)的题目数,则此测验的内容效度系数为:内容效度系数则此测验的内容效度系数为:内容效度系数=D/(A+B+C+D)()(D D 表示两位专家都判定为强表示两位专家都判定为强相关的题目数相关的题目数)教育测量和评价讲义第三章教育测量和评价质量特性第14页,共31页。结构效度结构效度 结构效度的含义结构效度的含义 结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学或社会学上的一结构效度是指一个测验或量表实际测到所要测量的理论结构
21、(结构是指心理学或社会学上的一种理论构想或特质)的程度。种理论构想或特质)的程度。结构效度的验证一般步骤结构效度的验证一般步骤 提出有关理论结构的说明,并据此设计测量用的试题;提出有关理论结构的说明,并据此设计测量用的试题;提出可以验证该理论结构是存在的假设说明;提出可以验证该理论结构是存在的假设说明;采用各种方法收集实际的资料,以验证第二步提出的假设的正确性;采用各种方法收集实际的资料,以验证第二步提出的假设的正确性;收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重复第二和第三步,直收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重复第二和第三步,直到下
22、述的假设得到验证,即测验的结构效度获得支持为止。到下述的假设得到验证,即测验的结构效度获得支持为止。结构效度的验证方法结构效度的验证方法 测验内部寻找证据法测验内部寻找证据法 这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效度、作答这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效度、作答过程分析、测验的同质性和因素分析等四个方面。过程分析、测验的同质性和因素分析等四个方面。测验之间寻找证据法测验之间寻找证据法 这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的结构效度。这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的
23、结构效度。它包括相容效度、聚合效度、区分效度和它包括相容效度、聚合效度、区分效度和“多种特质多种方法矩阵法多种特质多种方法矩阵法”等具体方法。等具体方法。考察测验的实证效度法考察测验的实证效度法 如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该测验的结构效度如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该测验的结构效度指标,至少可以从效标的性质与种类来推论测量的结构效度。主要方法有差异被试比较法和先后测指标,至少可以从效标的性质与种类来推论测量的结构效度。主要方法有差异被试比较法和先后测试分析法。试分析法。教育测量和评价讲义第三章教育测量和评价质量特性第
展开阅读全文