经典测量理论、概化、项目反应理论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《经典测量理论、概化、项目反应理论课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经典 测量 理论 概化 项目 反应 课件
- 资源描述:
-
1、经典测量理论(classical test theory,CTT)2022-4-1719041904年斯皮尔曼首次提出了经典测量理论,年斯皮尔曼首次提出了经典测量理论,19501950年,美国学者格立克森(年,美国学者格立克森(GulliksenGulliksen)出版了)出版了“Theory of Mental TestsTheory of Mental Tests”一书,标志着经典一书,标志着经典测验理论的成熟。测验理论的成熟。经典测量理论主要是以真实分数模型经典测量理论主要是以真实分数模型 (true (true score model)score model)为基础为基础, ,围绕被试
2、对试题的应答结果围绕被试对试题的应答结果( (观测分数观测分数) )和被试所具有的真实的心理特质和被试所具有的真实的心理特质( (真分真分数数) )之间存在的误差进行分析之间存在的误差进行分析, ,发展并形成了包括发展并形成了包括信度、效度、区分度、等值等概念在内的比较完信度、效度、区分度、等值等概念在内的比较完整的心理与教育测量理论体系整的心理与教育测量理论体系, ,故经典测量理论又故经典测量理论又称为真分数理论。称为真分数理论。2022-4-17X=T+E任何一个测验成绩都看做是真分数和测量误差之和,这是经典测量理论的基本思想。真分数理论的基本假设:在讨论范围内在讨论范围内, ,真分数具有
3、某种程度的稳定性真分数具有某种程度的稳定性, ,即真分数不即真分数不变变, ,是常数;是常数;测量误差的期望值为测量误差的期望值为0,0,即即E=0E=0;测量误差与真分数相互独立测量误差与真分数相互独立, ,真分数与测量误差相关为真分数与测量误差相关为0 0;不同测量误差之间的相关为不同测量误差之间的相关为0 0;平行性假设平行性假设: :以相同的程度测量同一心理特质的测验称为平行测验。以相同的程度测量同一心理特质的测验称为平行测验。每个平行测验的平均数相等每个平行测验的平均数相等, ,等于同一心理特质等于同一心理特质, ,即真分数;测量误差即真分数;测量误差的平均数相等的平均数相等, ,且
4、等于且等于0 0;测量误差方差相等。;测量误差方差相等。2022-4-17根据上面的假设,可以将真分数定义为:一个被试在某一测量中无限多次测量的均值或数学期望,即经典测量理论的优点与局限性经典测量理论的优点与局限性 优点:优点: 在在2020世纪大部分年代里世纪大部分年代里, ,心理与教育测量的理心理与教育测量的理论与实践一直建立在真分数模型基础上。论与实践一直建立在真分数模型基础上。 真分数模型是以弱假设为基础的真分数模型是以弱假设为基础的, , 采用的计算采用的计算公式简单明了、浅显易懂公式简单明了、浅显易懂, ,能够对测试结果做能够对测试结果做出合理的解释出合理的解释, ,并且可操作性强
5、并且可操作性强, ,便于在实际测便于在实际测验情境验情境( (尤其是小规模资料尤其是小规模资料) )中实施中实施, ,能满足人能满足人们对将测试作为一种选拔工具的需要们对将测试作为一种选拔工具的需要, ,在测验在测验实际工作中有着较强影响力实际工作中有着较强影响力, ,并发挥着重要的并发挥着重要的指导作用。指导作用。局限性:局限性:2022-4-17(1 1)信度估计精确性不高)信度估计精确性不高 经典测量理论对信度的假设是建立在平行测验的概念假设上的,但很难找到两个测验的测量误差完全相等,不可能要求每位受试者接受同一份测验无数次,而每次测量间都彼此独立不相关。因此平行测验的理论假设很难满足。
6、在平行测验条件不满足的情况下,估计的各种信度可能有较大误差。(2 2)各参数估计受样本依赖性太大)各参数估计受样本依赖性太大 难度、区分度和信度等各项指标,依赖于它们所来自的特定的被试样本。这些指标会因接受测验的受试者样本的不同而不同,因此,同一份试卷很难获得一致的难度、区分度或信度。2022-4-17(3 3)等测量标准误差难做到)等测量标准误差难做到 真分数模型已经指出测量误差的存在,以一个相同的测量标准误作为每位受试者的测量误差,显然不适当。当测验施测于能力水平高于(或低于)测验难度的被试时就容易产生较大的测量误差,且误差会随着被试水平与测验难度距离的增加而变大。(4 4)能力量表与难度
7、量表不配套)能力量表与难度量表不配套 在经典测量理论中,被试能力量表是卷面总分,项目的难度量表是题目难度。因而不能提供不同能力水平的被试如何对项目进行反应的预测信息,找不到验证某个项目是否匹配某种能力水平被试的计量方法,这使得在选题时带有一定盲目性,失去了精确指导测验编制的作用。概化理论(generalizability theory, GT)2022-4-17克朗巴赫等人(Cronbach)于1972年出版的The Dependability of Behavioral Measurement一书是概化理论形成的标志。GT是关于行为测量的可信赖度的统计学理论。概括性:分数能够推论的范围。分数
8、能够推论的范围。可信赖度:推广应用时,推广或概括化的准确程推广应用时,推广或概括化的准确程度。度。2022-4-17GT理论的基本思想是,任何测量都处在一定的情境关系之中,应该从测量的情境关系中具体地考察测量工作,提出了多种真分数与多种不同的信度系数的观念,并设计了一套方法去系统辩明与实验性研究多种误差方差的来源。用“全域分数”(Universe Score)代替“真分数”(True Score) ,用“概括化系数,G系数”(Generalizability Coefficent)代替了“信度”。2022-4-17概化理论把全域分数方差对总方差的比称为为概括力系数(简称G系数)。而总方差可以分
9、成全域分数方差2(p)和误差分数方差2()。概化理论的研究程序2022-4-17G G研究研究(G study):(G study):测量的测量的过程中有哪些因素会影过程中有哪些因素会影响被试的测量结果。响被试的测量结果。测量目标主效应方差、测测量目标主效应方差、测量面的主效应方差、各种量面的主效应方差、各种交互效应方差。交互效应方差。D D研究研究(D study)(D study)概化系数概化系数可信赖指数可信赖指数2022-4-17测量工作中要加以认识和应用的心理特质水平是测量目标。而构成测量条件与具体情境关系的因素,称为测量侧面(Facets of Measurement)。测量侧面又
10、分为随机侧面和固定侧面。进行测验的标准化就是对某些测量侧面进行固定。固定测量侧面可以减少测量误差,但却会使测量目标变得更为局限,这样,测验所得的分数就不能再推广到原来那么宽广的范围了。GTGT与与CTTCTT的几点比较的几点比较2022-4-17(1 1)CTTCTT要求严格平行测验的要求严格平行测验的“强假设强假设”,即两个平行测验的,即两个平行测验的实测分数必须具有相同的平均数和方差,否则无法确定测验实测分数必须具有相同的平均数和方差,否则无法确定测验信度的意义;而信度的意义;而GTGT只要求随机平行的只要求随机平行的“弱假设弱假设”,所谓随机,所谓随机平行测验是指随机取自同一题库的长度相
11、同的测验。因而平行测验是指随机取自同一题库的长度相同的测验。因而CTTCTT的应用范围受到许多限制,而的应用范围受到许多限制,而GTGT的应用范围则更广泛,的应用范围则更广泛,应用也更合理。应用也更合理。(2 2)CTTCTT把测验分数简单划分为真分数和误差分数两个部分,把测验分数简单划分为真分数和误差分数两个部分,误差分数是单一的、含混的、随机的,这就导致不能有效地误差分数是单一的、含混的、随机的,这就导致不能有效地解释影响人的心理活动因素的多样性,从而在实践上对控制解释影响人的心理活动因素的多样性,从而在实践上对控制误差缺乏有效指导。误差缺乏有效指导。GTGT采用方差分析方法,充分考虑了影
12、响采用方差分析方法,充分考虑了影响分数的所有误差来源,并进一步提出绝对误差和相对误差的分数的所有误差来源,并进一步提出绝对误差和相对误差的划分及其对绝对误差和相对误差的度量。划分及其对绝对误差和相对误差的度量。2022-4-17(3 3) CTT CTT主要关注的是个体之间的差异,而主要关注的是个体之间的差异,而GTGT除除了个体之间的差异以外,还关注个体的绝对水平。了个体之间的差异以外,还关注个体的绝对水平。(4 4)在)在CTTCTT中,测量误差的估计方法导致同一个测中,测量误差的估计方法导致同一个测量量表往往表现出多种测量信度并存现象,如重量量表往往表现出多种测量信度并存现象,如重测信度
13、、复本信度、同质信度等,这些信度系数测信度、复本信度、同质信度等,这些信度系数之间没有必然的内在关系。而之间没有必然的内在关系。而GTGT则采用具有内在则采用具有内在逻辑关系的概化系数、可靠性系数或信噪比等指逻辑关系的概化系数、可靠性系数或信噪比等指数来反映各种因素可能对测验分数的影响程度。数来反映各种因素可能对测验分数的影响程度。2022-4-17尽管尽管CTTCTT和和GTGT之间存在着基础性差异,但是在之间存在着基础性差异,但是在某种程度上,某种程度上,GTGT仍然可以看做是通过应用适当仍然可以看做是通过应用适当的方差分析的方差分析ANOVAANOVA程序对程序对CTTCTT的一种拓展。
展开阅读全文