教育测量理论与中考命题课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《教育测量理论与中考命题课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 理论 中考 命题 课件
- 资源描述:
-
1、教育测量理论教育测量理论与中考命题与中考命题黄黄 宪宪20162016年年1010月月3030日日个人简介个人简介 中学正高级教师、广东省特级教师、广州市优秀专家中学正高级教师、广东省特级教师、广州市优秀专家 广州市教育局教学研究室原主任。现任广州市人民政广州市教育局教学研究室原主任。现任广州市人民政府督学、全国中小学教育督导评估专家、广州教育学府督学、全国中小学教育督导评估专家、广州教育学会副会长、广州市特级教师协会会长、广东省教育评会副会长、广州市特级教师协会会长、广东省教育评估协会副会长、广东省心理学会教育测量与考试研究估协会副会长、广东省心理学会教育测量与考试研究院院长院院长 兼任华南
2、师范大学心理学院应用心理学兼任华南师范大学心理学院应用心理学/计量心理学专计量心理学专业硕士研究生导师,广州市首批教育名家工作室主持业硕士研究生导师,广州市首批教育名家工作室主持人,广东省、广州市新一轮人,广东省、广州市新一轮“百千万人才培养工程百千万人才培养工程”教育专家培养对象实践导师教育专家培养对象实践导师一、与考试相关的教育测量理论一、与考试相关的教育测量理论(一)考试的性质与特点(一)考试的性质与特点(二)试题编制技术(二)试题编制技术(三)常见题型的命制(三)常见题型的命制 二、关于中考命题的若干思考二、关于中考命题的若干思考(一)初中毕业生学业考试的性质与功能(一)初中毕业生学业
3、考试的性质与功能(二)中考及其命题的指导思想和价值取向(二)中考及其命题的指导思想和价值取向(三)中考试题编制值得注意的几个问题(三)中考试题编制值得注意的几个问题一、与考试相关的教育测量理论一、与考试相关的教育测量理论(一)考试的性质与特点(一)考试的性质与特点 1 1、考试的性质、考试的性质 考试是一种心理测量,是心理测量在教育考试是一种心理测量,是心理测量在教育中的应用。中的应用。心理测量是依据心理学、教育学的理论,心理测量是依据心理学、教育学的理论,使用测验对人的心理品质(非物质性、内隐性使用测验对人的心理品质(非物质性、内隐性、相对稳定性)进行定量描述的活动。、相对稳定性)进行定量描
4、述的活动。测验是由一个个精心设计、精心编排、被测验是由一个个精心设计、精心编排、被称为称为“题目题目”的行为刺激组成的测量工具。的行为刺激组成的测量工具。测量的目的是将人的心理品质按水平高低测量的目的是将人的心理品质按水平高低定位在定位在“测验测验”的数字系统上。的数字系统上。2 2、考试的类型、考试的类型(1 1)常模参照考试常模参照考试以个体在团体中的相对地以个体在团体中的相对地位评价个体发展水平的考试。位评价个体发展水平的考试。(2 2)标准参照考试标准参照考试以个体是否达到某一客观以个体是否达到某一客观的标准,评价个体发展水平的考试。的标准,评价个体发展水平的考试。(3 3)潜力参照考
5、试)潜力参照考试以个体是否达到其应该达到以个体是否达到其应该达到的水平评价个体现已达到水平的考试的水平评价个体现已达到水平的考试(4 4)教学目标诊断考试)教学目标诊断考试以诊断学生在各个学习以诊断学生在各个学习目标上学习缺陷和困难为目的的教育考试。目标上学习缺陷和困难为目的的教育考试。(5 5)认知诊断考)认知诊断考试试深入到个体作答的认知过程深入到个体作答的认知过程,以评价个体各种认知属性发展水平为目的的教育,以评价个体各种认知属性发展水平为目的的教育考试。考试。3 3、考试的特点、考试的特点(1 1)间接性:)间接性:作为一种心理测量的考试,作为一种心理测量的考试,心理测量所用方法是间接
6、的。心理测量所用方法是间接的。(2 2)抽样性:)抽样性:测验考卷只能是某一学科领测验考卷只能是某一学科领域知识能力考题的一个样本。虽然样本力求域知识能力考题的一个样本。虽然样本力求能代表总体,但样本与总体相比总存在抽样能代表总体,但样本与总体相比总存在抽样误差。误差。(3 3)误差存在的普遍性与严重性:)误差存在的普遍性与严重性:作为一作为一种心理测量的考试,其误差到处存在而且远种心理测量的考试,其误差到处存在而且远比其他测量严重。考试研究的主要任务之一比其他测量严重。考试研究的主要任务之一就是研究如何将考试的误差控制在我们可容就是研究如何将考试的误差控制在我们可容忍的范围内。忍的范围内。4
7、 4、考试的误差、考试的误差(1 1)定义)定义:在考试过程中由那些与考试目的在考试过程中由那些与考试目的无关的变化因素所产生的测量效应。无关的变化因素所产生的测量效应。(2 2)类型及特点:)类型及特点:随机误差随机误差:与考试目的无关的偶然因素与考试目的无关的偶然因素引起的、不易控制的测量效应。(引起的、不易控制的测量效应。(特点:特点:方方向、大小随机变化,导致考试结果不一致、向、大小随机变化,导致考试结果不一致、不稳定)不稳定)系统误差系统误差:由与考试目的无关的因素引由与考试目的无关的因素引起的一种恒定而有规律的测量效应。(起的一种恒定而有规律的测量效应。(特点特点:稳定地存在于每次
8、测量之中,但却导致考稳定地存在于每次测量之中,但却导致考试结果不准确)试结果不准确)(3 3)考试误差形成的原因)考试误差形成的原因 所测品质的特殊性所测品质的特殊性与其他测量对象不同,考试与其他测量对象不同,考试所测量的心理品质内隐、抽象,只是相对稳定,造所测量的心理品质内隐、抽象,只是相对稳定,造成对目标认识不清晰,测量结果波动易变,导致误成对目标认识不清晰,测量结果波动易变,导致误差。差。编制的测验质量不高:编制的测验质量不高:人的外显行为与人的心人的外显行为与人的心理品质只具备相关关系,可能导致试题所测外显行理品质只具备相关关系,可能导致试题所测外显行为不是欲测心理品质的代表性行为。测
9、验项目只为不是欲测心理品质的代表性行为。测验项目只“刺激刺激”出了欲测心理品质的一部分行为,标准答案出了欲测心理品质的一部分行为,标准答案欠标准甚至出错,评分标准欠刚性。欠标准甚至出错,评分标准欠刚性。施测过程和施测环境安排控制不好施测过程和施测环境安排控制不好:施测过程施测过程没有统一要求;测试指导语没有统一版本;作答起没有统一要求;测试指导语没有统一版本;作答起始时间和长短不统一;测试时的内外环境令被试不始时间和长短不统一;测试时的内外环境令被试不能集中精力;测试过程失控、纪律混乱。能集中精力;测试过程失控、纪律混乱。主试的原因:主试的原因:主试对所测心理品质的理主试对所测心理品质的理解有
10、误;主试实施的程序有误;评分标准掌解有误;主试实施的程序有误;评分标准掌握不准。握不准。被试的原因:被试的原因:被试情绪不稳定,波动起被试情绪不稳定,波动起伏,导致误差;被试未掌握正确作答方法,伏,导致误差;被试未掌握正确作答方法,致使作答不能代表真实水平;被试随机猜测致使作答不能代表真实水平;被试随机猜测,致使评价出现误差;被试舞弊,致使评价,致使评价出现误差;被试舞弊,致使评价出现误差。出现误差。(二)试题编制技术(二)试题编制技术1 1、考试信度评价与试题编制、考试信度评价与试题编制l信度信度代表的是测验考试的可靠性程度即代表的是测验考试的可靠性程度即考试考试结果分数的稳定性。结果分数的
11、稳定性。l信度本质信度本质:是考试随机误差的描写指标,信是考试随机误差的描写指标,信度越高,度越高,说明说明随机误差越小,随机误差越小,考试的结果越考试的结果越可靠,越稳定。可靠,越稳定。l通常考试测验的信度需要达到通常考试测验的信度需要达到0.80.8以上,测验以上,测验考试的结果才算作比较可靠的。考试的结果才算作比较可靠的。11 提高考试信度的试题编制技术提高考试信度的试题编制技术 (1)维持测题的同质性;维持测题的同质性;(2)控制题目难度:全卷试题难度呈正态控制题目难度:全卷试题难度呈正态分布;分布;(3)努力提高题目区分度;努力提高题目区分度;(4)保持足够的题量;保持足够的题量;(
12、5)准确估计考生作答时间;准确估计考生作答时间;(6)控制评分误差,制定好尽量刚性的评控制评分误差,制定好尽量刚性的评分标准(解释描述性评分标准、答例罗列分标准(解释描述性评分标准、答例罗列性评分标准)。性评分标准)。2 2、考试效度评价与试题编制、考试效度评价与试题编制 效度效度代表测验考试的结果的有效程度,即考试结果分代表测验考试的结果的有效程度,即考试结果分数的准确性,实际所测的东西与我们预计想测的东西数的准确性,实际所测的东西与我们预计想测的东西是否一致。是否一致。效度本质效度本质:效度是考试随机误差与系统误差总和的描效度是考试随机误差与系统误差总和的描写指标。写指标。信效度关系:信效
13、度关系:一个考试,信度高是效度高的必要而非一个考试,信度高是效度高的必要而非充分条件。充分条件。效度评价方法效度评价方法 从从内容角度内容角度评价评价:用双向细目表评价用双向细目表评价 从从实际表现角度实际表现角度评价评价:因素分析方法(因素分析方法(目的是把一目的是把一些具有错综复杂关系的因素归结为数量较少的几个综些具有错综复杂关系的因素归结为数量较少的几个综合因素或称共同因素,并以此作为测验所测的特质对合因素或称共同因素,并以此作为测验所测的特质对测验分数做出的解释测验分数做出的解释)。13 提高考试效度的试题编制技术提高考试效度的试题编制技术(1)(1)努力使用好能提高测验信度的各种命题
14、努力使用好能提高测验信度的各种命题技术技术(2)(2)认真做好试题内容目标分析,保证所命认真做好试题内容目标分析,保证所命试题内容确实能代表考试内容领域试题内容确实能代表考试内容领域(3)(3)命题以能力立意,要能真正测到所要测命题以能力立意,要能真正测到所要测的能力的能力(4)(4)控制试题作答发散程度控制试题作答发散程度(5)(5)防止试题出现防止试题出现测量偏差测量偏差,即非能力因,即非能力因素导致的素导致的“项目功能差异(项目功能差异(DIFDIF)”项目功能差异项目功能差异是指不同群体对同一题目是指不同群体对同一题目的答对概率(或得分率)不同,即不同群体的答对概率(或得分率)不同,即
15、不同群体在同一题目上得分存在差异。在同一题目上得分存在差异。造成项目功能差异的原因造成项目功能差异的原因可能是群体间可能是群体间本身能力水平存在差异引起,称为本身能力水平存在差异引起,称为良性良性DIF;也可能群体本身能力水平不存在差异而由于也可能群体本身能力水平不存在差异而由于其它因素的差异(如性别、种族、地域、风其它因素的差异(如性别、种族、地域、风俗习惯方面差异)所致,则称为俗习惯方面差异)所致,则称为不良不良DIF,此,此时我们称题目存在时我们称题目存在测量偏差测量偏差。必须关注的是不良必须关注的是不良DIF,即测量偏差。测量存,即测量偏差。测量存在偏差,意味着测量不公平,不仅是效度受
16、在偏差,意味着测量不公平,不仅是效度受影响,还可能引起社会性问题。影响,还可能引起社会性问题。测量偏差防止方法测量偏差防止方法 命题时要特别注意测量对象中的各类弱命题时要特别注意测量对象中的各类弱势群体在所命试题上的感受和作答表现。尽势群体在所命试题上的感受和作答表现。尽量少出或不出有可能存在文化、宗教、性别量少出或不出有可能存在文化、宗教、性别、区域、职业歧视或敏感内容的试题。、区域、职业歧视或敏感内容的试题。可以用统计方法侦查是否有题目存在可以用统计方法侦查是否有题目存在“项目功能差异(项目功能差异(DIF)”,若有,进一步分析,若有,进一步分析是否良性是否良性DIF,以决定取舍。,以决定
17、取舍。通过率:通过率:难度:难度:17两者都说明题两者都说明题目的难易程度,目的难易程度,难度或通过率难度或通过率的值越高,说的值越高,说明题目越简单明题目越简单3 3、试题难度评价与试题编制、试题难度评价与试题编制 例:例:10名学生在某道满分为名学生在某道满分为10分的题目上分的题目上的得分分别为的得分分别为2、5、9、10、4、8、7、5、3、018 控制题目难度的试题编制技术控制题目难度的试题编制技术 难度控制目标:难度控制目标:大多数试题对全体考生呈中等大多数试题对全体考生呈中等难度分布,选拔考试视选拔比例适度调整。难度分布,选拔考试视选拔比例适度调整。难度控制技术:难度控制技术:(
18、1)准确区分各种测量任务的难度差別;准确区分各种测量任务的难度差別;(2)了解中等水平考生能力行为特点了解中等水平考生能力行为特点;(3)选择题可以通过调整错误选项的迷惑力调选择题可以通过调整错误选项的迷惑力调整难度。整难度。20区分度(区分度(D)评评 价价0.40以上以上非常优良非常优良0.30.39良好,如能改进更好良好,如能改进更好0.20.29勉强合格,用时需作改进勉强合格,用时需作改进0.19以下以下不合格,必须淘汰或改进以提高区分度不合格,必须淘汰或改进以提高区分度说明题目区分得说明题目区分得高分的学生与得高分的学生与得低分的学生的能低分的学生的能力(就是高分组力(就是高分组与低
19、分组之间的与低分组之间的差异)差异)4 4、试题区分度评价与试题编制、试题区分度评价与试题编制 区分度区分度测验试题能将高低水平被试准确区测验试题能将高低水平被试准确区分的能力。(影响总分离散程度与测验信度)分的能力。(影响总分离散程度与测验信度)提高试题区分度的试题编制技术提高试题区分度的试题编制技术 (1)控制好试题难度控制好试题难度 (2)保证试题所测心理品质与全卷的一致性保证试题所测心理品质与全卷的一致性 (3)试题答案无歧义试题答案无歧义 (4)语言准确规范,作答要求明确语言准确规范,作答要求明确 (5)选择题可以通过选项分析帮助寻找区分选择题可以通过选项分析帮助寻找区分度不高原因度
20、不高原因 高低分组法选项分析方法示例高低分组法选项分析方法示例分分 组组AB*CD低分组低分组高分组高分组合合 计计0.150.200.1750.500.400.450.100.100.100.250.30 0.275评价:本题难度评价:本题难度0.45合适,区分度合适,区分度0.10偏低。偏低。C选项无差异且诱惑力偏低,选项无差异且诱惑力偏低,B*选项差异太小。选项差异太小。小结小结 命题者可以通过各种命题技术提高考试质量。命题者可以通过各种命题技术提高考试质量。具体途径有:具体途径有:通过控制测量随机误差提高考试信度;通过控制测量随机误差提高考试信度;通过控制测量系统误差提高考试效度;通过
21、控制测量系统误差提高考试效度;通过控制试题难度和提高试题区分度提高通过控制试题难度和提高试题区分度提高试卷整体质量。试卷整体质量。5 5、试题编制共同要求、试题编制共同要求(1)要注意内容的科学性,不应编写出内容有科)要注意内容的科学性,不应编写出内容有科学性错误的试题。学性错误的试题。(2)注意用词和用语的准确性、不能模棱两可、)注意用词和用语的准确性、不能模棱两可、含糊不清。含糊不清。(3)试题向学生提供的信息要完整,不要片面追)试题向学生提供的信息要完整,不要片面追求语言简洁。否则会导致学生误解题目考查意图。求语言简洁。否则会导致学生误解题目考查意图。(4)试题设问既要指向明确,又要留有
22、作答空间)试题设问既要指向明确,又要留有作答空间。设问指向不明确可能导致学生不知道向哪个方向。设问指向不明确可能导致学生不知道向哪个方向去作答。留有作答空间可以鼓励学生创新思维、展去作答。留有作答空间可以鼓励学生创新思维、展现能力。现能力。(5)要有公认的正确答案,不能出理论界还有争议的)要有公认的正确答案,不能出理论界还有争议的试题。试题。(6)要在大纲要求的能力层次和内容范围内出题,不)要在大纲要求的能力层次和内容范围内出题,不要超越大纲。要超越大纲。(7)要真正体现所要求测量的性能,特别是在认知目)要真正体现所要求测量的性能,特别是在认知目标层次上,不要将考高层次能力的试题出成了考记忆标
23、层次上,不要将考高层次能力的试题出成了考记忆或简单应用层次的试题。或简单应用层次的试题。(8)防止命制出产生测量偏差(不良)防止命制出产生测量偏差(不良DIF)的试题。)的试题。(9)题目编好后,应该给出参考答案和评分规则供阅)题目编好后,应该给出参考答案和评分规则供阅卷评分时参考。对于非客观性试题,这项工作就有一卷评分时参考。对于非客观性试题,这项工作就有一定的难度,因为非客观题无定的难度,因为非客观题无“标准标准”答案,非客观题答案,非客观题的评分也就很难做到完全准确客观。的评分也就很难做到完全准确客观。(10)为此要求命题人员在为非客观题制定参考答)为此要求命题人员在为非客观题制定参考答
24、案和评分规则时,一定要作认真的思考,要尽量做案和评分规则时,一定要作认真的思考,要尽量做到到“准确准确”和和“客观客观”。在做参考答案时,首先要。在做参考答案时,首先要保证所做答案是正确的,同时要尽量全面。其次还保证所做答案是正确的,同时要尽量全面。其次还要考虑到其它可能产生的作答内容和形式,区别出要考虑到其它可能产生的作答内容和形式,区别出其真伪。其真伪。(11)评分规则应尽量分步给分,给分尽量不要有)评分规则应尽量分步给分,给分尽量不要有伸缩余地。论述题不要简单地采用选点给分的评分伸缩余地。论述题不要简单地采用选点给分的评分方法。这种评分方法易造成低层次考生采用方法。这种评分方法易造成低层
25、次考生采用“漫天漫天撒网撒网”方式提供答句,整个作答无中心、无逻辑,方式提供答句,整个作答无中心、无逻辑,甚至还有错误,结果还能得高分甚至满分。甚至还有错误,结果还能得高分甚至满分。(12)要重视审题)要重视审题 试题内容是否健康、科学,包括提供的附属材料试题内容是否健康、科学,包括提供的附属材料、案例内容是否健康是否适应时代发展要求。、案例内容是否健康是否适应时代发展要求。试题语言是否规范、确切,设问是否清楚,会不试题语言是否规范、确切,设问是否清楚,会不会引起误解。会引起误解。选择题的错误选项是否有效,选项用词有无暗示选择题的错误选项是否有效,选项用词有无暗示作用。作用。客观题的正确答案是
展开阅读全文