测验分数的解释解析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《测验分数的解释解析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测验 分数 解释 解析 课件
- 资源描述:
-
1、第九讲本章主要内容:9.1 参照常模的分数参照常模的分数9.2 参照标准的分数参照标准的分数9.3 测验分数的解释测验分数的解释p从测验中直接获得的分数,称为原始分数,它是通过将被试的反应与标准答案相比较而获得的。原始分数本身并不具有多大的意义,必须与一定的参照体系作比较,才能显示其意义。n 例:语文85分,游泳第3名。p确定原始分数意义的参照体系有两类:n 其他被试的分数,即其他被试在所测特质上的一般水平。n 社会在所测特质上的客观要求,即被试在所测特质上发展应该达到的标准。p第一种称为参照常模的分数解释。参照常模的分数解释方法是将被试的分数和常模团体测验分数进行比较来解释的,并且主要以个人
2、在常模团体中所处的相对位置来说明。p第二种是参照标准的分数解释。参照标准的分数解释方法是用被试测验分数与应有的标准作比较来确定被试测验分数的意义。凡达到要求的标准,就是“合格”或“达标”;未达到要求的标准,就是“不合格”或“未达标”,它全然不管其他被试在同一测验上的分数如何。9.1 参照常模的分数参照常模的分数p参照常模的分数解释是把被试的测验分数与具有某种特征的人所组成的有关团体的一般水平作比较,以确定被试在该团体内的相对位置。p用来比较的参照团体称(norm group),常模团体的分数分布叫,它是我们解释测验分数的基础。9.1.1 常模团体的性质 9.1.2 确定常模团体的注意事项 9.
3、1.3 常模9.1.1 常模团体的性质常模团体的性质p常模团体是由具有某种共同特征的人所组成的一个群体,或是该群体的一个样本。p从测验的编制者来说,确定常模团体的问题就是确定所编制的测验将来用于什么总体。所选定的常模团体必须能够代表该总体。n例如,测验是用来评价高中毕业生的学业成就,则常模团体应包括全体高中毕业生,或是能足够代表该总体的一个样本,由于大部分的测验要用于各种不同团体,所以大部分测验都有不止一个常模团体。n如,瑞文标准推理测验,常模团体就有儿童,成人、城市、农村等多个。p对测验的使用者,要从不同角度来选定常模。首先要考虑的问题是现有的常模团体哪一个最适合?因为标准化测验通常提供许多
4、原始分数与各种常模团体的比较转换表,被试的分数必须与最合适的常模比较。p无论是测验编制者还是测验使用者,常模团体通常包括具有同样年龄或教育水平的人,当然,在一些特殊情况下,还有许多方面也可用来定义常模团体,如性别、年龄,年级或教育水平、职业、社会经济地位、民族等。9.1.2 确定常模团体的注意事项确定常模团体的注意事项n在确定常模团体时,必须清楚地说明所要测量的群体的性质与特征。虽然有关常模团体的一般规定取决于测验的目的与使用,且可能有多个常模团体,但对每个常模团体的性质和特征必须有一个简短而明确的描述。若群体过大,群体内部也许有许多小团体,它们在一个测验上的表现也时常有差异,假如这种差异较为
5、显著,就必须对每个小团体分别建立常模。n例如,在机械能力倾向测验上,男性通常比女性做得好些,因此这类测验通常分别提供男性、女性的常模。身高 体重n当所要测量的群体较小时,将所有的被试逐个测量以得到常模。在群体较大时,只能测量一部分被试作为群体的代表。此时就存在取样是否具有代表性的问题。根据随机化原则抽样能确保样本具有代表性。关于具体抽样方法,可参阅有关统计学书中的抽样推断部分。p取样过程应详尽描述n取样的过程必须明确且有详尽的描述。这主要是为了使测验的使用者不至于误用测验和错误地解释测验结果。所以在一般的测验手册中,都有相当的篇幅详细介绍常模团体的大小、取样策略、取样时间以及其他有关情况,这些
6、说明和描述越明确,越详尽越好。n所谓“大小适当”并没有明确的指标,根据统计学原理,取样误差与样本大小成反比。n在其他条件相同时,样本越大越好,但还应考虑到人力、物力等方面的因素,通常在决定样本大小时,应注意:(1)总体的数目。总体数目小,样本相应可小一些。若总体过小,则可将全部被试入选;当总体较大时,相应的样本也大。一般最低不小于30或100。全国性常模,一般应有2000-3000人。(2)群体的性质。如果群体性质单一,则样本不必太大,就可以反映群体性质;若群体性质复杂,则样本容量就应大一些。(3)测验结果的精确度。根据统计学原理,抽样误差的大小与样本容量成反比,若要提高精确度,减少抽样误差,
7、就必须加大样本容量(n)。n建立的常模必须是近时的。过时的常模是不能作为参照标准的。例如对瑞文智力测验来说,几年以前所修订的常模对现今可能就不再适用,否则所得智商将产生偏高的趋势。常模必须定期修订。p一般常模与特殊常模的结合n测验手册上的常模通常为一般常模,它的适用范围比较广,有时对于某些特殊的群体不一定完全适用。因此,测验有时须有特殊常模。将特殊常模与一般常模结合起来,可使被试与最接近的群体进行比较。因为各个具体群体在某些方面是独特的,它的成员将与测验手册所列的常模团体成员不符,所以,依据一般常模解释所得的结论可能不够恰当,如果将两者结合使用,解释分数便会更加准。9.1.3 常模常模p发展常
8、模发展常模婴幼儿头围与胸围发育的正常值(生理发展常模)年龄(月)036912182436项目头围(厘米)男34.341.043.945.146.347.348.249.1女33.740.042.844.245.646.247.148.1胸围(厘米)男32.841.343.845.046.147.649.250.8女32.640.342.743.945.046.648.249.8儿童口语获得的年龄和不同阶段的特征(心理发展常模)口语习得的年龄口语习得的各阶段特征 刚出生 9-12个月 18-24个月 3-4岁 7岁前 能够分辨语音刺激与其它刺激 说出第一个指示词 出现双词说话 出现完全符合语法的
9、完整句子 获得完全符合语法的口头语言 常用的发展常模有以下三种:常用的发展常模有以下三种:(一)智力年龄(mental age)n比奈在本世纪初认为:测量儿童心理成长,可以将一个儿童的行为与各年龄水平的儿童比较,以获得该儿童的心理发展水平。n在此设想基础上,他首先寻找并设计出可区分各种年龄儿童智力的题目,因为儿童在这些题目上的反应,随着年龄的变化而有系统的改变。每个题目放在大部分的儿童都能成功地完成的那个年龄水平。n例如标准化样本中大多数8岁儿童都能通过的那些项目,就代表8岁儿童的智力水平,就将该题放在8岁水平。每个年龄水平制定适当的题目,可以得到一个可评价儿童智力发展水平的年龄量表。n一个儿
10、童在,就是最能代表他的智力水平的年龄,这样的分数就称作智力年龄,简称。n所有的基本上都是利用相同的推理与步骤制定的,年龄量表将个人的行为与各年龄组的一般儿童比较而给予一个年龄分数。n (=/)n年龄量表的基本要素是:(1)一组可区分不同年龄组的题目。(2)一个常模团体。该团体是由各个年龄的被试所组成的具有代表性的样本。(3)常模表,即一个表明答对哪些题目或得多少分就该归入哪个年龄的对照表。n年龄常模最大的优点是易于理解与解释,并可以与同年龄团体作直接比较。但必须注意人在很多方面发展的速率是先快后慢并随着年龄的增长而逐渐减慢,当长到青春期或成年期,便逐渐停止。此时,年龄常模便不再适用。(二)年级
11、当量(grade equivalents)n教育成就测验上的分数经常按照年级当量来解释,即将被试的测验成绩与某一年级的学生的平均分数作比较,以确定他相当于哪一年级的水平。n这种年级当量选择题目与指定分数的方法与步骤与年龄常模类似,所不同的是用年级水平代替了年龄水平。n例:一个学生如果能解答六年级的题目或他(她)在测验上的得分与六年级的平均分数相同,则他(她)在该测验上的年级当量便是6。(三)顺序量表(ordinal scales)n这种常模源于儿童心理学的研究。通过对婴儿的行为发展的经验观察,人们描述各种机能随着年龄发展的典型行为。(如前例)n例:格塞尔发展顺序量表按月份表明,从4周到36周的
12、儿童在运动、适应性、语言、社会性等四个方面的大致发展水平。如婴儿的感觉运动发展顺序是:4周,控制眼睛运动,能追随一个对象看等;16周,能使头保持平衡;28周,能用手抓握并玩弄东西等。n顺序量表用来鉴别儿童在具体行为机能的发展中所达到的阶段。p 团体内常模n现在,几乎所有的标准化测验都提供某种的。这类常模是根据被试在常模团体中所处的相对位置来评价被试的成绩。n团体内分数具有统一的、定义明确的定量意义,能够适用于大多数类型的统计分析。团体内常模常用两类数据来标示:百分等级 标准分数(一)百分等级(一)百分等级(简称简称PR值值)n百分等级是应用最广的表示测验分数的方法。一个原始分数的是指在常模团体
13、中。n我们通常用PR来表示百分等级。n百分等级取值越大,说明成绩越优秀。百分等级的计算方法:百分等级的计算方法:n 将被试团体的全体原始分数从大到小排序,然后采用下列公式计算:n PR=100-(100 R-50)Np式中PR为百分等级,R为排名顺序的序号,N为被试总人数。n 例:某被试在一次由50人参加的成绩测验中得80分,排名第9,则该生成绩(80分)的百分等级为:p PR=100-(100R-50)N =100-(1009-50)50=83p其百分等级为83,说明?p总体中有83的人分数低于80分。n如对原始分数已作过初步整理,通常以次数分布表的形式呈现,即数据已分组。此时,可采用分组数
14、据的公式求百分等级。p(参见统计学的有关部分)百分等级的优缺点:百分等级的优缺点:n百分等级是一种相对位置量数,具有可比性,便于计算、易于理解等优点。n 主要缺点是单位不等,尤其在分数分布的两端。原始分数转换成百分等级时,靠近分布中央(平均数或中位数附近)的原始分数的分数之间的差异被夸大了,而靠近分布两端的原始分数的差异被缩小了。n 另一个缺点是百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异量。n例:某被试甲在一个成就测验中的百分等级为10,被试乙为20,被试丙为30,我们只能说丙优于乙,乙优于甲,而不能推断他们之间差异的程度相等。n在使用百分等级时应注意,百分等级是相对于特定的被
15、试团体而言的。所以,解释时不能离开特定的参照团体。被试得分不变,但参照团体改变了,百分等级值就可能发生变化。n所以在报告百分等级时,一定要说明是相对于什么的参照团体来说的。(二)(二)标准分数标准分数n标准分数是一种具有相等单位的量数。它是将,它的,所以叫标准分数。n标准分数可分为两类:(简称)(称为正态化标准分数,常见的有、)。pZ分数分数n通过线性转换得到的标准分数称为Z分数n它是将个体原始分数与平均数的距离以标准差为单位表示出来。nZ分数之间差异的相对大小,准确地反映了原始分数之间的相对大小。nZ分数的计算方法 Z=(XX)SnZ分数具有以下几个性质:Z分数是以一批分数的平均数为参照点,
16、以标准差为单位的等距量表。Z分数的正负符号表示原始分数在平均数之上或之下,绝对值表示原始分数与平均数的距离。Z分数分布形态与原始分数分布完全一样。Z分数之间差异的相对大小,准确地反映了原始分数之间的相对大小。n由于Z分数在计算中经常出现负数和小数,且单位过大(一个标准差单位),使用起来不够方便,所以通常需要将Z分数进行进一步线性转换,其形式为:Z=A+BZ (Z为转换后的标准分数,A,B为常数)n加上一个常数目的是为了去掉负值,乘上一个常数是为了使单位变小从而去掉小数点。原来分数间的关系不会改变。n例如,美国大学入学考试委员会的学业评定测验(SAT)所使用的分数转换公式为:CEEB分数100Z
17、500 (平均分数为500,标准差为100)。n我国一种出国人员英语水平考试(EPT)所使用的分数转换公式为:EPT分数20Z90 (平均分数为90,标准差为20)p常常(正正)态化的标准分数态化的标准分数n用线性转换的标准分数只有在分布形态相同或相近时才能进行比较,若两个分布的偏斜方向不同,那么相同的标准分数可能代表不同的百分等级,两个测验的分数仍无法比较。为了能将来自不同分布形态的分数具有可比性,可以采用非线性转换,将原分数分布都转化为正态分布。有了相同的分布,不同测验的分数就可以比较了。n具体步骤是:先将每个原始分数转换为百分等级,然后使用正态分布表,将对应的百分等级直接看成是正态分布曲
18、线下的面积值,找出所对应的标准分数,由这种方式得到的分数称为正态化标准分数。(1)T分数 把正态化标准分数乘以10(以消除小数)再加上50(消除负号),它就被转换成T分数。即:T10Z50 (2)标准九分(standard nine)标准九分是标准化九分制的简称。它将正态曲线下的横轴分为九段,最高一端为9分,最低一端为1分,中间一段为5分。除两端(1分,9分)外,每段均有半个标准差宽。标准九分是根据分数范围从1到9而得名。在正态曲线下,每个标准九分所包含的百分比为:标准九分123456789百分比%4712 17 20 17 12 74n要把原始分数转换成标准九分,首先按大小排列原始分数,然后
19、根据上表给出的正态曲线百分比来指定九分。即将得分最高的4%的被试给予9分,其次7%的被试给予8分,按上表依次类推。n亦可将原始分数转换为百分等级,然后得到其相应的标准九分值。标准九标准九(stanine)p标准化九级分制标准化九级分制p标准九标准九=5+2Z,即平均数为,即平均数为5,标准差为,标准差为2标准九分标准九分本段面积本段面积(%)(%)累加面积累加面积(%)(%)段中值与平均数段中值与平均数的距离的距离()9 94 41001002.02.08 87 796961.51.57 7121289891.01.06 6171777770.50.55 5202060600 04 41717
20、40400.50.53 3121223231.01.02 27 711111.51.51 14 44 42.02.0正态正态Z Z分数与标准九的转换方法分数与标准九的转换方法正态Z分数标准等级总体中的百分比z-1.7514.0%-1.75Z-1.2526.6%-1.25Z-0.75312.1%-0.75Z-0.25417.5%-0.25Z0.25519.6%0.25Z0.75617.5%0.75Z1.25712.1%1.25Z1.7586.6%Z1.7594.0%合计100%正态正态Z分数与标准十的转换方法分数与标准十的转换方法(M=5,s=1.5)正态Z分数标准等级总体中的百分比z-2.01
展开阅读全文