测量与评价作为教育过程中的反馈环节,其作

2023/12/15 来源:不详 浏览次数:

引言

评价一个测验好坏的标准是什么呢?如何选择或编制一个良好的测验呢?这就需要从测验的效度、信度、难度和区分度四个方面加以考虑。

教育测量与评价的作用

学校教育若缺乏测量与评价环节,教育工作便如同大海捞针,难免盲目、主观行事。测量与评价作为教育过程中的反馈环节,其作用主要表现在以下几个方面:首先,教育测量与评价所提供的反馈信息既能确定教师的教学效果,又能确定学生的学习水平,因而是检验教学成效的有效途径。第二,教育测量与评价可以帮助教师诊断学生存在的学习问题,明确教学中的薄弱环节,有利于进一步调整、改进教学。

第三,教育测量与评价可以对学生的学习水平进行筛选与分级,从而为各级、各类的大中学录取及因材施教提供依据。第四,教育测量与评价可以为学生提供自己学习效果的反馈信息,这种信息的正确归因,将有助于激发学生争胜求成的学习动机。编制测验的基本要求测验是实施教育测量与评价的工具,工具的好坏,直接影响着测量与评价的结果。

那么,想要测查高中学生的世界历史知识,而试卷却采用英文命题,这种测验结果就难免要受学生的英文水平的影响。因此很难测查学生掌握的历史知识的真实情况,这种测验的效度就是很低的。效度通常以一个反映测量目标的参照标准为基础,以测验结果与此标准的相关系数为效度系数来加以表示。效度系数越大,表明测验的效度越高,测验也就越可靠。由于测验目的不同,测验的效度也就有所不同。一般来讲,测验效度主要有以下三类。

内容效度(contentvalidity)

内容效度是指测验题目在多大程度上代表了所要测量的全部内容。学绩测验特别重视内容效度。它要求测验题目在内容上,题目之间的比重上,都能很好地符合教学目标的要求,既突出学科的重要部分,又反映出学科内容的比重。如果一个测验中含有许多偏题、怪题,或题目只覆盖了少数章节的内容,则会降低该测验的内容效度。另外,测验题目文字晦涩、含糊不清,致使学生难于正确理解题意,也会导致测验效度降低。由于学绩测验的内容范围容易确定,因此,学绩测验的效度主要取决于测验题目的代表性。

构想效度(constructvalidity)

构想效度是指一个测验对某种理论的符合程度。例如:如果某个智力测验所得到的结果,与该测验所依据的智力理论关于智力的一些假设相符,那么,这个智力测验就具有构想效度。可见,欲建立具有构想效度的测验,必须先从某一构想的理论出发,推导出与此理论有关的基本假设,按照这些假设编制测验。然后由果溯因,考察测验结果是否符合理论构想。构想效度是用测验检验教育心理学理论的一个重要指标。

预测效度(predictivevalidity)

预测效度是指测验结果对受测者将来的行为或特质进行预测时的有效性。例如,用大学入学时的考试成绩来预测学生进入大学后的学习成绩,用职业测验结果来预测个体今后的实际工作能力,用人格测验来预测以后患精神病的可能性等等。一个测验对受测者未来的行为预测得越准,该测验的预测效度就越好。预测效度在能力测验、诊断测验和筛选测验中十分重要。

信度指的是测验的稳定性、可靠性,也就是测量的前后一致性程度。如果受测者在多次进行某种测验时,所得到的测验分数几乎相同,那么就可认为该测验稳定、可靠,是一个可信的测量工具。只有高信度的测验,才有可能成为高效度的测验。信度是保证测验效度的一个必要前提。信度的高低通常以信度系数,即同一被试样本所得到的两组测验数据间的相关系数,来作为测量一致性的指标。

测验信度的种类

按照计算信度的不同方法,测验信度可分为以下几种,再测信度,将同一测验先后两次施测于同一组被试,求得两次测验分数间的相关。再测信度易受练习及被试主观状态等因素的干扰。复本信度,将两个等值测验或一个测验的平行复本施测于同一组被试,比较被试两次得分的一致性系数,即相关系数。

以此来考察两个复本测验的等值程度。分半信度在对一组被试实施一个测验以后,将测验对等的两半(奇数题目与偶数题目)的分数分别计算出来,比较这两半分数的相似性。评分者信度,对一组被试实施某一测验以后,让不同的评分者进行评分,比较不同评分者评分的一致性程度。在学科测验中,复本信度和分半信度的计算较为常见。复本信度要求事先编出两套以上在内容、形式、数量、难度等方面均等值的测验,而分半信度则要求同一测验的奇数题和偶数题两部分保持等值。测验的信度受许多因素的影响。

测验的施测和记分程序是否标准化,受试者的动机和焦虑水平是否适当等因素,也都会影响测验信度的高低。总之,信度反映着测量的一致性程度,效度反映着测量的准确性程度,二者同为鉴别测验优劣的客观指标。因此,一个良好的学绩测验必须既有较高的信度,又有较高的效度,即综合体现测验的信度和效度要求。项目的区分度反映着项目对所测量的属性或品质的鉴别程度。在编制测验时,选择区分度高的题目可以提高测验内部一致性信度。

常模参照学绩测验和标准参照

学绩测验在学校中,学绩测验既可用来测量学生已经掌握和没能掌握哪些知识、技能,又可用来鉴别学生学习成绩的相对等级、区分个别差异。前者是通过将学生的学习成绩与教学目标所要求的掌握标准相比较,来确定学生的学习水平,属于标准参照学绩测验。后者是将每个学生的学习成绩与整个学生团体的平均成绩(常模)相比较,来确定每个学生在团体中的相对位置,属于常模参照学绩测验。在这类测验中,如果发现大多数学生都不能通过某一测验题目,则需要检查这一题目是否偏离了教学目标的要求,而应予以删除;或者考虑是否教学方法不当,使学生没能正确领会等等。

利用标准参照学绩测验,能够有效地诊断教学中存在的问题,对改进教学过程设计,提高教学成效很有帮助。常模参照学绩测验由于是以团体的平均测验成绩为参照点,因而能够区分团体中的个体差异,为人材选拔以及升级,编班提供依据。常模参照学绩测验所遵循的基本假设是:团体中大多数人的作业成绩都处于中等水平,作业成绩极好和极差的人只是少数,即成绩分布近似常态。

为此,在编制常模参照学绩测验时,首先应选择大量中等难度的测验题目,然后再同样地增加少量较难和较易的题目,以保证测验成绩尽可能呈正态分布。常模参照学绩测验不能象标准参照学绩测验那样可以提供个体是否跟上了教学进度和是否达到了特定标准的信息,不利于进行教学诊断。另外,常模参照学绩测验,所提供的团体成员间相互比较的竞争性信息,容易导致学生的考试焦虑和人际关系紧张,而且,由于不同个体所在不同团体的总体水平的差异,还将导致优等生和差等生的评价标准不一致,从而导致不同团体间相互比较的不公平性。

标准化学绩测验和教师自编学绩测验

学绩测验从编制方法上看,可区分为标准化学绩测验和教师自编学绩测验两种类型。标准化学绩测验是由专门的测验发行机构推出的。它是由有关学科教育专家和测验编制专家按照一定的程序共同编制的。这种测验一般都具有较高的信度和效度;测验的实施有严格的规定(如适用对象、施测时限、指导语、评分等都有统一的要求);测验结果有可资比较的标准等等。教师自编学绩测验是在学校教育中广为应用的一种测验。这种测验是由教师根据自己的经验以及教学各个阶段的需要,自行设计与编制的,其适用范围相对较窄。

结语

由于标准化学绩测验的编制相当耗费人力、物力和时间,而且其内容不一定与教学进度相符合,因此,编制和施测相对简单、容易的教师自编测验便成了学校教育中应用最多的一种测验形式。

转载请注明:
http://www.xinhongjz.com/jsbby/14638.html
  • 上一篇文章:

  • 下一篇文章:
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有 2014-2024
    今天是: