比较,从而判断其优劣。为绝对评价而进行的测验一般称作标准参照测验,测验成绩主要表明教学目标的达标程度。 3.自身评价
自身评价的评价基准既不是建立在被评价群体之内,也不是建立在被评价群体之外,而是在被评价个体自身上,主要是对被评价个体的过去和现在相比较,或者是对他的若干侧面进行比较。 第二节 教学评价的取向和模式 一、教学评价的取向
(一)科学主义取向(scientistic approach)
科学主义取向的评价者倾向于通过实验进行评价。评价的目的是了解经过实验处理后所产生的结果。为了实验结果具有信度和效度,强调评价者必须采取科学的态度,严格控制实验变量,认真的观察实验,这样才能获得比较精确的结果。对实验结果的处理倾向于采用量化的方式,进行客观的分析,在此基础上做出有关的决策。如:行为主义者比较相信规定性的序列性评价方法,要求列出课程与教学的具体项目,并要求明确地陈述目标,以便能够规定程序,提供达到教学计划中预期目标的精确步骤。 (二)人文主义取向
人文主义取向的评价者与科学主义取向者所持观点正好相反。他们认为社会现象是很复杂的,各种事物之间是相互关联的,我们不可能把它们割裂开来研究。在他们看来,人类的行为表现都是与特定情境联系在一起的,若要了解它们,必须将它们置于其原来的情境,况且评价者在评价时,不可避免地会带有个人主观倾向性,所以,他们提倡通过个案研究来收集相关的材料,并且收集的材料大多是定性的、描述性的,而不是定量的数据分析。如人本主义者可能会对教学计划是否改善了学生的自我概念更感兴趣,因而不会把许多精力放在通过具体的、客观的测验所证实的学生的某些成绩上。 二、教学评价的模式
教学评价模式是在一定理论指导下对教学评价的基本范围、内容、过程和程序所做的相对固定的规定。现在已有多种不同的教学评价模式问世。 (一)目标评价模式
目标评价模式是在本世纪30年代由美国著名的课程理论及教育评价理论专家泰勒提出来的,该模式是在其非常有影响的“课程原理”和“评价原理”的基础上形成的。泰勒的“评价原理”的主要内容涉及七个步骤或阶段,它们是:
1.确定教育计划的目标;
2.根据行为和内容来界说每个目标; 3.确定使用目标的情景; 4.设计呈现情境的方式; 5.设计取得记录的方式; 6.决定评定时使用的记分方式; 7.决定获取代表性样本的方法。
泰勒的“评价原理”是针对当时起源于智力测验的常模式参照测验而提出的。泰勒认为常模参照测验是以划分考生等级为目的的,它对了解学生学习的进展情况、改进教育计划并无多大价值。而与此相对的目标参照测验,则可在上述两个方面有所作为。目标参照测验的提出是学业成就评定的一大进步,它是泰勒对教育评价的一大贡献。
“课程原理”的内容主要包括四个步骤或阶段: 1.确定课程目标; 2.根据目标选择课程内容; 3.根据目标组织课程内容;
4.根据目标评价课程。
在课程评价原理中,泰勒认为确定目标是最为关键的一步,因为其他所有步骤都是围绕目标而展开的,而且不能只认为评价是第四阶段的事情,事实上可以把前面三个步骤看作是评价的中介阶段。由于评价是从目标入手的,所以目标的界说一定要清楚。泰勒强调要用明确的、具体的行为方式来陈述目标。评语评价是为了找出实际结果与目标之间的差距,并利用反馈信息作为修订计划或目标的依据。 (二)目的游离评价
目的游离(goal-free)是斯克里文(M. Scriven)针对目标评价模式存在的问题而提出的。 (三)背景、输入、过程、成果(CIPP)评价模式
CIPP评价模式是斯塔弗尔比姆等人经过近十年的酝酿,于1966年首次提出。CIPP是背景评价(context evaluation)、输入评价(input evaluation)、过程评价(process evaluation)和成果评价(product evaluation)这四种评价名称的每一个英文字母的缩略语。CIPP模式把评价看作是一个连续的过程,它由四个步骤或阶段所组成。 1.背景评价
具体来说,就是要确定教学或课程计划实施机构的背景;明确评价对象及其需要;明确满足需要的机会;诊断需要的基本问题;判断目标是否已满足这些需要。背景评价无疑拓宽了评价的范围与内容,减少了评价可能发生的偏颇。 2.输入评价
“输入评价”在本质上可以理解为方案、计划可行性的评价。它主要是通过对各种可供选择的计划进行评价来帮助决策者选择达到目标的最佳手段。这一阶段所涉及的问题包括:实现目标的可能性,各种方案的潜在成本,它的优缺点,它的合法性与道德性,各种人员的利用以及对外界资源的需要等等。主要采用的方法有特尔斐法、成本与经济分析法等。 3.过程评价
“过程评价”主要是通过描述实际过程来确定或预测课程或教学计划本身或实施过程中存在的问题,从而为决策者提供如何修正计划的有效信息。
4.成果评价
“成果评价”是通过收集与结果有关的各种描述与判断,把它们与目标以及背景、输入和过程方面的信息联系起来,对其价值和优点做出解释。按照斯塔弗尔比姆的说法,在CIPP中,成果评价仍然是质量控制的一种手段。
(四)自然式探究评价模式
自然式探究评价模式(naturalistic inquiry)是建立在现象学、解释学、日常语言分析哲学以及符号互动理论基础上的一种评价模式。该模式基于以下假设:
社会现实是多元的,只能从整体上加以研究;如果只对一些变量和过程进行独立的研究,那将不可避免地偏离问题的实质。
研究的主体与客体是相互作用、相互影响的,要使两者完全独立,既不可能,也无必要。
价值中立是不存在的。社会科学研究离不开价值问题,事实上,其研究的目的就是为了指向更有价值的社会。
社会行动是由多种因素共同促成的,只有把它们放在特定的背景中,才能做出合适的推论。 基于以上假设,自然式探究强调要根据实际情况决定采用具体的评价方法,如观察、访谈、调查、间接测量等,并对研究结果的可信性、客观性、推广性等都有自己的特定的解释。具体来说,就是要注重自然情境的研究,而不是通过人为方式操纵变量来形成所要研究的情境;注重定性而非定量的研究方法;注重从事实中归纳、获取理论,而不是由理论演绎假设,再由实验加以证实;注重个案分析,而不是大范围调查;注重缄默的或不言而喻的知识,如“感受”、“直觉”等,而不只是用语言呈现的命题的知识;研究计划
不是预定的,而是逐渐形成的,下一步骤基于前一步骤的发现;研究者要成为研究情境中的一分子,以便产生移情效应,而不是与研究情境保持一定距离,以处于客观地位。 第三节 教学评价的程序 教学评价主要由三个阶段组成。 一、制定评价计划
教学评价的计划阶段工作主要是制定评价的计划和作好组织准备工作。主要是确定评价活动的目的、评价的对象、评价的指标体系和在何种情况下从事评价和实施评价后所必须做出的决策程度以及在什么时候,什么地方实施测量,获取信息以及如何组织等工作。 (一)确定评价目标、指标体系和标准
确定评价目标、指标体系和标准是进行评价的基础 (二)确定评价对象
就是确定被评价的人员是教师,学生,还是学校团体等;被评价的内容是学科知识、实验技能,还是学习兴趣、思想品德、体质健康等;是进行单项评价还是综合评价。 (三)选择评价方法和编制测量工具
评价目的、对象、内容及目标确定后,就要决定采用什么方式来获得评价的信息材料,也就是选择方法和采集信息的工具。评价对象、评价目的不同,所采用的评价工具和方法不同。如果是评价学生的学业成绩,一般采用测验的方法获取相关信息;如果是评价学生学习的兴趣,可采用调查问卷的方式获得所需的材料;如果要了解教学过程中的情况,一般要设计观察表并借助录像等手段辅助进行。 (四)选择处理统计数据的技术和手段
根据测量工具的不同,选择准备统计处理数据的方式、方法和要求。如果需要计算机统计,就要选择和编制适当的程序。如果是重要的大型评价,还应包括训练评价人员。 (五)作好组织准备
评价的对象、内容不同,组织的形式和机构也不同。一般由评价领导小组和评价工作小组所组成。组织工作可由被评对象所在部门的上一级机构承担。评价组织的人员结构,应力求具有合理的知识结构、能力结构和专业结构,组织准备还应包括对评价小组工作人员的思想教育和技术培训工作。 二、实施评价
教育评价的实施是评价组织机构根据评价方案所确定的指标体系、评价方法与步骤,以及制定的实施计划,按照科学的程序,逐步完成每一项评价任务,收集相关的信息的过程。涉及的主要工作有以下三项: (一)实施评价前的准备工作 (二)实施测量并收集信息 (三)归纳处理和分析信息 三、评价的决策
评价的决策阶段主要是评价者根据对所得数据资料的处理与分析,初步得出评价的结论,在评价结论的基础上,提出改进教育教学的措施,即做出评价的决策,主要包括以下几个方面: (一)形成评价结论
根据目标和评价目的,对信息资料分析后做出评价结论,如在诊断性教学评价中,可以依据通过率对学生在某些内容上的掌握程度进行分析,并得出结论。 (二)报告评价结果
在这里,评价者需根据评价报告的性质和报告的读者对象来确定报告的内容、形式。评价者的报告可以是正式的,也可以是非正式的;可以是描述性的,也可以是数据分析的。在向有关部门通报评价结果时,评价者所要做的不仅仅只是提出报告、表明结果,还应该展示他们是如何对资料做出解释,是如何从分析中得出结论的以及他们对解决问题的建议。
(三)做出评价决策
根据评价结果可做出多方面的决策。作为领导机构可决策下一步教育目标的调整;决定教材的变更与否;决策教师培训的方向和措施;决策教育学生引导的方向和步骤乃至评选先进优秀教师、三好学生;决定学生升级和留级;根据学科测验结果的评价,教师决策如何提高教学质量等。 第四节 教学评价的方法 一、评价指标体系的建立和应用
评价指标体系是评价目标的具体化,是对评价目标的分解。建立评价指标体系实质上是对评价目标分类并把评价目标加以具体化、行为化的问题。建立评价指标体系的一般过程是:分解目标,建立指标项体系;确立权重系数;建立评价体系总表。 (一)分解目标,建立指标项体系
指标既然是目标的具体化、行为化和操作化,那么它就必须充分地反映目标,要完全与教育目标相一致。我们可以通过分解目标的方式来形成指标体系。这是建立指标体系的基本途径。对于复杂的系统,还可以在目标与指标之间设置若干中间过渡环节。中间过渡环节通常称之为次级目标。因此,我们可以把目标分解为三个基本层次,如图12-1所示,分别是总体指标(零级指标)、结构指标(一级指标)、单项指标(二级指标)三部分。
在确立指标项体系时,应遵循以下原则:
1.指标项与总目标的一致性2.指标项的直接可测性3.体系内指标的相互独立性 4.指标体系的整体完备性5.指标的可比性6.可接受性
指标的可接受性具有两层含义:其一是要符合我国的国情,从实际出发提出指标才是可接受的。其二是按指标进行评价是可行的。所谓可行性是指第一有足够的信息可利用;第二有足够的人力物力可利用;第三有切实可行的量化方法可利用。 (二)确定权重系数
权重系数主要用于表示在其他指标项不变的情况下,这一指标项的变化对结果的影响据此反映某一指标项在指标体系中的重要程度。 1.权重系数在评价指标体系中的意义
因为权重反映了各指标间客观存在的不平衡性,揭示了与其相应的因素在影响事物的价值上的差异,并通过数量上的规定尽可能使这种揭示和刻画精确、客观。权重集合不仅表明了指标体系内各因素的相对重要程度,而且确定了各因素之间以及指标与结果之间的关系,使我们的评价结论能比较客观地反映对象
的全貌。因此在实施综合评估时,我们可以有效地通过权重提供的比例,充分考虑各因素对整个状态水平的不同影响,按照各分项指标客观地考查对象达到目标的程度,从而使结果更为准确、全面且富有说服力。 2.确定权重的方法
权重系数的大小与目标的重要程度有关,所以我们在确立各指标和权重时,应根据不同学科、不同年龄阶段的特征,客观地、准确地认识各指标项的价值和比重,使赋值的大小与指标的重要程度密切吻合,以保证评价结论准确合理。通常权重系数的获得主要是通过两条经验方法和多因素统计方法结合进行的。 通过组织、访问有经验的专家、学者、教师等相关领域的人员,以他们在实践中的经验分析各指标项的重要程度,以此确立各指标项的权重系数,这种方法主要是以匿名方式,分发问题表如表12-1所示,向专家们函询意见,然后由组织者进行汇总整理,并作为参考资料再分发给每位专家,供他们分析判断,提出新的意见。如此多次反复,经过几轮函询,意见日趋一致,最后得出结论。
将上述权重咨询表获得的数据进行统计计算,以多因素统计方法计算出来的排序指数WI 大小来确定权重系数的大小。一般权重WI在0至1之间取值,即0<Wi<1;各指标权重之和为1。 3.等级的划分与标准的建立
在评价过程中,为了便于量化,通常采用等级划分的方法来进行。常用的等级划分方法有3个等级(好、一般、差)、4等级(优、良、中、差)。但要进行量化,还必须有一个比较标准。标准就是衡量事物的准则。标准的描述有三种常见的形式,即描述式标准、期望评语量表式标准以及客观可数等级式标准。在实际进行评价研究时,往往是同时使用几种标准形式,而很少单独使用一种形式。 (1)描述式标准
描述式标准就是运用文字描述每个不同要素的等级,并给每个等级分值。 (2)期望评语量表式标准
这种标准是根据目标要求,写出期望达到的评语或要求,同时把该项指标分为若干等级,每个等级赋以分值,评判者根据达到期望评语或要求的程度逐级打分 (3)客观可数等级式指标
对于某些条件指标,可以采用客观、可数的定量数值作为标准,并分成不同的等级,凡达到一定的数值者就可归属到某一等级之中。 (三)建立评价指标体系总表
评价指标体系又称评价总表,它是评判人员进行评判活动的依据。评判总表通常包括几个基本项目:(1)结构指标项;(2)单项指标项;(3)权重系数;(4)评判等级;(5)评判得分。 二、获取评价资料的方法
教学评价是以客观资料为基础进行的,所以必须掌握评价资料的工具及运用工具获取资料的方法。在教学评价中,经常使用测验题、调查表和观察表来获取有关资料。 (一)测验
它比较适合于涉及认知类内容的评价 1.测验的类型
测验一般可分两大类型:供答题测验和选答题测验。
供答题测验是指学习者对给定的题目,根据自己的知识经验自由作答。供答题测验包括命题作文、问答题、演算和填充题等。
选答题测验是要求被试者在若干项答案中将正确的答案找出来。选答题的主要题型有是非题、多重选择题、配对题等。
2.编制测验题应注意的一些问题:
题意应清楚明确,含义单一,使学生阅读试题时能明白试题要求他们回答的是什么问题; 试题的理解难度和语言难度应适合被试水平;