《物理教学测量与评价》考试题
125413 周生海
一、简答(每小题5分,合计40分)
1、简述心理测量、教育测量与物理教育测量的区别和联系。
一般地说,在长度、时间、重量之类的物理测量中,对测量结果的描述几乎是没有争议的。这是因为它们是直接测量,它们的操作方法或规则(法则)已经被人们所接受。而作为大脑的产物——心理现象来说,就不能直接测量,但是人的心理必定会在人的具体活动中和行为中有所表现,倘若我们对智力或人格特征这些测量对象有着明确的操作定义,便可根据它寻找一组作业或刺激(实际上就是一组测题或问卷)用以引起被试的行为,而从中推论出其智慧能力或个性特征。譬如,要测量智力,便得首先弄清“智力是什么”、“哪些活动是智力活动”,而后才能定出一组作业,让被试对此作出反应,借以得到他完成这组作业的成绩,而此成绩就是他的智慧效率。然后我们就由直接测得的智慧效率推测他的智力。由此可见,心理测量是间接的测量。
教育测量:就是对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化测定。它主要用于对学生精神特性的测定。
教育测量具有以下特点: 1、教育测量一般是间接测量 2、教育测量的度量单位是相对的 3、教育测量是为实现教育目的服务的 4、教育测量的对象是复杂的
心理与教育测量依据的法则在很大程度上只是一种理论,很难达到如同物理测量依据的法则那样普遍被人们接受的水平;测量对象是人的心理特质和教育成就;量具是由有关领域的专家编制;精确度远远不及物理测量。
(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。
(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。
(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。
2、简述课程评价的发展过程和基本模式。
一、课程评价发展史 1、第一代评价时期
测验(test)和测量(measure)时期,盛于19世纪下半叶和20世纪初的三十年间,代表人物有桑代克(Thorndike)、哈根(Hagen)和美国教育测验的权威人物伍德(Wood.B)等。 2、第二代评价时期
泰勒时期或描述时期(1930—1945年),在1933—1941年,美国著名教育家泰勒及其同事开展了一场规模浩大的“八年研究”,这是大萧条最严重的时期,学校也因缺乏资金以及缺乏乐观精神而停滞不前,教育改革势在必行,于是泰勒就参与了著名的“八年研究”进步教育运动。 3、第三代评价时期
第三代评价时期主要有克龙巴赫(Cronbach,L.J.)和斯塔弗尔比姆
(stufflebeam;D.L.)等人的主张。这一时期的美国已摆脱萧条,人们对前途极为乐观,教育也得到巨大发展。 4、第四代评价时期:判断时期
从1958年到1972年,为发展时期。1957年苏联发射的第一颗人造地球卫星震惊了整个美国,为了发展教育赶超苏联,美国教育评价委员会在考察了评价的发展进程后,断定“教育评价重病缠身”,要求发展新的评价理论和方法以促进教育的向前发展。 5、第五代评价时期:建构时期
从1973年到现在,称为专业化时期。大约从1973年起,评价的领域开始明确,评价成为一门独特的专业。在美国建立了评价研究和发展中心,出版了专业杂志,如《评价研究》、《评价评论》等。
第五代评价的中心思想是,认为评价在本质上是一种通过“协商”而形成的“心理建构”,因此,评价应坚持“价值多元性”的信念,反对“管理主义倾向”。
二、课程评价基本模式
1.目标模式—泰勒模式(在美国盛行30年) 2.CIPP模式(背景—输入—过程-输出模式) 3.CES评价模式 4.感应式模式
5.教育鉴赏与教育批评模式 6.表象模式(countenancemodel) 7.“质”的评价模式:
8.司法式评价(judicialEvaluation) 9.对手式评价(AdversaryEvaluation)
3、简述中学物理教学试卷的常见类型及其各自特点。
一、常见类型:有单元测试,月考,期中考试,期末考试,分班考试,高中学业水平测试,高考模拟试题等。 二、各自特点: 1.单元测试卷,月考试卷
单元测试卷一般是由年级部安排的小测验,月考题一般是在期中、期末考试前进行的一次检查性考试。难度系数并不高,主要是针对学生学习过程中存在的问题或出现的问题进行检查。 2.期中期末考试
是学校教务处组织的正式考试,是学校对教师教学和学生学习的一项重要评价方式,故学校、家长都比较重视。特别要注意试题的难易度,区分度。 3.分班考试题
在高一学年结束后,要进行文理分科,所以试卷要注意区分度,通过考试能够使学生明确自己到底适合学文还是学理,主要考察电学部分。
4.高中学业水平模拟考试
是在高二第二学期开学三四个月后进行的水平测试考试,除了必修一、二之外,文科还要考选修1-1,理科考选修3-1. 5.高考模拟题
这是学校或学区为高考做准备而进行的考试,在试卷难易程度和考查内容上有所计划,每个学校大约有十次左右的模拟考试。
4、简述平均数差异显著性检验的一般步骤。
在平均数差异显著性检验时,一般应遵循以下四个步骤: (1)建立假设(包括虚无假设H0和备择假设H1)。
(2)根据给定条件确定样本分布为何种抽样分布,确定相应的检验方法,并计算出统计量的值。
(3)确定显著性水平α,查相应分布表中的理论值确定为临界值,从而确定出H0的拒绝和接受区间。
(4)做出判断,把临界值与计算所得的统计量的值相比较,若统计量值落在H0的拒绝区间内,则拒绝H0,接受H1;若统计量落在H0接受区间内,则接受H0,拒绝H1。
5、简述信度及效度的基本概念。
一、试题概念
信度是反映测量工具可靠性的指标。常见的试题信度多用相关系数来表示,即用同一组被测学生样本对两组项目的反应之间的相关,作为反映两组项目测量的一致性程度的指标,称作信度系数,简称信度。 二、效度的概念
效度是指测验的有效性,即一个测验能够测出其所要测量的特性或功能的程度。效度或效度系数与信度一样,也是个理论构想概念。在测量理论中,效度被定义为:在一次测量中,与测验目的有关的有效变异数与测验总分变异数的比率,即:
(式8-12)
式中,rXY为效度系数,SV2为与测验目的有关的有效变异数,SX2为测验总分的变异数。从式8-12不难看出,在学生的实际分数中,与测验目的有关的有效分数的比重越大,则效度系数的值也应越大。
6、简述如何进行学生个体的测验成绩评价。
一、以常模参照评价学生的测验分数及注意事项
以常模参照评价学生的测验分数,就是把学生的原始测验分数转换为常模分数进而指出其在某一群体中的相对位置,以此作为评价学生学习成绩的依据。而这一参照群体叫做常模团体。
(一)百分等级分数
百分等级分数是指在常模团体中,某个分数以下的人数的百分比。 (二)标准分数
标准分数又称Z分数。其计算公式如下:
(式10-1)
式中,Zi为学生i的标准分数;Xi为学生i的原始分数;为原始分数的平均数,S为原始分数的标准差。标准分数具有可比性和可加性,可以直接合成运算。
(三)常模表
常模表是一种呈现常模资料的方法,是用来作为比较标准的一种分数量表。利用常模表,对任何原始分数不需要进行计算,就可以在表上直接查到它在常模团体中的导出分数,从而明确原始分数的意义。
常模表一般有三个组成部分:一是原始分数量表,二是与每个原始分数对应的导出分数,三是有关常模团体的描述资料。
二、以目标参照评价学生测验分数
以目标参照评价学生的测验分数,是根据预先规定的教学目标,看学生对教学所要求的知识、技能的掌握情况来确定测验分数的意义,评价学生的测验成绩。
由于常模参照分数着重指出学生在集体中的相对位置,不管学生如何努力都被排成名次,总有最后一名,容易对学生产生不利的心理影响。而目标参照就没有这个缺点。目标参照是一种绝对评价,它不是将被评学生与其他学生或