外语教育评价综述(4)

2019-08-29 22:28

由于N=10 故自由度df=N-2=8 查相关系数显著性的临界值表得:

r(8)0.05=0.5494.由于r=0.533<0.549=r(8)0.05.则P>0.05.根据相关系数显著性统计决断规则,表明r值无显著意义,即英语毕业考预测效度差。 2.信度(reliability)

测试的信度指的是测试分数的一致性或可靠性,是测试结果能够反映考生稳定水平的程度。如果我们用一根橡皮带来量一个人的腰围,就显然缺乏信度。由于橡皮带富有弹性,第一次测量与第二次测量的结果一定会存在着差异。同样我们昨天用一张试卷测试一学生得82分,而今天用同样一张试卷测试同一个学生,结果得62分。两次测试学生得分结果很不一致,这种测试的信度就很值得怀疑了。相反,几次测试结果学生得分相同或趋向一致,那么这种测试的信度就很高。 影响测试信度的因素较多,如举行测试的场所、评分的方法、评估的一致性,还有考生的健康、动机、焦虑、疲劳、猜题的运气、学习迁移等等,这些都值得注意。如有一位教师用录音机来测试学生的外语听力,但由于考场外面的街道嘈杂声,教室里的许多学生就不能听精确。影响测试信度的因素越少,测试就越具有一致性。

估计测试的信度有许多不同的方法。

(1)再测估计信度(test—retest estimate of reliability)。再测估计信度就是对一组学生进行测试,间隔不久后再用同一份试卷对他们进行测试,然后计算两次测试分数的相关系数。两次分数的相关系数愈高,信度也就愈高。在大规模的标准性测试中,要求信度值不低于0.9,甚至达0.95以上,课堂测试则只需0.70~0.80。 再测的时间间隔是个变量,信度的估计值会因第二次再测的时间长短而有所变化。如果两次测试的间隔时间很短,第二次会因学生的记忆力而影响信度的估计值。

(2)复本信度(alternate—form reliability)。复本信度是一种等值测量(measure of equivalence),指的是在同一天用两套试卷(具体题目不同,内容、类型相同)对同一组考生进行测试,然后算出两次得分的相关系数。 (3)内在一致性的测量(measure of interna1 consistency)。内在一致性的测量指的是在一次测试成绩的内在因素中求得一致性。在实际生活中,像再测信度和复本信度需要对同一组学生进行第二次测试,这是比较难办到的。我们只能用一次测试成绩计算其相关系数。下面介绍三种较常用的方法: ①折半法(split-half method of estimating reliability)。折半法就是把试卷按奇数或偶数一分为二,并分别计算这两部分的得分一致程度,测试后再用相关系数公式计算两半测试分数之间的相关系数r,最后用斯皮尔曼-布朗(Spearman-Brown)公式加以校正。校正公式为:

例如:设以6道题对5个学生(N)进行测试,得分如下表所示,求测试的信度:

首先,计算每个考生在奇数题与偶数题的总得分:

第二步,计算奇数题与偶数题得分之间的相关系数,根据计算得

第三步,用系数校正公式计算全测试的信度

可见测试的信度值太低。信度偏低,我们可以增加试题量或选择项的量,增加多少,可按公式计算:

其中A=增加试题量与原来试题量之比

例如,上面的试卷信度偏低,只有0.21,现想提高到0.90,看需增加多少试题量。

即应增加原试题的33倍,6×33=198题。 ②α系数(coefficient Alpha)。半分法是假定两半测试分数的方差(variance)相等。如试题的等效性无法保证时,就可用α系数法来求一次测试的信度值。当试题为简答题、论文题或一份试卷中既有选择题又有非选择题,就可用α系数法来求信度。

其中n=题数

例如:设以6道题(n)对5个学生(N)进行测试,得分如下表所示,用α系数法求这次测试的信度:

第一步,计算考生在各题得分的方差,然后对这些方差求和。先求5个

③库德·理查森估计信度法(Kuder-RichardsonEstimates)。如果试题全

其中n为试题题目数

q为答错人数的比例(q=1-P)

例如:设以10道选择题对10个学生进行测试,答对一个给1分,答错1个给0分,得分结果如下:

故Σpq=0.00+0.00+0.00+0.09+…+0.16 =1.36


外语教育评价综述(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:大讨论工作总结

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: