外语教育评价综述(4)

2019-08-29 22:28

由于N=10 故自由度df=N-2=8 查相关系数显著性的临界值表得：

r（8）0.05=0.5494．由于r=0.533＜0.549=r（8）0.05．则P＞0.05．根据相关系数显著性统计决断规则，表明r值无显著意义，即英语毕业考预测效度差。 2．信度（reliability）

测试的信度指的是测试分数的一致性或可靠性，是测试结果能够反映考生稳定水平的程度。如果我们用一根橡皮带来量一个人的腰围，就显然缺乏信度。由于橡皮带富有弹性，第一次测量与第二次测量的结果一定会存在着差异。同样我们昨天用一张试卷测试一学生得82分，而今天用同样一张试卷测试同一个学生，结果得62分。两次测试学生得分结果很不一致，这种测试的信度就很值得怀疑了。相反，几次测试结果学生得分相同或趋向一致，那么这种测试的信度就很高。影响测试信度的因素较多，如举行测试的场所、评分的方法、评估的一致性，还有考生的健康、动机、焦虑、疲劳、猜题的运气、学习迁移等等，这些都值得注意。如有一位教师用录音机来测试学生的外语听力，但由于考场外面的街道嘈杂声，教室里的许多学生就不能听精确。影响测试信度的因素越少，测试就越具有一致性。

估计测试的信度有许多不同的方法。

（1）再测估计信度（test—retest estimate of reliability）。再测估计信度就是对一组学生进行测试，间隔不久后再用同一份试卷对他们进行测试，然后计算两次测试分数的相关系数。两次分数的相关系数愈高，信度也就愈高。在大规模的标准性测试中，要求信度值不低于0.9，甚至达0.95以上，课堂测试则只需0.70～0.80。再测的时间间隔是个变量，信度的估计值会因第二次再测的时间长短而有所变化。如果两次测试的间隔时间很短，第二次会因学生的记忆力而影响信度的估计值。

（2）复本信度（alternate—form reliability）。复本信度是一种等值测量（measure of equivalence），指的是在同一天用两套试卷（具体题目不同，内容、类型相同）对同一组考生进行测试，然后算出两次得分的相关系数。（3）内在一致性的测量（measure of interna1 consistency）。内在一致性的测量指的是在一次测试成绩的内在因素中求得一致性。在实际生活中，像再测信度和复本信度需要对同一组学生进行第二次测试，这是比较难办到的。我们只能用一次测试成绩计算其相关系数。下面介绍三种较常用的方法： ①折半法（split-half method of estimating reliability）。折半法就是把试卷按奇数或偶数一分为二，并分别计算这两部分的得分一致程度，测试后再用相关系数公式计算两半测试分数之间的相关系数r，最后用斯皮尔曼-布朗（Spearman-Brown）公式加以校正。校正公式为：

例如：设以6道题对5个学生（N）进行测试，得分如下表所示，求测试的信度：

首先，计算每个考生在奇数题与偶数题的总得分：

第二步，计算奇数题与偶数题得分之间的相关系数，根据计算得

第三步，用系数校正公式计算全测试的信度

可见测试的信度值太低。信度偏低，我们可以增加试题量或选择项的量，增加多少，可按公式计算：

其中A=增加试题量与原来试题量之比

例如，上面的试卷信度偏低，只有0.21，现想提高到0.90，看需增加多少试题量。

即应增加原试题的33倍，6×33=198题。 ②α系数（coefficient Alpha）。半分法是假定两半测试分数的方差（variance）相等。如试题的等效性无法保证时，就可用α系数法来求一次测试的信度值。当试题为简答题、论文题或一份试卷中既有选择题又有非选择题，就可用α系数法来求信度。

其中n=题数

例如：设以6道题（n）对5个学生（N）进行测试，得分如下表所示，用α系数法求这次测试的信度：

第一步，计算考生在各题得分的方差，然后对这些方差求和。先求5个

③库德·理查森估计信度法（Kuder-RichardsonEstimates）。如果试题全

其中n为试题题目数

q为答错人数的比例（q=1-P）

例如：设以10道选择题对10个学生进行测试，答对一个给1分，答错1个给0分，得分结果如下：

故Σpq=0.00+0.00+0.00+0.09+…+0.16 =1.36

共5页:

外语教育评价综述(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档