前面谈到效度和信度是标准性测试的两个非常重要的指标。它们之间的关系是一种辩证的关系,有联系又有区别。一方面,有信度的测试不一定有效度,如多项选择题的信度很高,因为测试的结果比较稳定;但如果要用此来测试学生活用词汇的能力,那么这种试卷就缺乏效度。当然没有信度的测试也就谈不上效度。 3.实用性(practica1ity)
测试实用性的一个主要问题就是管理问题(administration)。教师如果课前没有充分准备就去上课,效果肯定很差。测试也一样,它需要事先进行一番精心的规划、设计等。诸如测试的时间要多久?需要哪些设备(录音机、语言实验室、幻灯、投影)?如何评分?需要多少人员?花费多少?总之,测试既要经济又要实惠。 4.难度
外语标准性测试的难度指的是一份试卷的试题应包含有不同难度的试题。难度适中的试卷有利于拉开距离。太难,学生都答不出;太易,学生都能答对,这样就难以区分学生之间的水平差异。难度常用难度指数来表示,标准性测试的题目难度要求在0.3-0.7之间。难度指数标准低于0.3,表示试题偏难;若高于0.7,则表示试题难度偏易。如果是问
大,则题目较易,反之,则较难。假设某试卷的第一题满分值为5分,所有
5.区分度(discrimination)。
区分度指的是测试成绩能区分考生外语水平的程度。区分度好的题目,能把不同水平的学生有效地区别开来,以便择优录取。
试题区分度的指数计算可用“两端分组法”,就是把考生总分由高向低排列,即从最高分开始向下取27%的人作为高分组,从最低分开始向上取27%的人作为低分组。
例如:假设高分组6人,低分组6人,第7小题高分组有4人答对,低分组有3人答对,求试题7的区分度。
D=0.67-0.50=0.17
可见试题的区分度太低。
两端分组法所得区分度的评价标准:
References:
[1] 语言测试和它的方法_刘润清、韩宝成.pdf [2] 语言测试的历史演变及发展趋势.PDF [3] 课堂教学评价.PDF
[4] 关于大学英语教学改革的思考-评价与教学.PDF [5] 认知与语言测试-桂诗春.PDF [6] 语言测试综述.pdf
[7] 语言测试与语言教学.PDF
[8] TEACHING ASSESSMENT & EVALUATION.PDF
[9] Language Assessment Principles and Classroom Practice-H.D. Brown.pdf [10] Foreign Language Assessment _handout.doc
[11] English Language Assessment and Chinese Learner 2010.PDF [12] Language testing and assessment (Part 1).PDF [13] Language testing and assessment (Part 2).PDF
[14] English Language Literature Review-in Teaching Learning and Assessment for
Adults.PDF
[15] Assessing Listening - Brown.PDF [16] Assessing Reading - Brown.PDF [17] Assessing Speaking - Brown.PDF [18] Assessing Writing - Brown.PDF
[19] Assessing Young Language Learners.PDF [20] assessment of second language teaching.PDF [21] Classroom Assessment & Grading that work.PDF [22] Formative Assessment.PDF
[23] Student-Centered Classroom Assessment.pdf