1.2.2 模型优化
1.2.2.1优化模型一:消除学生恶意评教对教师评价的影响
考虑到,如果教师与评价者之间有恩怨,这将从一个方面反映出这位老师在为人处事方面的不足,所以不能将有恩怨者所打的分数简单地抛弃。在计算每位老师的平均分时,为了消除有恩怨者给某位老师的评定带来的影响,我们采取修正抛弃的方法。首先设定一个分数线 ,将所有低于此分数线的分数看成是由有恩怨者所打出的。就假设以ψ=80分为例,即将所有打出分数低于或等于80分的评价者视为有恩怨者,对其打出的分数进行修正。具体做法如下:
(1)教师和评定者有恩怨,从某一方面说明他在为人师表方面有所欠缺。所以,将有恩怨者所打分数中的第18题(为人师表\\教书育人,具有良好的职业道德。)(详见附录一)的值置换为最差,即分值取为2分,并对该项求平均值。
(2)其余11项的分数,用其他非恩怨者打出的相应项的平均分来代替。
(3)对老师每项的得分求和,得出每名评价者对这位老师所打的分数,再对所有打分者的评分取平均。
这样就相对消除了学生个人不良情绪的影响。但是在实际应用中,具体的ψ值是一个经验值,到底多少合适,需要按照学校的实际情况作进一步的讨论。
1.2.2.2优化模型二:消除不同人数的不同班级评同一老师时的误差
预设的平均法在处理这种情况时,相当于将该老师所教的各班对其所打的分的总和进行累加,然后再除以这几个班的总人数,以一个老师教两个班A班与B班为例,其最后的得分为:
M??i?1nAMA??MBi?1nBnA?nB
将其简化(分子分母同时除以nB),得出:
M?1nB?i?1nA1MA?nBnA?1nB?i?1nBMB
易看出,若nA??nB,上式约等于MB,即B班的分数在评定中占优,而A班的
MA?MB 2分数几乎不起作用,也就是说A班对该老师的教学情况的评定被忽略了。
但若采用仅对各班平均分在直接取平均的办法,即取
Mo?作为评定该老师综合教学质量的标准,又使得其中人数较少的班级的分数所占的比重过大,使得少数人的决定占优,使评分不公。
5
而且,对于人数不同的班级,老师所付出的劳动及心血是不同的。对于人数多的班级,教师往往要拿出更多的精力。如果不考虑人数的影响,会导致评分系统的不公。
nA综合考虑上述各种情况,在处理这个问题时,我们加入了一个以为变量的变参
nB数???nA?来修正式上式,即:
?n?B?Mo'???nAnB??MA??MB??nAnB??1i?1i?1nAnB
其中??nAnB?有以下性质:
AB?nn??0;
(2).??1??1;
(3). ??nn? 单调递增;
(4). ??????,即:当B班不存在时,即只有A班时,
(1). ?ABMo'???nAnB??MA??MB??nAnB??1i?1i?1nAnB?MA,这与实际相符。
1.2.2.3优化模型三:学生评分子模型中,消除班级之间的各项差异对评分的影响
当完全按学生所打的原始分数对老师进行排序评价时,由于没有考虑到班级之间、学科之间、以及评估者判断标准等价尺度存在的差异,会导致评估结果差异较大,因此这种方法并不能客观地反映某一老师所处的状态。利用数理统计、影射理论和教育测量的理论,采用映射法或二次量化方法对总体评分进行标准化处理,将能有效修正这些评估尺度的差异。方法具体如下:
方法1:映射法
以下是我们在建立映射模型时基本的思路及步骤: (1). 确定基本假设
教师个人教学水平和能力是有差距的,并且有可能有显著差异。如果我们假定教师最高水平赋值为98分的话,那么评分为70分的教师则是相当差了,可以说基本不合格了。其它教师则介于二者之间。这种假设便产生了一个标准的基本班级模型。
(2). 建立数学模型
在一个自然班级任课的教师的集合我们称之为班级教师群体,教师人数一般有7-8
6
名。由经验可知,各班学生评分数据离散度肯定不一样。有些班级“最好”教师得到的分数可能比其他班“最差”老师的分数还要低。为了将这种不合理偏差消除,在数据处理中,我们将每个班评分最高的教师赋值为98分,最差的赋值70分,其它个体的取值则根据其与最高分的差异大小,分别映射到标准班级模型上的某一点,其映射点在98-70这个幅度内移动,具体分值可由“等比差距测算”数学公式求出:
设某班最高分老师的学生评分用?1表示,在标准班级模型上的投影值用M1表示,设M1=98;最低分老师的学生评分用?n表示,在标准班级模型上的投影值用Mn表示,设Mn=70;则处于中间分的某一位老师的模型评分Mi为:
Mi?M1???1??i???M1?Mi???1??n?
通过这个公式,我们不难发现,班级与班级的偏差基本消除了,教师所得分高低不再依赖于运气,而更大程度上取决于教师本身的实力,即他在班级教师群体中的排名的先后,以及与先进指标差距的大小。从某种意义上来说,经过这种处理以后的数据比原始数据更能说明问题,更有说服力,更具权威性
(3). 对数据的再一次修正
但这个模型也有一定的局限性。如某位“最差”老师在某班的学生评分a,另一位老师在另一个班的学生评分b,尽管这两个分数均是所在班级的最低分,也就是说,这两位老师是所在班级教师群体中的“表现最差者”,但原始分数差异达|b-a|分,显然所谓“差”的程度应该是有区别的。而模型评分后,二者被统一处理为70分,这也显得偏离实际。且最好教师也将会出现这种情况。我们还得对得到的数据做进一步的修正,由于学生的直接评价还是具有一定的可信度的,所以在求某班某教师的最后得分?i时,我们将取学生的最后评分和在模型上的投影值的加权平均值,这样显然更为合理一些。即:
?i???i?Mi?2
根据以上算法,我们可以求出每位教师最后的得分。
方法2:二次量化方法
由于在一个班级的评分中,得分特别高者和得分特别低者,其都是由单个老师的自身能力来决定的,在一定程度上不能反映这个班的总体打分情况和趋势。所以我们用如下方法对数据进行处理:
(1).将老师按任课班级归类分组,同一个班级的全体老师分为一组;
(2).计算出该班任课教师得分的平均值?及标准差?j;
1n????j
nj?1 7
2??1?j?????j?????n?1?12
?j为该小班评分的标准差。其中,n为该小班任课教师数,?为该小班的平均成绩,
(3).若 值
?j???2?j,则剔除得分?j,再重新计算提出这位老师的分后的平均
1my???j
mj?1 m为进行粗差剔除后的该班的教师数。
2??1m??'???j?y????m?1j?1?12
?'为粗差剔除后的标准差。此时, ?i??'。
若
?i???2?i,则不须剔除任一原始得分。
?i?? ?i??i(4)不需进行粗差剔除的各组任课教师的标准分按下式计算:
而进行粗差剔除后该班任课教师标准分计算为:
yi?y?i?
?'每位教师取标准分,相当于对所有教师用同一尺度去度量,且具有可比性与可加性。
Zi为正,表明某教师得分高于均值,Zi为负,表明某教师得分低于均值,以便于各级领导部门按统一的尺度了解某教师在所任课的班级中大致排序情况。为克服某班、某系、甚至全校参评教师得分纯用Zi排序时受班级差异影响的局限性,我们进行了二次量化,从而得到较为客观的排序。由于标准分与标准差成反比,所以标准差的大小对标准分值的大小影响甚大,而各班标准差的大小又是由教师教学状况的差异程度所决定的,是一种客观存在的现象,因此对标准分进行二次量化处理时还要计算全校参加评估的各小班
??的标准差的平均值: ??ni,引入评价因子:
8
??i????i??? fi????1???????i评价因子
fi可以用来修饰被评教师的标准分。
?i'??i?fi
(5)计算经再次修正的后各班任课教师的标准分。
(6)根据?i'值从大到小进行排列,得出全校任课教师此次评估的标准分的排序。 通过采用二次量化,最大限度内消除了学科之间评价标准差异等主观因素造成的排
序不合理,比用自然排序法要客观、科学。
比较以上两个算法,方法二要更为可信。在映射法中,如果出现全班的分数都很低,而有一个人得分过高的情况时,会使其他人的分数在新的分布中变得更低,造成新分数比单纯的取平均时更低,同样道理,有一人得分过低时,其他人的分数也会相应的得到提升。这显然是不合理的。而且在被评分人数相对较多时,其影响就会被加大。二次量化法则将该班老师得分异常低与异常高者一起剔除,取一个均值作为标准,这种方法能真实反映出打分的真实情况,更加合理一些。但当一个班的教师很少,打分的离散率又很高时,这种方法却将比重相当大的得分消除,使得误差加大。因此,在这种情况下,映射法更加适用。
1.3 模型结果
教师编号 预设模型总分 预设模型名次 优化模型一总分 优化模型一名次
9 95.14814815 2 95.48193889 3 21 90.55555556 46 91.05624167 47 22 92.67567568 12 93.05455473 19 24 91.48484848 37 92.17234091 36 26 94.33333333 4 90.81635938 48 27 95.09195402 3 94.56441923 6 28 91.28395062 42 95.53476667 2 30 93.66666667 7 94.17466914 7 31 93.07425743 10 95.47736667 4 32 94.06666667 5 93.6142486 10 33 93.41818182 8 94.77832667 5 35 92.20512821 21 93.97328864 8 59 90.63414634 45 93.20576 14 62 92.86842105 11 92.14724512 37 63 91.58536585 36 93.10558816 16 93 92.525 14 92.29298415 34 94 91.58974359 35 93.1006175 17
9