表7:各种排名结果之间的相关系数矩阵 标准分法 综合评价法 进步度评价法 标准分法 1.0000 0.9945 0.9079 综合评价法 0.9945 1.0000 0.9334 进步度评价法 0.9078 0.9334 1.0000 从表8的相似矩阵的结果可知,前两种排名方案所得到的结果之间的相似系数都在0.99左右,可见这两种排序结果无显著的差异,或者说基本上是一致的。而进步度评价法侧重了学生的进步度,而对于学生的整体情况缺乏一定的考虑。因此,它与其他的评价法的相关系数偏离了1,因此存在一些差异。
结合应用
每种方案都有各自的优点和缺点,对于每个学生来说,按照不同的方案排名的结果可能不一样,在一种方案里排名较靠前,而在另一种方案里排名较靠后,所以用任何一种排名方案可能对某些学生来说有利,可能对某些学生来说不利。
对于综合评价模型给出的最终排名,我们认为其可以很好的反映学生目前的学习状况,但从教育评价的角度来看,名次表示只是评价结果的定量表示,仅仅有定量表示就会使评价结果显得苍白无力,因此我们在对其定量分析的基础上,还结合标准分模型和进步度评价模型,进行了简单的诊断描述解释,将评价结果以语言描述的形式作出定性的结论。
但是由于篇幅和时间的限制我们不可能对每个学生都进行单独诊断,我们只就几种具有代表性类型的学生进行诊断。那么下面我们将612名同学按最后的综合排名分为三类,再按类对其分别评价如下:
表8:分类诊断描述解释 分类
优秀(前100名)
及格(中间300名)
不及格(其余)
诊断语言 对于综合排名处于优秀状态的同学,他们的成绩是值得肯定的,相对与其他的同学,他们具有一定的优势和一定的模范作用,但同时他们应该再接再厉,保持自己的优势,发挥自己的特长。
对于综合排名处在中间的同学,他们比上不足比下有余,应该找出自己与优秀的学生之间的差距,发扬优点,克服缺点,向优秀者看齐。在综合成绩上他们应该努力向处于优秀的学生进行靠拢,同时,他们的努力程度应该值得肯定的。
对于排名处于这部分的同学,首先是应该加强基础性的学习,向达标的方向努力,加大自己的努力程度,提高自己的综合成绩。 我们从这三大类中分别抽取一个具有代表性的学生对其进行详细的评价,得到的评价结果如下所示:
15
表9:部分学生的个体评价结果 学生学号 79
综合评价模型排名 6
标准分模型排名 8
进步度评价模型排名 351
诊断评价语言
从总体上的排名看,这位同学处于优秀的一类,很有优势,同时学习比较努力,他是其他同学的典范
发扬自身有点,克服自己的缺点,他的努力值得表扬,
基础成绩相对薄弱,他的进步值得肯定,应该加强自己的成绩。
228 176 177 378
301 584 588 41
七、问题三
7.1 时间序列预测模型
学生成绩是随着时间变化的,每个学生在不同时期,成绩不是固定不变的。我们把每个学期的进步分求出,根据统计,我们把所有的学生分为三类,一类是成绩一直上升,一直在提高,这种学生是值得表扬的,同时在这个基础上,更能激发她们树立信心,不断进步。一类是学习一直下降的,对于这类学生,我们应该给他们一些暗示。还有一类是成绩忽升忽降的,但是她们的成绩总是在一个水平位置,来回运动。
因此学生的成绩可以看成一个随时间变化的的变量。它是一个时间序列,,即 {Xt,Xt?1,...},根据{Xt,Xt?1,...}的取值对未来t?l时刻的随即变量Xt?l (l>0)做出估计。
Xt??1Xt?1??2Xt?2??3Xt?3???pXt?p??
?~N(0,?2)
因此对于第五个学期,学生的学期成绩是关于前面四个学期成绩的一个时间序列。因此有:
X5??4X4??3X3??2X2??1X1??
设自变量为时间x,因变量是学生成绩。自变量x是影响因变量y的主要因素,而y还受到随机因素的影响,可以合理地假设这种影响服从零均值正态分布。 由于每相邻两个学期之间存在的影响比较大,而时间偏离越大,对其影响越小,因此我们有:第五个学期的学习状况与第四个学期状况的关联是比较大的,它与第三个学期的状态的关联没有第四个学期的大,第二学期的状态与应该比第三学习对它的影响更小一些,而第一学期对它的影响应该比第二学期对它的影响要小,因此有
?4??3??2??1
16
而?1??2??3??4?1
由于每个学期之间的成绩存在一定的相关性,因此,我们计算出每个学期之间的成绩的相关系数,我们应用标准分数来处理,相关系数的计算公式是:
1XY1x?xy?y1r??????zxzy
n?x?yn?x?ynr表示两个变量x,y的相关系数,x和?x表示x的均值和标准差;y和?yy的均值和标准差;zx和zy表示标准分数,n为 数据对数,
由此我们得到每个学期之间的相关系数r12,r23,r34,r13,r14,r24分别是:
0.7642,0.6877,0.7745,0.7112,0.6200,0.6511; 由上面的数据可以看出,每相邻两个学期之间的相关系数都在0.7以上,我们取平均值为0.7421,而每隔两个学期之间的相关系数都在0.6以上,平均值为0.6812,每隔三个学期之间的相关系数为0.6200。
第五学期与前面三个学期之间的相关性(r25,r35,r45),解出它为: (0.7421,0.7421×0.6812,0.7421×0.6812×0.6200)
在给它归一化得出来为(0.4754 0.3238 0.2008),
有这个上面的条件分别解出他们的相关系数;(0.4754 0.3238 0.2008) 我们利用标准分来预测, 因此我们的预测第五个学期的成绩是:
X5?0.4757X4?0.3238X3?0.2008X2
对预测的成绩进行检验:
454035302520151050102030405060708090100110
图7:第五学期学生成绩统计图(标准分预测)
从图中看出学生的成绩符合正态分布。 对于第六个学期的学习成绩:
我们根据前面预测出的第五学期的成绩的基础上,运用同样的方法计算。即时间序列:
X6??5X5??4X4??3X3??2X2
根据前面的方法,计算出每个学期之间的相关系数,因此可以求解出第六学期与其他学期之间的相关系数并将其归一化为:
(0.4258 0.2901 0.1798 0.1043)
17
因此第六学期学生的成绩为:
X6?0.4258X5?0.2901X4?0.1798X3?0.1043X2
4035302520151050102030405060708090100110
图8:第六学期学生成绩统计(标准分预测)
模型评价:
时间序列预测在工业过程控制、经济和财政数据处理等领域中有着重要的应用。对时间序列建模,实际上就是提取序列中潜在的相关性信息成分.时间序列是预测的一个主要方法。对于学生的成绩是一种线性模型,学生的成绩具有随机性,因此采用时间序列预测学生的成绩是很合理的。 7.2 BP神经网络模型
BP (Back Propagation)神经网络是一种多层前馈型网络,用于综合评价的基本原理是:把用来描述评价对象特征的信息作为神经网络的输入向量,将代表相应综合评价的量值作为神经网络的输出;然后用足够的样本训练这个网络,使不同的输入向量得到不同的输出量值;这样,神经网络所持有的那组权系数值和阀值,便是网络经过自适应学习所得到的正确内部表示;训练好的神经网络便可以对一些复杂问题做出合理的判断决策,做出有效的预测和估计。有关神经网络的详细介绍可以[7]。
输入层
隐含层
输出层
x1 x2 x3
y1 y2 z
..…… x4 x5 y2
18
图9:网络神经示意图
图中为一个具有5个输入分量的神经的神经元。一般情况下,具有r个输入分量的神经元,其中输入分量为Pj,(j=1,?r),通过它和权值分量wj(j=1,?r)相连,以?wjpj的形式求和后, 形成激活函数的输入,激活函数的另一个输入是神经网络的偏差b。神经元模型的输出矢量可以表示为
a?f(?wjpj?b)
rj?1rBP网络常用的节点函数分别为tansig(x)和losing(x) 其中:
1?e?2xtansig(x)?
1?e2xj?1 losig(x)?
1 ?x1?e为了训练一个BP网络,需要计算网络加权输入矢量以及网络输出和误差矢量,然后求得误差平方和,当所训练的误差平方和小于目标误差,训练则停止,否则在输出层计算误差变化,且采用反向传播学习规则来调整权值,重复此过程。当网络完成训练后,对网络输入的不是学习样本的样本,网络将输出结果。
运用BP神经网络进行预测主要考虑一下几个方面的设置: 1. 网络结构层次数设置
现有研究成果证明, 3层前馈神经网络能够以任意精度逼近任意非线性关系。为了减少内存资源的耗用和提高网络的学习速度, 仍选用3层网络结构来构建评价模型。
2.权值和阀值初始设置
合理设置BP神经网络连接权值和阀值的初始取值范围,将有效缩短网络的学
nn习时间。连接权值和阀值的取值范围通常是[?1,?1]或[?,?]( n为网络输
22入层节点数) 。通过试验比较,仍将网络的连接权值和阀值的初始取值范围设为[?1,?1]。
3. 隐含层节点数设置
BP神经网络隐含层应该设置多少个节点比较合理,人们没有一个统一观点。有人提出按照经验公式
S?0.43mn?0.12m2?2.54n?0.77m?0.35?0.51
来计算隐含层节点数, 其中m,n分别为输出层、输入层节点数。有人提出根据Hwcht?Nielsen理论,将隐含层节点数设置为2N?1,其中N为输入层节点数。通过试验比较,仍选用后一种方法,将网络隐含层节点数设为11。 4.网络学习算法选择
19