公式:xj(i)'?sij?min(sij)jmax(sij)?min(sij)jj得到无量纲x矩阵。
(3).构建综合评价模型:
根据灰色关联分析法,关联度可由以下表达式确定:
yj(i)?a?b??j(i)?b?,其中:?j(i)?xj(i)'?x0(i)',i?1,2,?612,j?1,2,?7
a?minmin??j(k)??0,b?maxmax??j(j)?,??0.5
1?i?6121?j?51?i?6121?j?5 综合各个指标的权重和各个指标的取值,建立综合评价模型:
7Zi??wj?1j'xij
(4).再由各项指标结合附件中的数据以前20个学生为例,对他们成绩的综合评定如下表: 序进步 进步 进步 名号 学期1 学期2 学期3 学期4 度2 度3 度4 总评 次 1 80.171 73.610 75.483 75.937 -6.244 1.942 0.458 0.442 7 2 76.765 72.602 81.739 73.717 -4.133 9.591 -7.479 0.441 8 3 64.922 61.099 68.961 66.359 -3.848 8.408 -2.465 0.432 17 4 83.833 82.300 77.890 79.826 -1.481 -4.338 2.013 0.455 4 5 77.201 82.129 78.899 82.338 5.1150 -3.151 3.4930 0.531 1 6 79.416 65.788 77.379 70.813 -12.59 12.924 -6.224 0.531 13 7 77.421 74.169 62.430 63.065 -2.909 -10.96 0.694 0.432 18 8 63.661 60.081 53.906 20.827 -2.790 -5.099 -30.48 0.429 20 9 70.656 74.970 71.954 72.326 4.425 -2.916 0.375 0.438 10 10 76.290 69.396 76.592 68.485 -6.569 7.537 -7.693 0.437 14 11 85.103 81.022 82.585 65.325 -3.765 1.515 -16.41 0.434 15 12 65.689 68.684 69.603 65.501 3.072 0.901 -3.970 0.434 16 13 78.134 72.363 80.099 80.758 -5.750 8.321 0.640 0.457 3 14 77.626 74.043 75.937 73.444 -3.474 1.925 -2.470 0.437 11 15 69.993 70.813 77.460 77.379 0.866 6.937 -0.077 0.442 6 16 71.721 70.349 75.796 80.906 -1.428 5.783 5.035 0.458 2 17 76.201 76.997 83.328 77.010 0.819 6.445 -5.943 0.458 5 18 56.143 55.039 62.333 60.665 -1.151 7.759 -1.567 0.431 19 19 68.445 71.844 76.227 72.772 3.5915 4.412 -3.278 0.440 9 20 84.629 78.671 79.003 71.436 -5.522 0.3314 -7.512 0.437 12 结果与模糊层次分析法求出的结果大致相同。 4.3.预测接下来两学期的学习成绩 4.3.1.多元线性回归法预测模型
记xi,j为第i个学生第j期的预测成绩,则假设学期的成绩是由前三个学期的成绩所确
定的建立如下多元线性回归方程:
xi,j?a*xi,j?2?b*xi,j?2?c*xi,j?1?d利用附件提供的前
三个学期的成绩,可以算得第四个学期的成绩的预测值,所以,用 最小二乘拟合求解系数a,b,c,d则xi,j?0.0225*xi,j?2?0.2068*xi,j?2?0.6961*xi,j?1?7.1190 . 从上式中的式子中我们可发现,系数值依次递减,说明第4 学期的成绩受第3学期影响最大,随时间差的增大同时画出相应的残差分析图,从上式可发现,系数值依次递减,说明第4 学期的成绩受第3学期影响最大,随时间差的增大,
Residual Case Order Plot
30 20 10 0 Residuals -10 -20 -30 -40 -50 100
200
300 400 Case Number
500
600
图6:未剔除数据前的多元线性回归预测的残差图
给出了采用前三学期原始成绩预测的第四学期成绩的残差,可见大部分预测值与真实值之间的偏差小于10 分,只是对于极少部分成绩较差的学生预测的偏差还较大,因为这部分同学的成绩波动较大,不能按照线性回归来预测其成绩。
我们发现有些数据的残差比较大,为了更精确的预测学生成绩,我们剔除一些成绩波动较大的学生的成绩,然后再次进行多元线性回归预测。如成绩变化太过悬殊及出现成绩为0的都先不考虑。为8,11,26,43,62,67,90,121, 181,231,249,264,267,273,288,301,307,466,491,536,557,565最终我们剔除了这些同学的成绩数据,再求解线性回归方程的系数,求得的多元线性回归方程如下并得残差分析图7:发现没有特别脱离的数据则可以得到为:
?i,j? 0.0387*xx? 0.2220*xi,j?2? 0.5400*xi,j?1? 16.7594 i,j?3
运用此式可以计算出第5,6学期的学生成绩,如下表:
Residual Case Order Plot
25 20 15 10 5 Residuals 0 -5 -10 -15 -20 -25 50
100 150 200 250 300 350 400 450 500 550
Case Number 图7:剔除部分波动较大的数据之后的多元线性回归残差图
由图7可以明显发现预测值与真实值之间的偏差几乎都小于10 分,没有波动很大的成绩出现,说明该线性回归的精度在一定程度上满足要求。从以上的数据分析来看,在不考虑极少部分成绩很不稳定的同学的前提下,该模型能够很好的预测学生的5,6学期的成绩,由此来说明其学习状况。 学生序号 学期5成绩 学期6成绩 学生序号 学期5成绩 学期6成绩 1 77.71671 78.69101 11 74.87179 75.48324 2 77.90768 78.56402 12 71.67042 73.29807 3 71.44551 73.27903 13 81.34908 81.92946 4 80.63366 81.21552 14 76.52521 77.5271 5 82.17705 82.62867 15 78.76284 79.64912 6 75.31178 76.46329 16 80.35543 81.25079 7 69.67624 71.60362 17 80.28682 80.65469 8 40.33299 44.36558 18 67.18754 69.61233 9 75.25422 76.49459 19 76.1888 77.23307 10 74.07745 75.25894 20 76.46011 77.23652 由下表的数据,可看出学生总体的成绩是在不断提高的,成绩为优秀和良好的同学占得比例越来越大,同时不及格的同学正在逐渐减少,学生总体的学习状况良好。
再利用Excel对所预测的学生成绩进行数据分析与计算得到的表格如下: 第5学期 第6学期 平均分 77.195 78.389 最高分 87.957 87.944 最低分 29.673 36.781 极差 58.284 51.163 中位数 77.621 78.845 总分 45158.868 45857.280 方差 41.513 32.166 标准差 6.443 5.672 偏度 -0.4356 -0.3725 4.3.2.灰度模型GM(1,1)预测成绩模型 模型分析:
灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。
模型建立:
xi(j)是第
0i个学生第j个学期的综合成绩,则第i个学生的的原始数据列可为:
000xi?xi(1),xi(2),xi(3),xi(4)0?0?。利用原始数据进行累加和得到生成数列
?1?i(k)?x1k?j?1?1?1?1??1?x(j),k?1,2,......n;所以xi??xi(1),xi(2),xi(3),xi(4)?。则建立灰色模型GM
????0i(1,1)相应的微分方程为:
dxi?t?1dt?axi(t)?uα称为发展灰数;μ称为内生控制灰数。
1?1?1??1?????xi(1)?xi(2)?,1????xi0(2)??2????0????1?1??1?xi(3)?xi(2)?xi(3)?,1? ,YN?令B????, ??????2???????11??0??1??(xi(3)?xi(4)),1??xi(n)??2???则A?(a,u)T?(BTB)?1BTYN,A称为待估参数向量
1u??aku?0?x(k?1)?x(1)??,k=1,2,3,4,5 可得到i?i?ea?a?1u??a(k?1)u?0??. 且因为xi(k)??xi(1)??ea?a?所以xi(k?1)=xi(k?1)?xi(k)=?xi0(1)???0?1?1?u??aka(1?e); ?ea?故应用Matlab编辑函数求出学生的预测成绩:则以前10 个学生的成绩为例如下表为: 学期 期 序号 1 2 3 4 5 6 77.5677.6975.5177.8381.5178.515 0 2 1 2 2 1 78.6878.4081.1476.6881.6082.436 5 9 5 2 4 9 其他学生的成绩预测见附录 我们对上面的成绩预测结果进行残差检验:根据公式
?0?1?17 59.641 55.715 8 18.188 12.059 9 70.959 69.639 10 72.334 72.661 u??ak?0axi(k?1)=xi(k?1)?xi(k)=?xi(1)??e(1?e)算出第2,3,4学期学生的综合成绩
a??0xi(j)并与x(j)原始进行相减得到相对的绝对误差序列Δi(j)?xi(j)?xi(j)即相对应
0i?00?0的绝对误差序列φ(j)? Δi(j)x(j)0i0*100%。以下表是前10个学生的绝对误差列:
绝对学期1 学期2 学期3 学期4 误差 1 5.7809 0.5440 1.0684 0.5287 2 0.7363 2.1763 4.3139 2.1364 3 4 5 5.4970 1.6341 0.1400 1.8150 5.0459 1.8788 3.1132 1.4027 3.6793 1.8694 3.7533 1.8746 相对学期1 学期2 学期3 学期4 误差 1 0.0732 0.0073 0.0144 0.0069 2 0.7363 0.0296 0.0535 0.0285 3 4 5 0.0885 0.0276 0.0454 0.0204 0.0017 0.0218 0.0663 0.0226 0.0481 0.0231 0.0484 0.0225 由上面的表给我们发现预测中预测方法的相对误差都不是很大都是在10%以下说明该模型可行的。