基于综合成绩的学生学习状况评价体系

2019-08-03 13:11

基于综合成绩的学生学习状况评价体系

摘要

众所周知,评价学生的学习效果是教学评价的重要环节。随着素质教育的逐步深入，如何评价学生的学习状况成为我们在学生素质培养方面取得突破的当务之急。

针对问题一，本文对612名学生四个学期的综合成绩进行整体分析。首先我们建立统计分析模型，从测验的及格率，各个分数段人数，离散程度三个方面定性的评价了学生的总体情况，然后采用马尔可夫链评估模型定量的分析了三个学期的学习状况，从而发现这些学生四个学期的学习状况是稳步上升的。

针对问题二，我们对每个学生四个学期的综合成绩进行对比评价，建立了三种评价模型：

? 标准分模型：考虑到原始分的不可加性等局限性，我们引入标准分，

建立标准分模型,得到一个综合成绩的排名。

? 进步度评价模型：为了排除不同学生基础不同的影响，引入进步度进

行评价，建立进步度评价模型，得到学生进步度得分的相应排名。 ? 综合评价模型: 结合综合成绩和进步度评价，建立综合评价模型，得

到较全面、公平的学习状况排名。最后综合比较这三个模型，得到一个定性与定量相结合的评价结果。我们发现综合评价模型是最全面、最科学的评价模型，这个模型得到的结果可以作为我们最终评价的定量结果。同时标准分模型可以反映评价对象的平均水平，进步度模型可以反映评价对象的进步水平，结合这两个方面利用诊断描述解释法，将评价结果以语言描述的形式作出定性的结论。

针对问题三，本文基于不同的评价方法，用了两种方法对学生的成绩进行预测。由于学生的成绩是一个随时间变化的变量，任何两个学期的学习成绩是存在一定的相关性的，因此我们算出不同学期之间的相关系数作为时间序列的权值，采用时间序列预测模型得到了第五、六学期的预测结果。另外我们还采用了BP神经网络模型，首先我们将1，2，3，4学期的标准分、每个学生四学期标准分的方差作以及评价对学生的影响为神经网络预测的评价指标，然后选取样本对神经网络进行训练，最后将训练好的网络实现第5学期的预测。并可依次类推预测出第6学期及以后成绩。通过这两个模型的比较，我们发现用后者得到的预测结果更加接近实际情况。

通过这两个预测模型的结果，发现学生的总体水平有所提升，说明这两个模型的预测是有效的，合理的。

关键字：马尔可夫链评估进步度标准分时间序列预测 BP神经网络

一、问题重述

评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩，同时鼓励基础相对薄弱的学生树立信心，不断进步。

然而，现行的评价方式单纯的根据“绝对分数”评价学生的学习状况，忽略了基础条件的差异；只对基础条件较好的学生起到促进作用，对基础条件相对薄弱的学生很难起到鼓励作用。

现有612名学生连续四个学期的综合成绩。

1.请根据已给数据，对这些学生的整体情况进行分析说明；

2.请根据已给数据，采用两种及以上方法，全面、客观、合理的评价这些学生的学习状况；

3.试根据不同的评价方法，预测这些学生后两个学期的学习情况。

二、模型假设

? ? ? ?

每个学生的成绩都是真实的，都能反应学生该学期的学习状况。每个学生考核的内容及标准是一样的。

学生按照目前的状态稳步发展，没有突发状况或特殊原因。

每个学期的成绩之间都有一定的联系，譬如说某学生第一学期没学好，第二学期也会相应的受第一学期的影响。 ? 学生成绩是按百分制计算的。

? 假设预测过程中第五、六学期对学生的考核内容及标准均不变。

三、问题分析

评价学生学习状况的目的是为了激烈优秀学生努力学习，取得更好的成绩，鼓励基础相对薄弱的学生树立信心，不断进步。

本文首先对所给的612名学生4个学期的成绩进行整体分析。由于试卷的难易程度是未知的，因此我们在模型准备中对试卷进行公平合理的分析，即分析试卷的难度和区分度。同时，我们对所给出的数据进行了合理的筛选。首先统计出每个学期各个分数段的学生人数，计算出整体的平均分，学生成绩的离散度，定性的比较出学生成绩整体的情况。接下来，我们运用马尔可夫链，对学生成绩进行定量的分析，得出每个学期学生的成绩总体的变化值。根据数据对学生的整体情况进行评价。

对于评价单个学生学习状况，受所给数据的限制，我们主要从两个方面综合评价学生的学习状况，分别是学生的进步度和学生的学习成绩，学生的学习成绩即为本文所给定的数据。对于学生的进步度分析，是一个重点，由于不同学期之间试卷的难易不能区分，因此我们引用标准分，来比较不同学期学生的进步情况。首先，我们对每个学生的成绩进行处理，求出每个学生每个学期的进步度。

每个学生的成绩是一个随时间变化的随机序列。对于预测第五学期的成绩，我们可以根据所给定的前面的几个学期学生的成绩进行预测。由于第五学期与第四学期时间的偏离是最小的，因此，对于第五学期学生的成绩受第四学期的影响比较大。而其他学期与它偏离的比较大，因此对它的影响应该小于第四学期对它的影响。由于每个学期之间的成绩存在一定的相关度，因此，计算不同学期之间存在的相关系数作为权值，预测出第五、六学期学生的成绩。再次我们可以运用神将网络的预测功能，对学生成绩进行预测，然后比较两种方法的结果。

具体思路及求解过程如下：

学习状况评价整体分析(问题一) 个体分析(问题二) 等级解释定性分析定量分析马尔可夫评估模型及格率离散程度分段统计标准分模型进步度评价模型综合评价模型模型比较及改进时间序列预测模型成绩预测(问题三) BP神经网络模型图1：流程图

四、模型准备

4.1、数据预处理

由于本题所给数据极不工整，小数点后的位数参差不齐，所以我们用EXCEl表格把所有数据处理成小数点后保留两位数字的规整数据。

进一步分析题中所给的数据，我们发现其中有些学生的成绩为0分或者是很低，因此对学生的总体成绩合理的评价除了要使用真实的数据，更要对数据进行

精确性分析，我们把异常数据筛选出来，并做特别处理。

考虑到题中所给的数据只有612名学生四个学期的最终成绩，数据量非常有限，所以我们做了以下相应的处理：首先，我们针对单个学期的数据进行处理，计算出单个学期的平均分和标准分；然后求每个学生的四个学期的成绩的平均分，标准差及方差。

由于本题的数据量较大，需要从数据表格中获取的信息量也很庞大，我们运用MATLAB软件中的EXCEL文件接口函数，把所有数据载入到MATLAB中的元胞数组中处理分析。 4.2、成绩分析

在进行成绩评价之前，我们对成绩进行简要分析，来检验数据的有效性。而有效性评估的主要指标有难度和区分度[1]，因此，以下是我们成绩分析的内容。难度：

难度是指试题的难易程度，是衡量试题质量的指标，它与整个试卷的难易和考生得分的分布状态关系很大。通常用全体考生对该试题作出正确回答的百分数来表示，即试题难度指数(p)来表示。

任何测验的难度均有以下性质：第一，难度值p的大小取决于平均分的高低。平均分越高，则难度值越大，难度值大的测验反而容易，第二，中等难度值的测验可以产生最大的离差。当p?0.5时产生的离差最大；第三，难度值的大小并不具有线性关系，不能说p?0.6的测验比p?0.3的测验容易一倍。

难度对考试的影响主要表现在：

(1)影响考试成绩的分布形态。正常人群智力的高低服从正态分布，所以在适宜难度的考试中，学生的成绩分布应基本服从正态分布，难度过大或过小，都会造成考生成绩偏离正态分布；

(2)影响考试成绩的离散度。过难或过易的考试，会使成绩相对集中在高分端或低分端；

(3)影响考试的区分度。过难或过易都会导致区分度过小，因为大家都会做或都不会做是区分不出优劣的。

难度的计算，考虑到我们的数据比较大，我们采用“27%原则”。我们将学生的测验成绩从高到低依次排列，前面27%的人称为高分组，后面27%的人称为低分组。高分组和低分组的得分率分别用pH和pL来表示，则难度可以采用如下公式表示：

1p?(pH?pL)

2其中得分率我们采用该次测验的平均分与满分的比值来表示。区分度：

区分度是试题质量的另一重要方面。区分度又叫做鉴别力，是指测验能够把不同程度、不同类型的人区分开来的程度。它与试卷难度有非常密切的关系，通常用D表示。

区分度的计算我们也沿用前面提到的“27%原则” ，采用两端法计算，即区分度可用如下公式计算：

D?pH?pL

其中D表示区分度。综合评价：

附件中给出了612名学生四个学期的综合成绩，为了便于我们后序的评价和预测操作，我们需要根据每学期的综合成绩分析该次测验的质量，以确保题中所给数据的有效。

下面我们就难度和区分度这两个因素对四个学期的测试试卷进行粗略评价。首先从612名学生四个学期的成绩中挑选特殊的数据统计如下：

表1：四个学期学生成绩中的相关数据

学期一学期二学期三学期四最高分 89.4500 90.8520 90.6158 89.6250 最低分 24.3438 19.1820 16.2500 16.5000 高分组的平均分

82.3326 84.4353 82.2684 84.2991 低分组的平均分 60.2390 61.4574 62.4796 64.0649 只有这几个数据需要计算难度和区分度还是不够的，由于题中没规定测验的满分(f)是多少，所以我们采用两种具有代表性的满分值(f?100,f?90.8520)进行计算。由此我们算出四个学期测验的难度和区分度列表如下：

表2：满分是100分时四个学期测验的难度和区分度难度区分度学期一 0.7129 0.2209 学期二 0.7295 0.2298 学期三 0.7237 0.1979 学期四 0.7418 0.2023 表3：满分是四次测验中最高分时的测验难度和区分度难度区分度学期一 0.7846 0.2432 学期二 0.8029 0.2529 学期三 0.7966 0.2178 学期四 0.8165 0.2227 根据p值和D值对试题进行综合分析评价时，可参考以下标准[1]。试题难度一般为p值在0.25~0.75之间为宜，超越此范围者谓之偏易或偏难。从理论上讲，p值越近0.5，则区别能力越高，如果p值很接近0或1，则无法区别学生学业成绩的差异。但当所有试题的难度指数均为0.5时，有时可能使50%的考生得100 分，而另外一半的考生全部得0分，这反而降低了总分的区别度，故通常认为试题的区别度一般为D值在0.15~0.30之间则为良好试题，大于0.30则为优秀试题，小于0.15以下则为不宜采用或需要认真分析、寻找原因予以修改或应淘汰的。在判断试题的性质时，应把难度和区分度结合起来进行分析，如果

表示难易度适中，区别度良好，属好题。如果p?0.5,D?0.15，p?0.5,D?0.15，

表示试题虽然偏难，但仍有较好的区别度，属适中题。如果p?0.5,D?0.15，表示试题难易度适中，但区别度差，属淘汰题。

根据题中提供的四学期的成绩算出的试卷难度值均在0.70以上，区分度也均在0.15以上，结合以上标准可知，该612名学生所进行的测试试题都属于好题，另外我们可以发现四个学期的试题难度和区分度均相近，具有直接可比性，题中数据是很有效的，也便于我们进行进一步的分析计算。

共9页:

基于综合成绩的学生学习状况评价体系.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档