基于IRT理论的计算机自适应考试系统的设计与实现8(4)

2019-04-22 20:54

工程硕士学位论文 2 自适应考试系统理论及基础逻辑斯蒂模型是伯恩鲍姆于1958年提出的。他假定的项目特性曲线如图2一2所示。

图2-2 逻辑斯蒂模型

项目特性曲线反应的是各种特质水平的被测者(一般用θ表示)，对某一测试项目的正确反应概率(一般用P(θ)表示)。一定特质水平或能力的被测者对某一项目的正确反应概率与无其它因素无关，只由该项目的质量决定。

通常情况下，被测者的特质水平可看作连续变化的，因此，反映各特质水平上被试者的答对概率的连线就必然成一条平滑的曲线。因为特质越高的被试者答对概率越大，因此这条曲线是一单调递增函数曲线。经研究，被测者的答对概率与其特质水平之间的关系是非线性的，即当特质水平θ大或小到一定程度以后，答对概率P(θ)随之变化的速度显著变小。经研究发现，这种曲线的形状，是一条以其拐点为中心的如图2-2所示的S型曲线。

通常情况下我们可采用项目难度、项目区分度和猜测参数三个指标来描述某一测验项目的质量。从图2－2中可以看到，项目特性曲线下部的渐近线离坐标轴的零点存在一点距离，这就充分说明由于存在猜测因素，特质水平或能力很低的被测者仍有可能碰运气答对。该项目的猜测参数，通常用c来表示，它是凭猜测答对该题的概率。在前面我们提到，项目特性曲线是一条以拐点为中心的曲线，因而其拐点在纵轴上的投影正好落在c与1的中心上，即拐点的纵坐标为(1+c)/2。这表明特质水平为b(拐点在横轴上的投影)的被测者在排除猜测因素不计的情况下，与答对、答错该项目的概率恰好彼此相等。因此b一般被定义为项目的难度参数。项目特性曲线拐点处的斜率反映了曲线的陡峭程度，这与项目划分被测者特质

工程硕士学位论文 2 自适应考试系统理论及基础水平的能力有关。很显然，曲线越陡，答对概率P(θ)对特质水平的变化就越敏感，即项目区分被试者水平的能力越强。因此，曲线拐点处的斜率被称为项目的区分度参数，通常用a表示。

用来描述项目反应模型的数学函数称为项目反应函数。根据以上的分析可以得出，项目反应函数就是描述被测者答对概率P(θ)与项目的参数a、b、c和被试者的特质水平θ在数值上的关系。逻辑斯蒂模型得名于伯恩鲍姆选择用来描述项目反应模型的数学函数是逻辑斯蒂拱形函数族。根据参数的不同，特征函数可分为单参数、双参数和三参数三种模式，它们的数学表达式分别为：

单参数模式： 1 ? e ? D( θ ? b) （2-1）

P(?)?11? )双参数模式： P ( ? ? Da( θ ? b) （2-2）

1?e1三参数模式： P ( ? (1 ? c θ ?b) （2-3） ? ) ? c) ?Da(1?e

其中：D=1.702为量表因子常数；D：受测者能力值；P(θ)：能力为θ的人答对此题目的概率。a：题目的区分度，即特征曲线的斜率，它的值越大说明题目对受测者的区分程度越高。b：题目的难度，即特征曲线在横坐标上的投影。c：题目的猜测系数，即特征曲线的截距。值越大，说明不论受测者能力高低，都容易猜对本道题目。

项目反应理论具有以下优点：（1）、题目参数估计更为准确。（2）、全面解决考试等值问题。

（3）、定义了信息函数这一综合质量指标，作为更科学地挑选题目的标准。

（4）、适合编制自适应考试系统。

通过对比，可以发现二参数模型和三参数模型两者之间有着非常紧密的联系。如果用P2来表示二参数模型，用P3来表示三参数模型，则有P3=C（1-P2）+P2，该公式表明被测者回答项目正确的概率由两部分构成。一部分是由于考生理解该项目，知道该项目正确应答的P部分，它是由考生能力决定的；另一部分是考生对该项目并不理解，只是由于猜测、推断等原因，偶然地给出正确应答的C(1-P2)部分，它是由于偶然因素（如运气）所造成的。在计算机标准化考试试题中，一般是四选一的单项选择题目。这就必需要考虑到存在考生偶然猜测成分因素。因此一般情况下均以三参数模型为基础来构造计算机自适应考试系统。

工程硕士学位论文 2 自适应考试系统理论及基础

图2-3 二参数和三参数模型的比较

从图2-3可以看出：当测试项目可以通过猜测等因素而作出正答的可能时，选用三参数模型比二参数模型更适宜。 3、项目信息函数和测试信息函数的意义

对于一个给定的项目（项目参数一定），它对不同被试的能力水平的分辨能力如何呢？或者说，被试者对一个项目作答后能带给我们关于被试者能力水平的信息有多少呢？被试者作答一个项目的得分反映其能力水平的精度有多高呢？为了回这一问题，项目反应理论引入了一个项目信息函数。项目信息函数(item information function，简称IIF)在测验的发展与编制上，以及试题好坏的诊断上，扮演着举足轻重的角色，因为它能反映出试题对能力估计正确性的贡献量的大小。[16，17]

项目信息函数的定义：

?Pj(?)]2??Ij(?)? （2-4） Pj(?)[1?Pj(?)][根据上述定义，我们可以计算出：

二参数项目反应模型的项目信息函数为：Ij(?)?1.72a21?Pj(?)]. jPj(?)[三参数模型的项目信息函数为：

为了帮助学生理解项目信息函数的意义，我们仍采用数值方法来讨论项目信息函数。

（1）、就某一个测试项目而言，当项目参数一定时，I(?)只是?的函数，因此它可用来描述测试项目对不同能力水平的被试者进行测试的有效

1.72a2j(1?cj)Ij(?)? （2-5） [c?exp(1.7a(??b))][1?exp(?1.7a(??b))]2jjjjj工程硕士学位论文 2 自适应考试系统理论及基础性。在经典测验中将测验的效度用于所有被试者，而不考虑其能力水平。

（2）、当?一定时，某一测试项目所能提供的信息量只取决于项目参数。

图2-4 区分度对信息函数的影响

图2-4(??1,b=0.921,c=0.2)表明：项目区分度参数越大，项目信息函数值也越大。

图2－5 (??1,b=0.921,a=2.0)表明：猜测参数越大，项目信息函数越小。

图2-5 项目猜测参数对信息函数的影响

从图2－6（a=2.0,b=0.921,c=0.2）可以看出：同一个项目在测验高、中、低水平的被试者时，它所提供的信息量是不一样的。当被试能力参数接近项目难度参数时，信息函数取得极大值。可实质上是，只有当被试能力水平略大于项目难度时，提供的信息量最大，且测验结果的效度和信度以及被试接受测验的积极性均可大提高。这就是我们在自适应测试中选择试题提供理论的依据所在。

工程硕士学位论文 2 自适应考试系统理论及基础

图2-6 同一项目中信息函数与被试能力水平的关系

由上述分析，不难计算出信息函数为最大时的能力参数为：

1?max?bj?ln[0.5?0.51?8cj] （2-6）

1.7aj通过以上分析，我们可以得出一个结论，即项目信息函数是反映试题优劣的一个综合指标。

若我们假设被试参加各个项目的测试是相互独立的（不同测试项目之间没有相互影响），则当测试中包含n个项目，且每个项目j的项目信息函数为Ij(?),各测试项目总的信息函数为测试信息函数：

nI(?)??Ij(?) （2-7）

j?1测试信息函数表示了对于各种上千个不同被试，测试整体的测量精度。信息函数的可加性表明：组成测验的各个项目的质量越高（项目信息函数越大），它所提供的信息量也越大，从而根据整个测验所获得的数据资料而估算出来的被水平也越精确、越可靠。由此可见，测验信息函数是反映测验有效性的一个客观而精确的指标。 4、参数估计

每一个项目的选取都不是随意的，它是根据被测者先前的答题情况采用某种选择策略而进行的。具体步骤是首先根据对考生的能力进行估计，再挑选当能力值为θ时，具有最大信息值的项目max I（θ）。现代测验中估计能力参数θ的方法中，最为普遍使用的方法是最大似然估计法[18]。

若以＝1；答错，其中： n：题目数

表示能力为θ的受测者对题目j的反应为＝0)的概率。则

(若答对，

（2-8）

共8页:

基于IRT理论的计算机自适应考试系统的设计与实现8(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档