心理测量(3)

2019-04-15 23:23

题的被试在总分上的平均分 p = 该题的难度（通过该题人数百分比）q = 1-p（未通过该题人数百分比） St = 全体被试的总分标准差

例2: 15个学生某测题的得分与总分情况,计算该测题的区分度. 表2-6 15名学生总测验分数与某一题分数学生总分某题解

1 1 2 0 3 1 4 1 5 1 6 1 7 1 8 0 9 0 10 11 12 13 14 15 0 1 0 1 0 0 90 81 80 78 77 70 69 65 55 50 49 42 35 31 10

（3）．φ 相关

(4)．四分相关

(5). 项目和总分相关重叠的校正

当测验项目超过20个项目时，校正法通常毫无意义。

注：项目反映理论

项目测验回归曲线—— 一般，被试总分高，在试题项目正确作答的概率也高。如此，沿着被试总分的由低到高，对试题项目正确作答的概率形成一条不降曲线，这就是试题项目正确作答率对总测验分数的回归曲线

项目特征曲线：人们用能稳定反映被试水平的潜在特质量表分数代替被试试卷总分数作为回归曲线的自变量，并把求得的被试在试题上正确作答概率对潜在特质分数的回归曲线称为项目特征曲线。

项目特征曲线描述了潜在特质分数（效标分数）不同的被试在该项目上的通过率。曲线坡度越陡，鉴别力越好，预测的误差越小。

（三）项目的区分度的相对性

?采用不同的计算方法区分度的值不同。 ?用相关法计算的区分度值受样本大小影响

?用两个极端组通过率的差异作为区分度的指标，其值受分组标准的影响。 ?区分度值的大小与样本的同质性有关

三、难度和区分度的关系

1. 难度和区分度都是相对的，是针对一定团体而言的，绝对的难度和区分度是不存在

的。

? 较难的项目对高水平的被试区分度高， ? 较易的项目对水平低的被试区分度高， ? 中等难度(P=0.5) 的项目对中等水平的被试区分度高(D=1)。

2. 若P=1.00或 0.00 ，则D=0 3. 若P=0.50 。则D=1 四、测验项目分析实例 (一)项目分析步骤

1.选取有代表性的样组（ N人）实施测验.2.计算每个人的总分,然后按总分分组.

3.计算高分组和低分组通过每一题的比率，分别以PH和PL表示。4.分别求出每一测题的难度（P）和鉴别指数（rb 、 D）.5.选项分析.6.修改测题或选项 (二)项目实例分析

1. 难度 P 值在0.35~0.65 （0.2~0.8）之间为好 2. 区分度 D值在0.3（0.2）以上.

3. 选项分析

选项设置不当会降低题目的难度,所以也要对选项作分析,看有无异常情况. 通常判断选项好坏有以下几点:

1) 正确答案无人选或少于其它选项的人数.2) 错误答案选的人太多.

3) 正确选项高分组选择人数少于低分组.4) 错误选项上高分组选择人数多于低分组.5) 选项无人选择. 6) 未答人数较多

4. 找出原因，对各题进行修改五、标准参照测验的项目分析（一）概念

1. 标准参照测验:参照某种特定的标准解释个人测验分数的一种测验;是用来测量学习

前后被试的差异或受过训练与没有受过训练被试之间的差别.;测验结果只与既定标准比较而不在被试之间比较.

2. 常模参照测验——用常模作为解释个人测验分数的参照标准的一种测验。（二）标准参照测验的项目分析所采用的方法

1.以达标与否分组,然后计算两组被试在每一题上的成绩差异,算出难度和区分度.

公式(难度) : (区分度): D=Ps – Pn (（Ps、Pn为达标组与未达

标组在某一项目上的通过率）

2.教育效果敏感指数公式:

第三章测量的误差及其检验

第一节测量的误差

一、误差的种类——就是在测量中与测量目的无关的因素所产生的不准确的或不一致的结

果。

误差的类型：随机误差（这是由与测量目的无关的偶然因素引起而又不易控制的误差）;系

Ppost 前测的通过率 Ppre后测的通过率

统误差 [这是由与测量目的无关的变因引起的一种恒定而有规律的（效应）误差。] 二、误差的来源（一）测验工具（二）施测过程（三）被试引起的误差。三、真分数理论（True Score）（一）真分数的定义 1、（理论）所谓真分数就是一个测量工具在测量没有误差时，所得到的真值（纯正值）。 2、（操作定义）真分数是，经过无数次测量所得的平均值。 ?数学公式：

（二）真分数理论的基本定理

定理一：实得分数是真分数与误差分数之和。

（3.0）

定理二：真分数与实得分数的平均数相等。

定理三：误差分数的期望值为0。

定理四：真分数和测量误差的相关为零。 PTE=0 定理五：不同测量误差之间的相关为零。 PE1E2=0 定理六：测量分数的方差等于真分数方差和误差之和。

S2x=S2T+S2E ( 3.1 )公式3.1只涉及到随机误差的变异，系统误差的变异包含在真分数的变异中。

S2T=S2V+S2I (3.2)

S2V是与测量目的有关的(亦即有效的)变异数，由所要测量的变因引起的 S2I是与测量目的无关但却是稳定的变异数，由其它变因引起的。

将公式(3.2)代入公式(3.1)得到如下公式：S2x= S2V+S2I+S2E （3.3）一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和随机误差变异数所决定的。第二节测验信度

（一）信度的基本定义——信度指测量的一致性或可靠性程度，是测量结果的稳定性程度。

信度的操作化（等价）定义

定义一：一组测验分数的真实变异与总变异数(实得变异数)的比率。即： rxx=S2T/S2X （3.4）式中rxx代表测量的信度，S2T代表真分数的变异数，S2X代表实得分数的变异数。

该定义有两点要注意：信度指的是一组测验分数或一系列测量的特性，而不是个人分数的特性；真分数的变异数是不能直接测量的，因而信度是一个理论上构想的概念，只能根据一组实得分数作出估计。定义二：信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即： rxx=P2TX 定义三：信度乃是一个测验X(A卷)与它的任意一个―平行测验‖X′(B卷)的相关系数。其中，定义一和定义二只具有理论意义，定义三则具有实际意义。

真变异数还可以分成两个部分，与测量目的有关的变异和与测量目的无关的变异，即

（二）信度的意义

1、信度系数直接告诉我们测量的误差有多大。

它可以解释为样本测验分数的总方差中有多少比例是真分数方差，也就是测验的总变异中真分数造成的变异占百分之几。

2、信度系数可以解释个人测验分数的意义

3、测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内，并且可以预测 XT=X± 1.96SE

(三)信度系数：大部分的信度指标都以相关系数表示，即用同一被试样本所得的两组资料的相关作为测量

一致性的指标，称作信度系数。最理想的情况是rxx=1.00m，但这是办不到的。一般能力与学绩测验的信度系数在0.90以上；

性格、兴趣、价值观等人格测验的信度系数，通常在0.80到0.85或更高些。当rxx＜ 0.70时，测验既不能用于对个人作出评价或预测，也不能做团体间比较。当0.70≤rxx＜0.85时，可用于团体比较。

当rxx ≥0.85时，才可以用来鉴别或预测个人成绩或作用对信度系数也要注意三点 1)一个测验有多个信度系数——在不同情况下，对不同样本，采用不同方法会得到不同的信度系数，因此一个测验可能不止一个信度系数。

2)信度系数只是对测量分数不一致性程度的估计，并没有指出不一致的原因。 3)信度系数是使测验有效的一个必要条件。

二、信度评估的方法

（一）重测信度

1、重测信度指的是用同一量表对同一组被试施测两次所得结果的一致性程度（求两次得分间的相关系数）。（有时也叫稳定性，主要针对时间变量）形式：施测—适当时间—再施测 2、重测信度采集数据得方法是：对同一组被试间隔一定的时间重复测试一次。 3、重测信度的计算方法是积差相关法（r）

4、使用的前提条件：A 所测量的心理特性必须是稳定的。B遗忘与练习的效果相同：对儿童的智力测验

一般是两周到四周为宜；对成年人，间隔可到半年，很少超过6个月。 C两次实测期间被试的学习效果没有差异 5、优缺点

a) b)

优点：能提供测验结果是否随时间而变化的资料，可作为预测将来行为的依据。缺点：容易受练习和记忆的影响。

（二）复本信度

1、含义：以两个等值但题目不同的测验(复本)来测量同一群体，然后求得被试者在两个测验上得分的相关系数（复本信度反映的是测验在内容上的等值性，故又称等值性系数。形式：复本A—最短时间—复本B 2、数据采集方法是：给被试施测两个内容等值但题目不同的测验，求两组数值的相关（rxx） 3、使用条件

各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。

各份测验的题目不应重复。各份测验题目数量相等，难度和区分度大体相同。各份测验的分数分布（平均数和标准差）大致相等。复本编好后，应再测一次，以确保各份测验的等值。 4、优缺点

（1）复本信度优于重测信度的地方是：避免了重测带来的记忆效应和练习效应；可用于长期追踪研究前后测量；减少了作弊的可能性。

（2）复本信度的缺点：有些测验的复本很难找到；有些测验因正迁移效应使测验性质改变；如测量的内容很容易受练习的影响，复本信度也无法清除这种练习效应

(三)分半信度

1、含义：是将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。

2、数据采集方法是：将一个测验分成对等的两半给被试实测，求两半数值的相关。这个相关系数就代表了两半测验内容取样的一致程度（1）Sa2=Sb2，斯皮尔曼-布朗公式 rxx?2?rhh1?rhhrxxrhh为一半分数的相关系数测验在原长度时的信度估计值—

（2）Sa2≠Sb2 ①弗郎那根公式： r=2[1-( Sa2+Sb2)/ Sx2] Sa2、Sb2为两半测验的变异系数；Sx2为总分变异系数。 ② 卢伦公式： rxx = 1－Sd2／Sx2

Sd2是两半测验分数之差的方差；Sx2为总方差。

(四)同质性信度

1、同质性信度是指测验的所有题目间性质的一致性。（测的是同一种心理特质或行为；题目间呈高正相关。

2、计算方法及使用范围（1）基本公式

项目间相关系数的平均数 K 构成测验的项目数（2）库德和里查德森提出的K-R20公式

使用条件： K-R20公式只适合预测题目是二分法计分 (3)克伦巴赫α系数

使用条件：适合于非二分法计分的测验的内部一致性信度估计法 α系数的公式

例如：某态度量表共7题，100个被试在各题上得分的方差是0.81，0.82，0.79，0.83，0.85，

0.76，0.77，测验总分的方差是14.00，求此测验的信度？解：∑S2i=0.81+0.82+0.79+0.83+0.85+0.76+0.77=5.63 S2x =14.00 ? ? ??1?k?1??K?SSx22i????

=0.70

（五）评分者信度

1、评分者信度是指不同评分者之间在测验结果计分上的一致性。一般要求评分者之间平均一致性达0.90以上，才认为评分是客观的。 2、应用范围：作文、创造力、投射、道德判断等测验

3、计算方法

（1）如果是两个评分者，则可以用积差相关来计算，或用斯皮尔曼等级相关法计算。（2）评分者在三人以上，而且是等级评分，则可以用―肯德尔‖（W）来求评分者信度。

解：分别求出各篇论文的等级之和Ri，依次为8，12，3，14， 17，6。则有 ∑Ri =8+12+3+14+17+6=60

∑R2i=64+144+9+196+289+36=738

共7页:

心理测量(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档