常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。因为标准化测验通常提供许多原始分数与各种常模团体的比较转换表,被试的分数必须与合适的常模比较。
(二)取样的方法
取样即从目标人群中选择有代表性的样本。从统计学角度看,取样的方法有随机抽样和非随机抽样两种。前者是根据随机原则进行,而后者则没有随机性。所谓随机原则,就是从总体中取样时,所取个案不是人为地主观决定的,每个个案被抽取的机会均等。 具体地说,有下列几种抽样方法: 1、简单随机抽样
按照随机表顺序选择被试构成样本,或者将抽样范围内的每个人或者每个抽样单位编号,再随机选择,可以避免由于标记、姓名、性别或其它社会赞许性偏见而造成抽样误差。在简单随机抽样中,每个人或抽样单位都有相同的机会作为常模中的一部分。 2、系统抽样
有时在总体数目为N的情况下,若要选择K分之一的被试作为样本,则可以在抽样范围内选择每个第K个人来构成样本。 3、分组抽样
有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样。 4、分层抽样
在确定常模时,最常用的是分层抽样方法。它是先将目标总体按某种变量(如年龄)分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本。分层抽样还可以分为两种方法:分层比例抽样和分层非比例抽样。
(三)常模分数表示法 1、转换表表示法
最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数--百分位、标准分数、T分数或者其它任何分数。因此测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。 2、剖面图表示法
剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。
四、注意事项
(一)在制定常模时,必须清楚地说明所要测量的群体的性质与特征。 (二)样本的大小要适当,样本大小适当的关键是样本要有代表性。 (三)系统抽样要求目标总体无序可排,也无等级结构存在。 (四)常模有一般常模与特殊常模之分。
第 3 节:测量的信度、效度与项目分析
第 1 单元:信度分析
一、学习目标
掌握信度的类型及估计方法 掌握信度与测验分数的解释 二、操作步骤
(一)信度的估计方法 1、重测信度 2、复本信度
3、内部一致性信度 4、评分者信度
(二)信度与测验分数的解释
1、解释真实分数与实得分数的相关 2、确定信度可以接受的水平 3、解释个人分数的意义 4、比较不同测验分数的差异
三、相关知识
(一)信度的估计方法
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
1、重测信度
又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。
2、复本信度
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故又称等值性系数。
3、内部一致性信度
(1)分半信度(split-half reliability)
这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度,因而也称为内部一致性信度系数。
(2)同质性信度(homogeneity reliability)
同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。
4、评分者信度
随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 (二)信度与测验分数的解释
1、解释真实分数与实得分数的相关 2、确定信度可以接受的水平 3、解释个人分数的意义 4、比较不同测验分数的差异
四、注意事项
(一)在计算重测信度时,最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
(二)在计算复本信度时,应该有半数的被试先作A本再作B本,另一半被试先作B本再作A本,由此可以抵消施测顺序的效应。另外,两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。
(三)斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用弗朗那根(Flanagan)公式和卢伦(Kulon)公式之一,直接求得测验得信度系数。
(四)对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。
(五)信度常用信度系数来表示,信度系数就是相关系数,相关系数受样本是否异质及测验长度的影响。 第 2 单元:效度分析
一、学习目标
掌握效度的种类及其评估方法。 了解效度的意义。 二、操作步骤
(一)效度的估计方法 1、内容效度 2、构想效度 3、效标效度
(二)效度意义的确定 1、预测误差 2、预测效标分数 3、预测效率指数
三、相关知识
在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地
说是指一个心理测验的准确性。无论选用标准化测验或自行设计编制测量工具,必须首先签定其效度,没有效度资料的测验是不能选用的。
(一)效度的估计方法 1、内容效度
内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。由于这种测验的效度主要与测验内容有关,所以称内容效度。 (1)专家判断法 (2)统计分析法 (3)经验推测法
2、构想效度
是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
3、效标效度
效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。由于这种效度是看测验对效标预测得如何,所以叫效标效度。这种效度需在实践中检验,所以又称实证效度。 效标效度有多种评估方法,下面介绍3种常用的方法: (1)相关法 (2)区分法 (3)命中率法 (二)效度意义的确定 1、预测误差 2、预测效标分数 3、预测效率指数
(三)信度和效度的关系
1、信度是效度的必要而非充分条件 2、效度是受信度制约的
四、注意事项
(一)要求内容效度的测验,并不一定要求测验为同质的。
(二)在编制与选择测验时,与内容效度相联系的表面效度是一个必须考虑的特性。
(三)欲建立构想效度,必须先从某一构想的理论出发,提出关于某一心理特质的假设,然后设计和编制测验并进行施测,最后对测验的结果采用相关或因素分析等方法进行分析,验证与理论假设的符合程度。
(四)在检验一个测验的效标效度时,难点在于找到合适的效标。因此效标的选择至关重要,一个好的效标必须具备以下条件:
1、效标必须能最有效地反映测验的目标,即效标测量本身必须有效; 2、效标必须具有较高的信度,稳定可靠,不随时间等因素而变化; 3、效标可以客观地加以测量,可用数据或等级来表示; 4、效标测量的方法简单,省时省力,经济实用。
(五)测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。要保证测验具有较高效度,要注意以下几点: 1、测验材料必须对整个内容具有代表性;
2、测题设计时应尽量避免容易引起误差的题型(如是非题); 3、测题难度要适中,具有较高的区分度; 4、测验长度要恰当,即要有一定的测题量; 5、测题的排列按先易后难顺序。
(六)效标与测验分数之间的关系是否线性关系也是需要注意的一个因素。 第 3 单元:项目分析
一、学习目标
掌握难度的计算及难度水平的确定 掌握项目区分度及其估计方法 二、操作步骤 (一)项目的难度 1、难度的计算 2、难度水平的确定 3、测验的难度
(二)项目的区分度 1、鉴别指数 2、相关法 三、相关知识
(一)项目的难度
难度(difficulty),顾名思义,是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数,其计算方法与难度相同。 1、难度的计算
(1)二分法记分的项目 (2)非二分记分的项目 2、难度水平的确定
进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。 3、测验的难度
测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。
(二)项目的区分度
项目区分度(item discrimination),也叫鉴别力,是指测验项目对被试的心理特性的区分能力。如果一个项目,实际水平高的被试能顺利通过,而实际水平低的被试不能通过,那么我们就可以认为该项目有较高的区分度。