心理统计与测量(4)

2020-06-05 08:56

所谓“一定的法则”，指的是在测量时所采用的规则或方法。例如，用秤测物体的重量，依据的是杠杆原理，使用好的法则，可以得到准确的测量效果，使用坏的法则，则会得到不准确的测量效果。许多事物易于测量，因其使用的法则易于确立和遵守，心理现象难以测量，是因为我们很难设计清晰而良好的法则。随着人类认识的发展，测量法则不断完善，测量也就越来越真确。所谓“事物”，指的是我们所感兴趣的东西，说得更明确些，是引起我们兴趣的事物的属性或特征。测量就是确定这些属性或特征的差异。人与人的差别不只表现在有高有矮，有强有弱，有人跑得快、有人跳得高等身体外貌和体力特点上，也表现在较为抽象的心理能力和人格特点方面。例如有人活泼好动，有人沉静安详，有人勇敢豪放，有人谦逊细心，有人过目不忘，有人思维敏捷，有人精于数理工程，有人擅长文学艺术等等。所有这些特性都是心理测量的对象。

所谓“数字”，是个比数值意义更广泛的概念，可以表示数量，也可以不表示数量。一般说来，用数字对事物加以确定，就是确定出一个事物或事物的某一属性的量。但有时也可把数字当作一种事物的符号，而不反映事物的量，如“1班、2班、3班??”等。通常人们说的测量，指的是前一种情况，即根据特定的法则，采用一定的操作程序，给事物确定出一种数量化的价值。（二）测量的要素 1．参照点

要确定事物的量，必须有一个计算的起点，这个起点叫参照点。参照点不同，测量的结果便无法相互比较。

参照点有两种：一种是绝对的零点，如测量轻重、长短，都以零点为参照点，即以“恰恰没有一点重量”、“恰恰没有一点长度”为计算的起点。另一种人定的参照点，如以海平面为测量陆地高度的起点，以冰点为测量温度的起点，这些都是人定的参照点。

理想的参照点是绝对零点。心理测量中所用的参照点都是人定的，此种参照点有一个极大的限制，就是从该点起计算的数值不能以“倍数”的方式解释。如甲的智商为100，乙的智商为50，不能说甲的智力是乙的二倍，因为没有零智力。

好的单位须符合两个条件，一为有确定意义，即同一单位在大家看来意义相同，不允许有不同的解释。二为有相等的价值，即第一单位与第二单位间的距离等于第二单位与第三单位间的距离。

(三)测量的量表

要测量某个事物，必须先有一个定有单位和参照点的连续体，将要测的每个事物放在这个连续体的适当位置上，看他们距参照点的远近，便会得到一个测量值．这种连续体就叫量表。 1．命名量表

这是测量水平最低的一种，只是用数字来代表事物或把事物归类。因为这里的数字没有数量化的关系，所以也有人认为它不能算是测量。这种量表又可分为两种， (1)代号——用数字来代表个别事物，如学生和运动员的编号等。 (2)类别——用数字来代表具有某一属性的事物的全体，即把某些事物确定到不同性质的类别里，如用1代表男，用2代表女，或用不同数字代表不同职业等。

在命名量表中，数字只用来作标记和分类，而不能作数量化分析，既不能说A>B>C，也不能做加，减，乘，除的运算。它所适用的统计有次数、众数、百分比、偶发事物相关(如四分相关，相关)以及x2考验等。 2．二次序量表

它比命名量表水平高，不但指明类别的大小或含有某种属性的多少，如学生的考试名次、工资级别、能力等级、对某事物时喜爱程度等等。这里的数字包含有数量关系，代表符号是“>”，

如A>B>C等，主要用于分等（当然也包含了分类）。

在次序量表中，既无相等单位，又无绝对零点，数字仅表示等级。并不表示某种属性的真正量或绝对值。它所适用的统计有中位数，百分位数、斯皮尔蔓等级相关系数和肯德尔和谐系数等，但不能做加、减、乘、除运算。

3．等距量表

它比次序量表又进一步，不但有大小关系，而且一定数量的差异在整个量表的所有部分都是相等的，也就是具有相等的单位，其数值可相互做加、减运算，但没有绝对的零点，因此不能做乘除运算。典型例子是温度计，10℃与15℃的差别，同15℃与20℃的差别是一样的，我们可以说某物温度比另一物高多少，但不能说某物温度是另一物的多少倍，因为它的零点是人定的，0℃并不意味着没有温度。

等距量表的数值加或减一个常数或用一个常数乘或除，不会破坏原来数据之间的关系，因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值，而且几个不同单位的测值可以转换到一个通用量表上以便于比较。如摄氏10度可以转换华氏50度。用此种量表获得的数值可计算平均数、标准差、积差相关、阶层相关，并作T和F检验。 4．比率量表

是最高水平的量表，既有相等单位又有绝对零点。此种量表在物理测量中容易见到，长度、重量、时间等都是。所得的数值可做加，减，乘、除运算。如体重：甲80公斤，乙40公斤，我们既可以说甲的体重比乙多40公斤，也可以说甲的体重是乙的2倍。比率量表所适用的统计除上述几种外，还可以计算几何均数及变异系数等。（四）什么是心理测量所谓心理测量，就是根据一定的法则用数字对人的行为加以确定。即依据一定的心理学理论，使用一定的操作程序，给人的行为确定出一种数量化的价值。 1、测验的定义

“测验”一词虽为大家所熟悉，但要给测验下一个严格的定义却并不容易。目前，关于测验有许多定义，笔者较为赞成美国心理与教育测量学家布朗(F?G?Brown)的说法：测验是 “测量一个行为样本的系统程序”。通俗地说，心理测验就是通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析一种科学手段。

首先，测验测量的是人的行为，严格地讲，只是测量了做测验的行为，也就是一个人对测验题目所进行的反应。在这个意义上可以说，测验即引起某种行为的工具。

其次，一个测验不可能包含所要测量的行为领域的所有可能的题目，它所包含的只是全部可能题目的一个样本。当然，也有例外的情况；例如对幼儿施测一个10以内数字的加法测验，就可以包括两个一位数字加法的全部各种组合。但这种情况是极少的，由于测验只是测量一个行为样本，因此测验题目的取样必须有代表性，而且在用同一领域的另一个等值的样本时，应该得到同样的分数。

第三，在编制、施测、评分和解释方面依据一套系统的程序。这种按照严格的科学程序去编制和使用的测验称之为标准化测验。标准化有三点好处，一是可以减少无关因素测验目的的影响，使测量准确、客观。二是有统一标准，便于对不同人的测验成绩进行比较和交流。三是同一份测验可用于许多人并可反复使用，较为经济。 2、心理测量的性质

（1）心理测量的间接性

所谓特质是描述一组内部相关或内在联系的行为时所使用的术语，是在遗传与环境影响下，个人对刺激作反应的一种内在倾向。例如，一个人喜欢阅读机械杂志，喜欢观看各种机

器运转，热心为别人修理钟表、自行车，由此我们便可推论此人具有机械兴趣的特质。可见，特质乃是个体特有的(与他人不同)、稳定的(表现于多种情况)、可辨别的(可与其他特征分开)特征。但它又是一个抽象的产物，一个构想，而不是一个被直接测量到的有实体的个人特点。由于特质是从行为模式中推论出来的，所以心理测量永远是间接的。（2）心理测量的相对性

在对人的行为做比较时，没有绝对的标准，亦即没有绝对零点，我们有的只是一个连续的行为序列；所谓测量就是看每个人处在这个序列的什么位置上，由此测得一个人智力的高低兴趣的大小等，都是与所在团体的大多数人的行为或某种人为确定的标准相比较而言的。（3）心理测量的客观性

客观性是对一切测量的基本要求。在心理测量中要控制的变量比物理测量多得多，要做到客观颇不容易。

测验的客观性实际上就是测验的标准化问题；量具必须标准化，这是对一切测量的共同要求。经过长期的努力探索，测验的标准化即客观性已经有了很大改进。

首先，测验用的题目或作业、施测说明、施测者的言语态度及施测时的物理环境等，均经过标准化，测验的刺激是客观的。特别是对测验项目的选择不是随意的，而是在预测基础上，通过统计分析(难度、区分度等)确定的。

其次，评分计分的原则和手续经过了标准化，对反应的量化是客观的。评分方面的客观性测验种类和题目类型而异。一般说来，投射测验的客观性差些，而选择题的客观性较好，因此后者有时又叫客观测验。

最后，分数的转换和解释经过了标准化，对结果的推论是客观的。测验常模是通过对总体的代表性样本的预测确定的，测验的信度和效度也在一定程度上经过实践的检验，依据这些资料所做出的推论，自然较为可靠和客观。二、心理测量的特征分类 (一)按测验的功能分类 1．能力测验

从心理测验的观点看，可将其分为实际能力与潜在能力。实际能力是指个人当前“所能为者”，即代表个人已有的知识、经验与技能，是正式与非正式学习或训练的结果。潜在能力指个人将来，严可能为者”，是在给予一定的学习机会时，某种行为可能达到的水平。有人只把测量实际能力的测验称作能力测验，而把测量潜在能力的测验称作能力倾向测验。实际上二者很难分清。能力测验又可进一步分为普通能力测验与特殊能力测验。前者即通常说的智力测验，后者多用于测量个人在音乐、美术、体育、机械、飞行等方面的特殊才能。 2．学绩测验

主要用于测量个人（或团体）经过某种正式教育或训练之后对知识和技能掌握的程度。因为所测得的主要是学习成绩，所以称作学绩测验。最常见的是学校中的学科测验。 3．人格测验

人格测验主要用于测量性可知、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征，亦即个性中除能力以外的部分。 (二)按测验的对象分类 1．个别测验

个别测验每次仅以一位受测者为对象，通常是由一位主测者与一位受测者在面对面的情形下举行。此类测验的优点在于主测者对受测者的行为反应有较多的观察与控制机会尤其对某些人(如幼儿及文盲)不能使用文字而只能由主试者记录其反应时，就非采用面对面的个别测验不可。个别测验的主要缺点是时间不经济，不能在短时间内经由测验收集到大量的资料，而且个别测验手续复杂，主持者需要较高的训练与素养，一般人不易掌握。

2．团体测验

团体测验是在同一时间内由一位主测者（必要时可配几名助手）短时间内收集到大量资料，因此在教育上被广泛采用。团体测验的缺点是是受测者的行为不易控制，容易产生测量误差。

(三)按测验材料分类 1．文字测验

文字测验所用的是文字材料，受测者用文字作答，所以也称其缺点是容易受被测者文化的影响，因而对不同教育背景下的人使用时，其有效性将降低，甚至无法使用。 2．非文字测验

非文字测验也称操作测验。测验题目属于对图形、实物、工具、摸型的辨认和操作，无需使用文字作答，所以不受文化因素的限制，可用于学前儿童和不识字的成人。此种测验的缺点是大多不宜团体实施，在时间上不经济。（四）按测验的目的分类 1．描述性测验

测验的目的在于对个人或团体的能力、性格、兴趣、知识水平等进行描述。 2．诊断性测验

目的在于对个人或团体的某种行为问题进行诊断。 3．预示性测验

目的在于从测验分数预示一个人将来的表现和所能达到的水平。（五）按测验的难度和时限分类 1．速度测验

题目数量多，并严格限制时间，主要测量反应速度。此种测验题目较为容易，一般都没有超出被试的能力水平，但因时限较短，几乎每个被试都不能做完所有题目。在纯粹的速度测验中，分数完全依赖于工作的速度。 2．难度测验

包含各种不同难度的题目，由易到难排列，其中有一些极难的题目，几乎所有被试都解答不了。但作答时间较为充裕，使每个受测者都有机会做所有的题目，并在规定时间内做完会做的题目，因此测量的是解答难题的最高能力。 (六)按测验的要求分类 1．最高行为测验

此种测验要求受测者尽可能做出最好的回答，主要与认知过程有关，有正确答案。能力测验、学绩测验均属最高行为测验。 2．典型行为测验

此种测验要求受测者按通常的习惯方式做出反应，没有正确答案。一般说来，人格测验测量的均属典型行为。七)按测验的性质分类 1．构造性测

在此种测验中，所呈现的刺激和受测者的任务是明确的。 2．投射性测验

在此种测验中，刺激没有明确意义，问题模糊，对被试的反应也没有明确规定。 (八)按测验的应用分类 1．教育测验

教育部门是测验应用最广的领域，许多能力和人格测都可在学校中应用，但用得最多的的是学绩测验，平时说的教育测验，主要指后者。

2．职业测验

主要用于人员选拔和安置，可以是能力和学绩测验，也可以用人格测验． 3．临床测验

主要用于医务部门。许多能力和人格测验可用来检查智力障碍或精神疾病，为临床诊断和心理咨询工作服务。

以上几种分类都是相对的，同一个测验采用不同的标准，可能归为不同的类别。三、经典测验理论和真分数理论

所谓真分数就是一个测量工具在测量没有误差时，所得到的纯正值。真分数的操作定义是，经过无数次测量所得的平均值。

真分数的定义表明，一个人在一个测验上所得的分数，既是他的真分数的函数，也是测量误差的函数，用公式表示如下：X=T+E （4.1)

这里X为实得分数或观测分数，T是假设的真分数，E是测量误差。

这里的测量误差（E）指的是引起测量不一致性的变因产生的效应，即指随机误差，不包括系统误差，后者不引起分数的改变，因而包含在真值中。

在公式4.1中，E可能是正的，也可能是负的。这就是说，一个人的实得分数可能大于真实量，也可能小于真实量，总是围绕着真值上下波动。第二节测量的信度和效度一、测量的信度（一）信度的定义

信度又叫可靠性，指的是测量的一致性程度。一个好的测量工具必须稳定可靠，即多次测量的结果要保持一致，否则便不可信。信度只受随机误差影响。随机误差越大，信度越低。因此，信度亦可视为测量结果受机遇影响的程度。系统误差产生恒定效应，不影响信度。在测量理论中，信度被定义为：一组测量分数的真变异数与总变异数(实得变异数)的比。该定义有两点要注意: 1)信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性。2)真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数作出估计率（二）信度系数的估计 1、再测信度

用同一个测验，对同一组被试前后两次施测，两次测验分数所得的相关系数为再测信度。又称稳定性系数。（1）计算公式：（2）应满足的条件：①所测量特质稳定②遗忘与练习的效果相同③两次施测期间被试的学习效果没有差别。

（3）注意的问题：①两次测验的时间间隔要适当；②适用于速度测验或人格测验，不适用于难度测验③注意提高被试的积极性。 2、复本信度

根据一组被试在两个平行（等值）测验上的得分计算的相关系数，又称为等值性系数。注意：①两次测验必须在项目的内容、形式、数量、难易、时限、指导语方面相同或相似 ②两次测验的时间间隔要适当

局限：①只能减少而不能排除练习和记忆的影响 ②建立复本有些困难 3、分半信度

分半法是按正常的程序实施测验，然后将全部项目分成相等的两半，根据各人在这两半测验的分数计算其相关系数。

共5页:

心理统计与测量(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档