安徽自考《人员素质测评理论与方法》学习笔记(4)

2019-04-15 13:37

生误差的原因之一。③测验难度。测验的难度取决于每个测验项目的难度，而测验项目的难度是通过该项目的百分率来决定的。一个测验难度的理想分布是呈现钟形曲线的常态分布，即处于中等难度的项目的百分比最高，依次向两端递减，显然在这种情况下，测验的误差也是相应地处于较小的状态。如果测验的项目过分容易，绝大多数人都能成功地通过所有项目，测验成绩会向满分端集中，出现“天花板效应”，大部分人得分普遍偏高。反之，如果测验的项目难度太大，绝大多数人无法通过大多数项目，测验成绩会向零分端集中，出现“地板效应”。由此可见，测验难度的选择要依据测验的目的，不可盲目乱选，否则不仅造成严重的误差，而且会使测验失去价值，浪费资源。④测验长度。测验的长度，即测验包含题目的数量是影响测验准确性的一个重要因素。从理论上讲，在一个测验中增加同质的题目，可以提高这个测验的信度，从而也提高了这个测验的稳定性系数。在这里要注意，增加测验的题目来提高信度，减少误差有两个前提条件：一是增加的题目与原有的测验题目是同质的；二是新增的测验题目与原有的测验题目具有相同的难度水平。 2、源于测评实施过程的误差。心理测量需要达到的目的是获得对应试者的反应尽可能准确的测定。要达到这种境界，依赖于对误差的控制，即必须减少无关因素对测验目的的影响。这主要通过使所有应试者在测量的过程中受到同等对待，除了所有应试者都使用相同的一组测验以外，还要保证在相同的条件下进行测验，他们的结果才能进行比较。由此可见，如果在测评实施过程中未能做好相应的准备，实施中未能采用标准化的指导语，未能控制好测验时限，未能进行标准化的评分计分，未能对测验环境进行控制，必然会造成源于施测过程的误差。①实施前的准备。在心理测量中，施测前的准备至关重要。在施测前测验实施者要熟读测验指导手册，熟悉整个测验程序、测验材料、测验器具、测验场地等，充分的准备可以减少施测过程的误差。②标准化的指导语。指导语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指导语属于测验刺激的一部分，通常指导语有两种：一种是对受测者的；另一种是给测验实施者的。为了保证测验情境的一致性，对测验实施者的指导语，主要是对测验细节作进一步解释。一般来说，对受测者的指导语包括：如何选择反应形式、如何记录这些反应、时间限制、如何确定正确反应，该如何去做以及计分的方法、例题、某些情况下告知受测者测验目的。③测验时限。测验时限通常以大约90%的应试者能在规定时间内完成测验为标准。定测验的标准时限一般采用尝试法。④评分计分。评分和计分不客观以及计算登记分数出错是常见的误差来源。此外，误差的一个重要来源是评分者的差异。这种差异不仅反映在评分者之间，即使是同一评分者，由于受到情绪等影响，也会表现为评分的不一致。计分的客观性是指在两个或两个以上有能力的计分者之间有一致性。计分的基本步骤主要有三步：记录反应、检索标准答案、反应和标准答案的比较。评分计分中常见的误差有：宽容定势、首因效应和晕轮效应等。计分的一般原则是：A.与测量目标无关的回答不予计分，或者单独计分。B.确定标准答案。C.评分时最好按照题目顺序进行。D.最好在评分时不知道应试者的名字和其他个人资料，以减少个人偏见的影响。E.安排两个或两个以上的评分者来计分，这样可以减少评分者的主观偏见所带来的误差。⑤测验环境。环境条件的要求并不是可有可无的。不同的环境条件完全可能导致不同的结果，导致测验分数难以解释。因此，在施测时，首先必须完全遵从测验手册要求布置测验的场所，其次是要在施测过程中记录下任何意外的测验环境因素，以便在解释测验结果时加以考虑。⑥意外干扰。如突然出现持续噪音，突然停电，有人作弊等。这类情况可能会影响应试者的答题情绪，分散应试者的注意力，扰乱测验现场的秩序，进而影响测验成绩，造成误差产生。 3、源于测量实施者的误差。①测验实施者的资格。测验的选择、施测、计分和解释都必须由受过专门训练的专业人士来进行。测验的实施者既要具备一定的能力，又要恪守一定的职业道德，才能减少误差的产生。②实验者效应。在心理测验中，测验的实施者可能以某种方式有意无意地影响应试者，使他的反应符合实施者的期望的现象，称为实验者效应。实验者效应的存在会导致误差的产生。解决实验者效应的常用方法是采用“双盲程序”，让测验的实施者和应试者都不知道测验的真实目的是什么。

③建立协调的关系。协调的关系是指测验实施者与应试者之间的一种友好的、合作的，能促使应试者最大限度地完成好测验的一种关系。如果在施测过程中不能与应试者建立协调的关系，就会影响测验目标的达成，造成误差。 4、源于应试者的误差。①应试动机。应试动机就是指向应试目的的行为动机。在心理测量中，由于应试者应试动机的不同，会影响其答题态度、注意力、持久性、反应速度等，从而影响测量结果。②测验焦虑。是指应试者因接受测验而产生的一种紧张的、不愉快的情绪，它会直接影响应试者水平的发挥。心理学研究表明：A。能力与测验焦虑成负相关。B。抱负水平与焦虑成正相关。C。竞争性测验导致测验焦虑高。D。经常接受测验的人焦虑水平较低；而对测验程序不熟悉的人焦虑水平较高。E。轻微的焦虑会增进测验效果，但焦虑太高或毫无测验焦虑，则会降低测验效果。F。患得患失、缺乏自信、情绪不稳、顺应不良的人容易产生测验焦虑。G。应试者不了解测验目的，指导语不清楚，采用了新的题目形式或施测程序，或者有严格时间限制等，也会增加应试者的测验焦虑。③测验经验。为了真实地测量出一个人的某种心理特性，我们有一个基本假设：所有应试者在相当大的范围内对于测验所包含的材料、测验程序、反映技巧都具有同等的熟悉程度。任何时候，只要引入一种新的格式、新的测验题型、新的反映程序，都有可能造成理解上的错误，从而给测验结果带来误差。那些具有多次同类测验经验，具备应试技能的人，能够根据答案之间的排列顺序、相似性等细微的差别，运用时间策略、答题技巧来超越个人能力完成测验，从而使测验结果产生误差。④练习效应。任何一个测验在第二次应用时，都会有练习效应而使测验成绩提高，应试者经历一次测验等于参加了一次练习。⑤反应倾向和反应定势。反应定势是指应试者以某种习惯的方式对测验项目做出反映，使得我们无法正确判别应试者的真实能力水平。在心理测验中主要有这样一些反应定势：A。速度与准确性定势。有的人倾向于慢而细致地答题，另一些人常常快而粗略地做出反应。B。认可定势。对正误或是否题不肯定时，倾向于选择“正确”或“是”的答案。C。位置参照定势。有的人对等距量表的某些位置比较偏爱，另一些人则倾向于每题变化一种量表位置。D。投机定势。也是一种猜测定势，倾向于探究题中线索，猜测答案。此外，社会认知和评定中各种消极效应会产生各种主观倾向，如趋中效应、宽大效应和晕轮效应等。⑥生理变因。不但应试者的心理因素会影响测验结果，生病、疲劳、失眠等生理因素也会给测验结果带来误差。对于这种情况，可以有多种解决方案，最便捷的方式是改变测验日期。还可以选择恰当的测验方式。对于多个测验可以采取分步完成，或者分多次完成，中间安排必要的休息时间。注意测验的答题形式，变化答题形式。

⊙宽容定势：指评分者的计分过于宽松，即使没有回答出所要求的答案，评分者也给予较高的分数。 ⊙速度—准确性权衡：当一个人很快去完成某个任务时，他会比慢慢地去完成这项任务犯更多的错误；反之，如果某个人要尽量减少在完成任务时出错的可能，就会牺牲速度。心理学家称这种关系为“速度—准确性权衡”

⊙绩效评估的误差：1、源于绩效评估体系的误差。如果绩效评估体系与组织发展目标有所偏离，在评估指标的权重上对职位性质考虑欠妥，或者在标准化、公平性、明确性、合理性方面有所欠缺，都会造成来源于绩效评估体系的误差。 2、源于绩效评估过程的误差。在绩效评估过程中，采用的各种具体的方法，都有自己的优势，也会产生方法局限带来的误差。同时，在评估过程中还会出现考评指标理解误差、光环效应误差、趋中误差、近期误差、个人偏见误差、压力误差、完美主义误差、自我比较误差、盲点误差等。 3、源于绩效评估者的误差。绩效评估者可以是自己，也可以是上司和下级，这三类人都可能由于缺乏绩效评估的训练，而造成误差。此外，作为上司，在评估中可能会由于偏见、偏爱等原因造成误差；作为本人，可能会由于高估、记忆偏差造成误差；作为下级，可能会由于以偏概全、人际压力等造成误差。

⊙人事测评误差的控制：1、控制测评工具的误差。①测评形式的选择。由于测评的形式在人事测

评中占有相当重要的地位，它对测评目的的达成以及误差的产生具有直接的影响。在人事测评中，无论是采用面试、心理测量、绩效评估，还是其他测评技术，都要注意测评形式与实际工作的吻合度，采用动态测评与静态测评相结合、物理测量与心理测量相结合、具体测量与抽象测量相结合，这样做有助于保证测评的客观性，控制误差的产生。②综合考虑测评指标的特点。要保证测评指标能够提供足够的有价值的信息，能反映个体的心理特征，测评指标必须具备两个条件：一是行为样本要有足够的数量；二是行为样本要有代表性和典型性。 2、控制测评实施过程的误差。①测评前的准备。在人事测评前作充分的准备工作，可以减少实施过程中误差的产生；测验的实施者应该具有良好的专业素质，如果可能对测评实施者进行专门的测评前培训，这是最基本、最重要的准备。②采用标准化指导语。通常指导语有两种：一种是对受测者的；另一种是给测评实施者的。对测评实施者的指导语是为了保证测评情境的一致性。测评实施者在指导语念完后，要询问受测者有什么问题，寻求反馈信息，确认受试者的理解程度。无论在什么情境下使用同一测评项目，都必须按照同样的程序，提供同样的指导语，这样才能减少误差的产生。 3、控制测评实施者的误差。在实施心理测量时，测验的选择、施测、计分和解释都必须由受过专门训练的专业人士来进行，测验的实施者既要具备一定的能力，又要恪守一定的职业道德，才能减少误差的产生；对人事测评的实施者进行评估前培训，有利于提高人事测评的认知水平，避免和减少误差的产生。此外，在测评实施者与应试者之间创造一个宽松而不拘谨的氛围，以使应试者最大限度地完成好测验，也是减少测验误差的保证。 4、控制应试者的误差。注意调控应试者的应试动机、测验焦虑、测验经验、练习效应、反映倾向、生理状况等来避免误差的产生，给予应试者一个公平的机会。

第九章人事测评信度分析

⊙信度的含义：信度就是测评的可靠性，在测评多次或使用两个（或多个）等值的测评后所得结果的一致性程度。

⊙真分数：所谓真分数，是假定为任何被测量的特质的纯正的值，即没有误差的值，或者说在理想条件下使用完备的测评工具应当获得的值。

⊙信度系数：基本定义为，在一组测评中，真分数变差与实得分数变差的比率。公式表示为：⊙信度系数的估计：1、稳定系数。稳定系数也叫再测信度系数。是估计测评跨时间的一致性程度，即在两个不同的时间里进行测评所获得的结果的一致性程度。获得稳定系数时，最需要注意的是再次测评的时间间隔。时间间隔长了，被试的心理特征就会因为学习、经历、教育培训等因素而发展变化。间隔时间短了，又会使首次测评时的练习效果和记忆效果的影响增大。一般来说，再测时间间隔是几个星期。此外，还需要注意使两次测评的条件尽量相同。另外，获得稳定系数要注意测评的被试样本。样本应该有代表性。样本不能太小，一般应该选用大样本。稳定系数的最大优点是能代表测评随时间保持稳定一致的程度，而且，测题取样不影响稳定系数。但其局限性是几乎所有的测评都会有的练习和记忆的影响。因此，对那些受重复影响较大的测评，就不能使用稳定系数代表信度系数。2、等值系数。是指在对被试进行测评以后间隔一定的时间（一般很短），运用复本再测评一次所获得的复本相关系数。获得等值系数，最重要的是保证两个测评是平行测评。复本相关系数可以用来表示测评跨型式上的一致性，又可以用来表示测评跨时间的一致性和变化。它比再测相关系数要有用的多，其应用也比再测相关系数广泛。它可以用来估计信度系数，也被广泛用于实验研究，尤其是追踪研究。其局限是复本相关系数受项目取样的影响较大；也会受练习的影响，尽管这种影响要比用同一测评形式重测要少许多。 3、内在一致性系数。它只需要测评一次，它通过分析同一测评内部各测评项目之间的相互关系的方法来估计信度系数。反映的是跨测题的一致性。运用内在一致性系数来代表信度系数的条件是：各个测评项目是同质的。内部一致性系数的具体估计方法有3种：①分半信度。获得分半信度的方法分为：第一，把一个测评分成两个最为等值的两半，获得两个分数。第二，计算两半之间的相关，获得相关系数第三，根据这两半

之间的相关系数来估计整个测评的信度。

不能把测评随便地分为两半，而应该使两半尽量等值，而且两半之间的题目要相互独立。②库德—理查逊信度。③系数。

⊙信度系数估计中的特殊问题：评分者的信度也可以采用一般的信度评估方法来估计。其具体方法为：由两名评分者对同一个被试样组进行评分，按通常方法计算两个评分者评判的分数之间的相关系数。对于速度测验，信度系数的估计最好采用等值系数。如果测验受练习和记忆的影响作用较小，也可以采用稳定系数来估计信度系数。若要使用内在一致性系数来估计，那必须采用时间分半法。项目间异质的测验的信度系数得到的值往往偏低。对这些测验我们不宜采用内在一致性系数来估计信度，最好采用稳定系数来估计。

⊙影响信度系数的因素：影响信度系数的因素除了误差外，还有测验长度和被试样组的分数分布情况等。在其他条件相等的情况下，测验长度越长，信度越高。增加同质、难度相同的项目带来的信度的提高可以由斯皮尔曼—布朗公式获得：。测题的难度从易到难有一个合理的安排、测题的平均难度水平适中、对被试有良好的区分度，使得被试样组的分数分布范围大、平均得分适中，测评才会有较高的信度。

⊙信度和测评误差的关系：除了信度系数外，测评的标准误差也可以用来表示信度。测评的标准误差可以由信度系数间接估计，如果知道某次测评的实得分的标准差和该测评的信度，我们就可以由公式计算该次测评的标准误差；此外也可以用公式来直接估计。测评标准误差的直接估计也需要像估计信度一样通过再测、复本、分半方法来获得。

⊙解释个体得分：根据信度理论，我们不应该把某个体获得的某个得分看作是代表其水平的一个精确的点，而应认为该个体的真实水平是有多少的可能性在以其实际得分为中心的某个范围内。也不能简单地凭借得分的高低武断地判断被试之间的水平高低。

⊙信度多高才算可靠：通常来说，信度大于0.90的测评被认为是可靠的，比较知名的智力测验基本都在这个水平。0.80左右的信度意味着在实得分数中，误差的变异占到20%，通常也认为是比较可靠的。信度系数低于0.70则认为可靠性较低。一般人们往往会倾向于使用高信度的测评工具，但最可靠的测评工具也往往是最昂贵或最难实施的工具，有时将信度上的增加带来的收益和为了提高信度所投入的成本相比较，会觉得成本过高，有时可靠性增加了，其实用性又降低了。克朗巴赫等人把这种现象称为“带宽—保真两难”。带宽和保真本来是沟通理论中的两个术语，带宽指的是沟通时所包含的信息的广度，而保真则是指信息传递的准确度。要传递的信息越多，则准确度会降低，而要求的准确度越高，则能够传递的信息越少。在具体应用时，不一定每个测评都要求信度达到0.90以上，要根据测评的具体情境和企业的实际状况来选择。

第十章人事测评效度分析

⊙人事测评效度的含义：人事测评的效度就是所采用的测评工具对其所要测评的特性测量到什么程度的估计，效度是针对某种特定的测评目的而存在的，是一个关于程度的估计。

⊙信度和效度的关系：信度和效度之间存在着一定的关系：高信度是高效度的必要条件，而不是充分条件，信度系数的平方根是效度系数的最高限度。

⊙人事测评效度的类型：（1954年，美国心理学学会颁布的《心理测量和诊断技巧的技术建议书》）1、内容效度。就是指测验的行为样组能代表所测量的特质的程度。这里通常用内容范围这个概念来对内容效度加以说明。内容范围代表了能够用来测量个体的某个特点的所有行为样组，而每个测评工具都应是一个特定的行为范围的系统抽样。测量不同的特质，其内容范围就有所不同。内容范围应该具备下面两个特点：①边界。内容范围是有边界的，它包含了一些内容，同时也将另外一些不相关的东西排除

在外。②结构。内容范围是结构化的。 2、构思效度。构思效度也即测评工具能说明构思或特质的程度，或用某种构思或特质来解释测评分数的恰当程度。构思效度是和理论假设紧密联系在一起的。如果理论假设本来有误，则构思效度就没有意义了。对于每个构思来说，都有两个特点：一是其抽象性；二是他们又都和具体的可观察的事件相联系。 3、准则关联效度。准则关联效度是以测评分数和消毒准则之间的相关系数来表示测评效度高低的，也就是测评分数对所要测验行为的预测能力，在这里，被预测的行为是检验测评效度的标准，叫做准则或效标，它是用来检验效度的标杆，必须以某种测量根据加以测定。一般来说，可以有两种方法来估计准则关联效度，即同时效度和预测效度。①预测效度。预测效度的目的是决定决策前得到的测评分数和决策后得到的准则分数之间的相关。②同时效度。把一组人的测评分数和其绩效分数求出相关就可以得出同时效度。

⊙人事测评效度的评估方法：1、内容效度的评估方法。内容效度的估计可以通过对照内容范围、评分者信度、统计分析的方法来估计。其中评分者信度是借用信度依据来说明内容效度。专家评定是一种确定内容效度的典型程序，它要求让一组独立的专家根据评定量表判断测评项目对所考查内容的取样是否完备，然后通过计算评分者信度来获得该测评的内容效度依据。 2、构思效度的评估方法。构思效度的估计主要有测验内方法和测验间方法。测验内方法包括内容效度作为构思效度的指标、被评估这解答测题时的反应过程、测验的同质性、因素分析法等。测验间方法主要有：①相容效度。从理论上说，测量相同构思的各测验之间应该有较高的相关。这就要求计算新编制的测验与原有的、已知的效度较高的测验间的相关。②聚合效度和辨别效度。聚合效度又称为求同效度，其基本思想是，如果两个测验是测量同一特质的，即使使用不同的方法进行测量，它们之间的相关也应该是高的。辨别效度又称为求异效度，其基本思想是，如果两个测验测量的是不同的特质，即使使用相同的方法进行测量，它们之间的相关也应该是低的。③用准则关联效度对构思效度进行估计。④发展水平的变化。 3、准则关联效度的估计。准则关联效度的估计主要可以通过效度系数、组的分类等方法进行。根据数据的不同类型，可分别采用皮尔逊积矩相关、二列相关或点二列相关进行。

⊙影响人事测评效度的因素：测评的内容、长度、测评项目的区分度、难度和测评的编排方式都会对测评效度产生影响。所以，在构成测评时，要谨慎选择测评材料和内容，并事先对其区分度和难度进行一定的了解，对测评项目做出合理安排以提高测评总的效度。此外，测评实施过程的质量对于测评效度来说也是非常关键的。被评估人员的心理状况和身体状况会影响被评估人员受评估时的反映，从而影响结果的可靠性和有效性。总的来说。人事测评效度受到测评构成、实施、测评被评估者、准则的选取等方面因素的影响。

⊙效度系数的解释：效度系数在人事测评中有较广的应用。一方面，它可以提供信息，帮助做出决策；另一方面，它可以帮助从测评分数预测今后的绩效情况。

⊙效用分析：效用分析（如BCG模型）可以帮助分析人事测评方法上的改进给组织带来的经济上的收益。

第十一章人事测评报告 ⊙人事测评结果分析：

人事测评结果的表示方法：1、文字表述法。这是一种通过语言文字来表述人事测评结果的方法。是一种定性表述的方法。文字表述具有素材丰富、便于理解、生动鲜明等特点。但仍然暴露出评语单调划一、评价粗犷、信息量不足等弱点。 2、表格表述法。（广泛应用）这是一种通过数据统计表格来表述人事测评结果的方法。是一种定量表述的方法，突出了数据客观精确、简明扼要、便于归类、利于计算的特点。但是，数据表格的专业性，需要有一定的统计学知识作为背景，对阅读者提出了较高要求。 3、图形表述法。这是一种通过统计图形来表述人事测评结果的方法。也是一种定量的表述方法，它除

共6页:

安徽自考《人员素质测评理论与方法》学习笔记(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档