人才测评期末重点资料整理 - 图文

2019-03-11 13:25

第二讲

测量量表

? ?

测量：按照法则给事物赋予数值；其中，法则是将事物的属性转变为数字的特定程序。量表的特征:

– 量值：具有强度的特征。

– 等距：在量表中任何两个数值之间的差别与另外两个数值之间的差别具有相同的含义的时候，

量表就具有等距的特征。

– 绝对零点：当测量的特征根本就不存在的时候，我们就称之为绝对零点。

? ?

四种尺度

类别尺度（nominal scale）

– 测量水准最低

– 一个集合的所有成员都被分派到相同的数字，并且没有两个集合被分派到相同的数字。

等级尺度（ordinal scale）

– 物体或事物能够依操作定义所界定的明确特征或属性而排列大小或程度。

等距尺度（interval scale）

– 要求尺度上的等差代表所测量的特质的量之等差。

等比尺度（ratio scale）

– 测量的最高水准

– 除以上特征外，还具有绝对零点。

量表的种类

– 1、类别量表 1－黄种人；2－白种人；3－黑种人 – 2、顺序量表身高第1－姚明；2－王治郅；3－易建联 – 3、等距量表华氏温度表 – 4、比率量表开氏温度表；速度等

百分等级

“有百分之多少的分数（观测值）落在一个特定的分数（观测）值之下？”

1、计算有多少观测值在我们感兴趣的特定分数值之下。 2、计算观测值的总数。

3、用特定分数值之下的观测值个数（步骤1）除以观测值的总数（步骤2）。 4、将步骤3的结果乘以100。

【例：在50000名选手中排名62： [（50000-62）÷50000]×100＝99.88

百分位数

百分位数（Percentiles）是分数分布中的一个特定的分数值或点，它是一个原始分数。

– 例如：中国的百分等级是44，百分位数是40/1000。

注意：

– 联系分数代表的特定意义来理解。 – 考虑总体的情况。

标准分数

1、是将原始分数与平均数的距离以标准差为单位表示出来的量表； 2、其基本单位是标准差；

3、常用的标准分数有：z分数、Z分数、T分数、标准九分数、离差智商（IQ）等。

常模（norms）

常模是某一群体在特定测验上的表现情况。

-常模有多种表示方法：Z分数、百分位数和平均数、标准分数等。

-当测验在一个样本群体中运用，并获得这个样本的分数分布的时候，测验的常模就建立了。 -有些测验在不同的年龄群体中使用不同的常模。

痕迹

痕迹：与同伴相比倾向于保持保持在相同水平上的趋势称之为痕迹。

标准参照测验

常模参照测验（norm-referenced test）把每一个被试的成绩与常模进行比较。例如，前面提到的，根据总体成绩评定A、B、C、D、E五个等级

标准参照测验（criterion-referenced test）用于描述考生在特定类型的技能、任务和知识方面的表现水平。如：IQ测试；算术能力测试

领域抽样模型（domain sampling model）：

使用有限的测验项目来代表一个复杂的结构所带来的问题。

注意：此处的样本是测验的题目而不是被试

长的测验样本项目较多，短的测验样本项目较少；但每一个项目对于所研究能力或行为的代表性相等。真分数：个体在能力或行为总体上的分数。

信度：个体在较短测验上的观测分数的方差和较长测验真分数的方差的比率。

估计测验信度的方法

——重测法：时间取样，考察不同场合的测验结果的一致性。重测信度（test-retest reliability）

适用范围：所测量的“特质”或特征不随时间而改变的情况。估计方法：

1、在两个不同时间进行同一测验 2、计算两次测验之间的相关迁移效应（carryover effect）练习效应（practise effect）注意：时间间隔；测验特征的变化

——平行测验技术：项目取样，评估不同测验之间的一致性。平行测验信度（parallel forms reliability）

又叫等值信度（equivalent forms reliability）、平行信度

功能：考察误差的方差是不是由于编制者选择了特定系列的项目所导致的。估计方法：

1、为同一测验设计两个等值的版本 2、将两个版本在同一天施测于同一群被试 3、计算两个版本的皮尔逊积差相关系数局限性：实践中很难拥有两个版本的测验。

——内部一致性技术：考察被试在测验的相似项目之间的表现情况。分半技术； KR20公式；系数估计方法：

1、对被试施测一个测验；

?2、人为地将测验分为两半，分别计分； 3、将两部分的分数进行比较：（1）计算两个部分之间的相关系数（2）利用Spearman-Brown formula来修正。

KR20公式：适用范围：测验项目是0、1计分的情况。

N=测验的项目数

2S??pqN?r?()2N?1SKR20S2=总的测验分数的方差

p=每一个项目的被试答对比率（各个项目上被试回答情况彼此独立） q=1-p每一个项目的被试答错比率

！只有在测验的各个项目之间存在协方差的情况下，即项目之间存在相关的时候， KR20公式计算的信度才不为0。】项目数越多，信度越高。 KR21公式：

前提假设：所有项目具有相等的难度，或整个测验的平均难度水平为50%。

??X???X?1?????NN ???1??KR21??N?1?S2 ????通常低估了分半信度

?系数

Cronbach：用于估计项目非0、1计分的测验的内部一致性。所有的内部一致性测量，都是去评估测验的每一个项目测量同一特质的程度。

因素分析（factor analysis）：将项目划分到具有内部一致性的不同子集中去。

?22??S?S?N???i?????N?1???2?S?????使用分半技术时，当测验两部分的方差不等的时候，使用系数。

行为观察研究中的信度

对行为进行直接观察也涉及到信度问题。估计观察者的信度：

考察两个或更多的观察者之间相一致的次数所占的百分比。库珀统计量（Kappa statistic）

与信度评估方法相关联的误差来源

误差来源

例子

方法

如何评估

时间取样在两个时间点施测同一测验重测两次测验分数的相关

项目取样用不同的项目评估同一特征备择版本或平行版本具有不同项目的等值测验的相关

内部一致性同一测验项目的内部一致性

1、分半 2、KR20 3、? 库珀统计量

1、测验分半后两半相关的修正

2、3、略

观察者的差异不同观察者的记录略

什么样的信度是可信的？

一般情况：0.7-0.8

涉及到个体未来的决策时，信度应该要求更高（0.95）

面对低信度怎么办？

增加测验项目

理想信度水平下的测验长度：

共6页:

人才测评期末重点资料整理 - 图文.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档