三人行考研辅导 权威的专业课辅导 010-62035118
缺点:①易受决策者的偏见影响②缺乏精确的数量分析
Ⅱ 加权求和——将各测验分数相加或乘以加权系数后相加
前提:各测验所测特质间有互相代偿作用,这些测验的分数又是连续性资料,并能大体同时获得
Ⅲ 多重回归——研究一种事物或现象与其他多种事物或现象在数量上相互联系和互相制约的统计方法
很多情况下,需要利用测验结果对预测效标做出估计,即求出效标估计与预测变量之间的数量关系式:
范围:适合于所测特质具有某种程度的互偿性
Ⅳ 多重划分——在各个特质上都确定一个标准,从而把成绩划分为合格与不合格两类;所有测验按顺序实施,通过一个才能进行下一个,完全合格要全面达标
3)常模编制
①确定有关的比较团体
②获得该团体成员的测验分数 ③把原始分数转化为量表分数
4)几种常用的常模
Ⅰ 心理年龄
首先寻找并设计出可区分各年龄儿童智力的题目,每个题目放在大部分的儿童都能成功地完成的那个年龄水平。把每个年龄水平的题目综合得到一个可评价儿童智力发展水平的年龄量表。一个儿童在量表上所得的分数,就是最能代表他的智力水平的年龄,称智龄。
Ⅱ 年级当量
将被试的测验成绩与某一年级的学生的平均分数做比较,而说明相当于某一年级水平。
Ⅲ 教育商数
其中教育年龄是指某岁儿童所取得的平均教育成就
Ⅳ 成就商数
将一个学生的教育成就与其智力作比较,反映学生的努力度和教师的教学效果:
成就商数不仅可以用来评价学生的努力程度,还可以评价教师的教学效果与质量;前者是因为智力与学业成就二者不等价,智力不够理想,若刻苦努力,仍可获得好的学业成就,此时他的成就商数就高;反之,成就商数低,说明该生不够努力,所获得的成就与他的智力不相称;对后者,如果学生的平均教龄低于智龄,说明教学存在问题;
(八)标准参照测验
11
三人行 心理学 教育学 历史学 统考 非统考 网授 面授 QQ2645651671 QQ2446919398 名师大课 vip保过
三人行考研辅导 权威的专业课辅导 010-62035118
1)标准参照测验的定义与作用
标准参照测验:根据某一明确界定的内容范围(是首要的)而缜密编制的测验,并且被试在测验上所得结果也是根据某一明确界定的行为标准直接进行解释的;
作用:了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平而不再是个体间的水平差异; 2)标准参照测验的题目分析
(1)内容范围的确定 ①内容范围具有明确的边界
②范围的内容可进行细致分类,有明确的结构
③特定测验目的的确定常为内容范围的界定提供依据
(2)内容效度分析
对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性,这一过程缺乏客观的统计分析手段,通常采用专家评定的方法。
(3)测验的预测
①前测-后测方法——在一组被试接受教学过程前后各施测一次 ②已接受教学组-未接受教学组方法
③对照组方法——由教师评定是否掌握知识的两组
(4)难度分析 用通过率来表示。 (5)区分度分析 ①鉴别指数:掌握组在某项目上的通过率减去未掌握组在该项的通过率,即
②个人获得指数:前测-后测法中,可获得在前测中错误回答项目而在后测中能够正确回答的被试的人数的比例;
③相关系数:项目的分和测验总分之间的一致性程度
3)标准参照测验的信度与效度
(1)信度 ①分类一致性信度
考察被试在同一测验的两次施测中是否被分在同一类中
②荷伊特信度
(2)效度
①内容效度——照搬常模分析中的内容效度分析方法;(评估一测验的内容效度 ,都依赖于两个条件:一是测验有明确界定的测验内容;二是测验每一题目的内容效度的分析)
②效标关联效度——运用刚才在信度中使用的四格表的分析法,只不过这里的测验AB分别指预测源测验和效标测验;
4)标准参照测验的分数解释
(1)专家判定法(Nedlsky方法和Angoff方法) 在测验的内容范围明确界定的基础之上,由专家来判断处于临界水平的被试在每一题目上正确回答的可能性,进一步一次为标准确定分数分界点。
12
三人行 心理学 教育学 历史学 统考 非统考 网授 面授 QQ2645651671 QQ2446919398 名师大课 vip保过
三人行考研辅导 权威的专业课辅导 010-62035118
临界水平被试:那些刚由未掌握水平转入掌握水平的被试,这些被试实际上是在专家的想象中虚拟出来的
(2)效标组预测法
①临界组法:由专家判定和选择一组正处于临界水平的被试,将测验施测于该组被试,计算他们在测验上的平均成绩,以体现测验的内容范围所要求的临界水平,因而可以视之为测验分数分界点的估计值
②对照组法:采取专家判定的方法来事先确定两组被试,一组被明确判定为掌握组,另一组则被明确判定为非掌握组,那些不太容易被判定的被试一概提出。对这样两组被试施测测验,可以得到原始分布图,途中两条曲线的交叉点即为测验分数的分界点
(九)心理测量理论的新发展(非重点) 1)经典测量理论的局限
①对信度的估计精度不高,平行测验难以实现
②误差指标笼统单一,仅把测验分数划分成真分数和随机测量误差两部分
③各种参数的估计对样本抽样的依赖性太大,如题目的难度是相对考生而言的 ④参数指标之间的配套性较差
⑤真分数与观测分数之间存在线性关系的假定不合理 2)项目反应理论: 见华中(北京) 师大参考书
潜在特质:没有明确的物理与生理属性的,制约人的行为的心理特征
项目反应理论:以受测者回答问题的情况,通过某种数学函数曲线,推算出受测者某个心理特质变量大小
所依据的函数叫做项目特征函数。 项目反应理论的优点:
①题目参数的跨群体不变性(题目的特征函数是固定的 ②潜在特质量表的可选择性 ③参数设计的科学性
④信息函数概念的引进与信息函数的可加性 3)概化理论
概化理论的基本思想:任何测量都是依赖于特定的测验情景关系的,测验情景关系中的测量目标、测量侧面、测量侧面的水平都是会变化的,它们的变化会引起测验误差的来源、测验误差的大小、真分数的种类以及测验信度的变化,同时测验分数的解释范围也发生变化。概化理论的统计分析分为两个阶段,即G研究和D研究。
(1)G研究
观察领域:研究者设计的测验情景关系及用一定方法采集的测验数据
三人行 心理学 教育学 历史学 统考 非统考 网授 面授 QQ2645651671 QQ2446919398 名师大课 vip保过
13
三人行考研辅导 权威的专业课辅导 010-62035118
G研究在观察领域数据上进行,其目的是要定量估计观察领域中测量目标的方差以及各测量侧面所产生的测量误差方差。从统计角度说就是要分解观察数据总体方差,估计各因素期望方差,采用的方法是方差分量分析法,把总体方差分解为测量目标主效应方差、测量侧面主效应方差、各种交互效应方差。
(2)D研究
D研究称作决策研究,其目的是利用G研究的结果数据,在原设计的测验情况关系范围之内,分析比较各种可能的测验方案,测验工作者可以根据分析结果,结合可能的实施条件优选实际测验方差。D研究最终提供各种测验方案下的测验误差估计值。 4)测验等值
测验等值:通过对考核同一心理品质的多个测验形式做出测量分数系统转换,使得这些不同测验形式的测验分数之间有可比性
测验等值可使不同形式的测验分数均对应起来,测验主持者可以任意指定其中的一个分数形式作为基准,而使其他形式的分数都转化到这个基准形式上。
(1)测验等值的条件
①同质性——被等值的不同测验形式所测的必须是同一种心理品质且内容与范围基本相同 ②等信度——被等值的不同测验形式必须有相等的测验信度
③公平性——考生参加被等值的不同测验形式中的任一个测试,等之后的结果都是一样的
④可递推性——不同递推途径所得到结果相同测验x与测验y的等值转换关系为:测验y与测验z的等值转换关系,在,
⑤对称性——测验间的等值转换关系是双向的即,如果一定有
,那么从y出发,
,则,
,那么一定有测验x与测验z之间的关系h存
⑥样本不变性——两测验的转换关系是内在的,不随所使用样本的变化而变化 (2)计算方法
①等百分位等值:如果两个分数对于任何一个被试群体都有相同的百分等级,那么这两个分数就被认为是等值的
②线性等值:如果两个分数在各自的群体内标准分数相等,这两个分数被认为是等值的
改写成: y=Ax+B 其中
四.心理测验及其应用 (一)成就测验 1)成就测验的定义
成就测验:对个体在一阶段的学习或训练之后知识、技能的发展水平的测定;
与其他心里测验不同的是,成就测验希望看到练习和发展的效应;与能力测验一样,成就测验属于最佳行为测验。 2)成就测验的编制
14
三人行 心理学 教育学 历史学 统考 非统考 网授 面授 QQ2645651671 QQ2446919398 名师大课 vip保过
三人行考研辅导 权威的专业课辅导 010-62035118
①确定测验目的,选定测验编制的方法 ②分析测量目标,拟定测验编制计划 ③编题征题与选题组卷
④调查测验质量参数,编制测验常模 ⑤编写测验指导书,正式出版发行 3)成就测验的标准化
①命题组卷标准化 ②标准化施测 ③评分标准化
④测验分数解释标准化
(二)智力测验 1)智力测验的定义
智力测验:以一定的智力理论为基础,通过测验得到智力的量化数据; 比率智商:用智龄和实际年龄的比率来代表智商。 2)个体智力测验
(1)比内量表 I 比内-西蒙量表
1905年量表:出于诊断异常儿童智力,是世界上第一个智力量表,包括30题;(07年考过) 1908年量表,这是第一个年龄量表,测验增加至59题,以智力年龄来评估个体智力; 1911年量表,增设了一个成人题目组; II 斯坦福—比内量表(推孟terman) 1916年量表(适合3--13岁),在比西量表的基础上又增加了39个新项目;首次引入比率智商,以IQ作为个体智力水平的指标;
1937年量表(1.5--18岁),由L,M型两个等值量表构成,偏重于社会经济地位较高家庭的儿童,未能全面反映美国当时人口状况;
1960年量表(2岁--成人),汇集了L,M的最佳项目而成LM型单一量表,舍弃比率智商,引入离差智商,μ=100;σ=16;
1972年量表,取样代表性有了很大的提高; III 中国比内测验
测验共51题,每题代表4个月,从2--18岁,每个年龄3道题,使用离差智商; (2)韦克斯勒量表 I 韦氏成人智力量表
1939年,W-BⅠ(10--60岁),是第一个成人智力量表; 1949年,W-BⅡ(10--60岁); 1955年,韦氏成人智力量表,WAIS;
1981年,修订版WAIS-R(16--74岁);每个分测验独立记分,在转化为μ=10;σ=3的标准分数;最后在转换成μ=100;σ=15的离差智商分数;
W-B,WAIS,WAIS-R都由11个分测验组成;6个言语分量表,5个操作分量表;
II 韦氏儿童智力量表
WISC量表;是韦氏成人智力量表向较低年龄水平的扩展;
三人行 心理学 教育学 历史学 统考 非统考 网授 面授 QQ2645651671 QQ2446919398 名师大课 vip保过
15