假设的提出都是基于理论的) 另一方面,心理学的理论也需要实验的检验,只有不断得到实验验证的理论才能不断完善和发展(实践才是检验真理的唯一标准) (三)心理学实验中的变量及其控制
变量是在数量上或质量上可变的事物的属性。在一个具体的实验中,变量分为自变量,因变量和额外变量。
1、自变量的种类及控制
自变量是实验者所操纵的,对被试的反应产生影响的变量。大致可以分为四类 作业变量:任务的任何特征作为自变量来操纵(记忆词表,错觉图形等) 环境变量:实验环境的任何特征(照明情况或照明强度)
被试变量:可能影响对某种刺激的反应的特性因素(性别,年龄,健康,智力,受教育水平) 被试暂时变量:由于某种原因,导致被试特性的暂时变化(疲劳,焦虑,给予不同指导语) 对自变量的控制
(1)建立合适的操作定义(用明确、统一、可量化的术语)【操作定义是对某个心理现象的测定程序】(如,疲劳定义为某种体力活动的劳动量,动机定义为挨饿时间) (2)确定自变量的各个水平(全距较大,且分布均匀)【因素型不超过4个,线性函数3-5个,复杂函数不少于5个】 (3)校准实验仪器
(4)控制呈现刺激的方式(呈现时间,次序、空间位置) 2、因变量的种类及控制
因变量是操纵自变量而引起的被试的某种特定反应。主要有六种观测指标。
①反应速度、②反应速度的差异、③反应的正确率、④反应标准、⑤反应的难度、⑥口语记录(主观)
对因变量的控制:
(1)反应控制:使用规范的指导语(内容确定,完全;简单明确;标准化) (2)选择恰当因变量指标:保证有效性(效度),客观性(客观存在),数量化(能够量化) (3)避免量程限制:测量指标不能灵敏地反映出因变量的变化,即因变量指标缺乏敏感性。天花板效应(测量指标选择过于容易,结果超过量程,两个胖子站在10kg的秤上,秤都到底了)和地板效应(测量指标选择过难,结果达不到量程,小学生做六级卷子,成绩都很差) (4)反应指标的平衡:速度与准确性的平衡(在保证正确的同时尽量做快) 3、额外变量的种类及控制
额外变量是与实验目的无关但是会干扰实验,即对被试反应产生影响的变量。
评价一项实验设计好坏的一个重要依据就是看研究者能否成功的控制那些额外变量。包括 (1)实验者效应(来自主试方面)
主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应附和主试的期望。(罗森塔尔效应,皮革马利翁效应) (2)要求特征(来自被试方面)
被试自发地对主试的实验目的产生猜想,然后再以一种自以为能满足这一猜想的实验目的进行实验的方式。(霍桑实验,安慰剂效应,约翰.亨利效应) (3)实验设计方面
顺序效应:练习效应,疲劳效应,方位效应 (4)环境方面
(5)数据处理方面
另外,被试的发展因素、成熟因素,历史因素,学习因素也都是重要的额外变量。
控制方法
1、排除法(把额外变量直接排除,如声光实验的隔音室,暗室。双盲控制法【主被试都不知道实验目的】,但会影响外部效度)
2、恒定法(额外变量无法消除时,让它保持相对恒定,如实验仪器,物理条件) 3、匹配法(人为的划分成若干组,或被试的特质在一定程度上同质。较难操作)
4、随机化法(平衡被试个体差异的方法,从理论上保证被试具有代表性,一般大于30个) 5、抵消平衡法(有些额外变量不能消除也不能恒定,比如顺序误差、空间误差、习惯误差、疲劳效应和练习效应),可以采取ABBA法和拉丁方设计(ABCD,BACD,BCAD,BCDA)。 6、统计控制法
可用剔除极端数据、统计矫正、协方差分析、偏向关来保证数据的可靠性。(属于事后控制) (四)实验设计
1、实验设计及评价标准
衡量一个实验设计好坏不仅要看其设计是否明确、是否有效、是否具有可操作性及可重复验证性;同时也要看实验整体的科学性、可靠性和推广价值,这就需要考虑到以下方面: 实验设计的内部效度;实验设计的外部效度;研究问题的理论与实践意义;实验指标的精确性与可靠性
实验设计:是进行科学实验前做的具体计划。它主要是用来控制实验条件和安排实验程序。 目的在于尽可能减少额外的或未控制的变量,从而增加实验产生有效的一致结果的可能性。 实验设计是实验成败的关键。 实验设计的基本类型
根据在各自变量及各处理水平中是否用相同被试分为:被试内设计、被试间设计和混合设计 根据实验中要操纵自变量的多少可分为:单因素实验设计和多因素实验设计 根据对实验条件控制的严密程度可分为:真实验设计、准实验设计和非实验设计 根据实验处理中被试人数多少可分为:大样本设计和小样本设计 实验设计优劣评价标准:能够恰当地解决所欲解决的问题(效度),恰当地控制实验中的无关变量,使实验结果有很高的可靠性(信度)。 任何实验设计都要考虑的几个方面: (1)自变量的确定及其呈现的方式;(2) 因变量的指标及其测量方法;(3)对额外变量的控制措施(确定被试总体、样本大小、取样方法和分组处理方法;拟定指导语;规定实验次数;安排实验程序;规定实验的仪器及其型号;规定处理实验数据的方法) 被试间设计和被试内设计的优缺点
被试间设计就是每个被试只接受一种自变量水平的实验处理。被试随机取样,随机安排接受不同的实验处理,又称完全随机化设计。各实验处理之间不相关,又称独立样本设计。 优点:每个人只接受一种处理方式,避免了练习效应和疲劳效应等实验顺序造成的误差 缺点:(1)所需被试数量巨大;(2)不同个体接受不同处理,不能排除个体差异对实验结果的混淆,匹配和随机化等组技术只能缓解,不能根治。
被试内设计:是指每个或每组被试接受所有自变量水平的实验处理的真实验设计,又称重复测量设计;若被试组代替单个被试,每组接受所有实验处理,组中每个被试随机接受一中处理,这样的组叫区组。这种设计叫随机区组设计,同一区组被试尽量同质(即各方面都相似或相同)。随机区组设计的实验处理之间相关,又称相关样本设计。 优点:(1)每个被试或区组须接受所有自变量水平的处理,节省了被试人数;(2)不同组被试的个体差异也得到了最好的控制,实验结果不会受到来自被试个体差异的困扰 缺点:(1)被试接受不同自变量水平的处理之间总会存在时间间隔,因此实验者需要努力防止在此间隔内偶然发生的事件对实验结果的影响;(2)由于被试先后接受不同处理,一些和
时间顺序有关的误差即顺序误差,就可能混淆进来,如练习效应和疲劳效应。平衡技术,ABBA设计和拉丁方设计。
2、前实验设计与事后设计(非实验设计) 前实验设计(对人和无关变量都没控制) 单组后测设计(X O)
只有一个实验组,对实验组只给予一次实验处理,然后测量得到一个后测成绩。
【在数学教学中,组织了课外辅导讲座,结果班上的数学成绩提高了。结论是课外讲座导致了数学成绩的提高】 局限:(1)没有对照组,研究者只能描述所观察到的结果,不能比较;(2)没有前测,无法与之前成绩比较;(3)没有考虑对机体变量、自变量及其他无关变量的控制,容易出现自变量混淆;(4)很难排除历史、选择和成熟等内在因素的影响。所以这种实验很难做出推断。 单组前测后测设计(O1 X O2) 【比上面那种增加了前测,但还是仅有一组实验组】 优点:(1)有前测,可以提供基线数据,结果具有可比性;(2)全部被试既是实验者又是控制组,可以控制选择变量。 局限:(1)设计只有一个实验组,自身兼做控制组,最主要威胁是历史因素(中间时间可能有无关因素干扰)和成熟因素(中间时间生理变化的影响);(2)由于有前后测,练习效应也会造成影响;(3)仪器、统计回归及测验与处理的交互作用,都会对内部效度造成影响。 固定组比较设计(也叫静态组/整组比较设计)(X O1) O2 就是在第一个实验设计中增加了一个对照组,但是被试没有经过随机分配,而是在实验处理前就已经形成。 优点:(1)由于使用了控制组,基本上能对历史因素进行控制,增加了实验的内部效度;(2)(时间上两组同时进行)因为没有前测,所以可以控制练习效应和仪器因素的干扰;(3)最后也能对成熟因素做到有限控制。 局限:(1)无法控制选择因素(没有随机分配被试);(2)选择与成熟的交互作用和选择与处理的交互作用混淆不清。
检验方法(独立样本T检验,U检验,中位数检验和卡方检验) 事后回溯设计(⊕ O)
指所研究的对象是已发生过的事件,即在所研究的现象发生之后对其发生的原因进行追溯。 特别适用于自然条件下对于简单因果关系的研究;可以避免人为作用所带来的干扰;但它缺乏对变量的控制。
(1)相关研究设计(O1 O2)
在一个被试组内收集两个集合的数据,其中一个是观察到的结果,另一个是被追溯的变量,然后确定两种变量之间的相关关系。
其中一个数据是另一个数据观察到得结果【吸烟是导致肺癌的原因】 前后都可能是原因,也有可能是第三方变量共同引起的。(可采用积差相关求相关系数) (2)准则组设计(⊕ O1) O2
研究者通过对所研究现象的被试的比较,确定某些被试,即准则组,具有一种状态的特征,而另一些被试,即非准则组,不具有这种状态的特征,然后去追溯可能存在的原因。 (O1是具有某种特征的准则组,O2是没有展示出准则组特征的被试) 【第一组学生的成绩很好,第二组学生的成绩很差,我们可以追溯出第一组的教师要比第二组的好】 优点:(1)可以对自然条件下的各种事件进行追溯,以了解原因结果。
(2)特别适用于简单因果关系的研究。 (3)可以给研究假设提供充足的论据。
(4)在某种条件下,事后追溯更为有用,因为实验法带有人为性质。 (5)条件限制不能用实验法时,也可以用该方法。 局限:(1)研究缺乏控制,不能操纵自变量和随机分配被试。
(2)一个结果可能有多个原因。
(3)有相关的两个因素也可能是第三方变量导致的。 3、准实验设计
对无关变量的控制比前实验设计要严格一些,能对一部分无关变量进行控制,但却不如真实验设计对无关变量控制得充分和广泛。力图通过程序的改变(尤其是测量的调整)来提高对无关变量的控制。
(单组)时间序列设计(O1 O2 O3 O4 X O5 O6 O7 O8) 就是在单组前后测实验设计的实验处理前后进行了一系列周期性的测量。然后分析前后测量分数是否具有非连续性,从而推断实验处理的效果。 优点:(1)较好的控制了成熟变量对内部效度的影响;(2)可以控制测验因素的干扰; (3)可较好地控制统计回归的因素。 缺点:(1)由于没有控制组,不能排除那些与自变量同时出现的附加变量的影响;(2)测量与处理的交互作用不易受到充分的控制;(3)练习效应(多次测验会增加或降低被试对测验的敏感性)
(单组)相等时间样本设计(X1O1 X0O2 X1O3 X0O4) 对一组被试选取两个相等时间样本,其中一个时间样本出现实验变量(X1),另一个时间样本不出现实验变量(X0),可以看成是单组后测的改良版。 优点:在控制内部效度方面完全有效(控制历史因素等)。
局限:控制外部效度并不理想(测验、实验安排的反作用、选择偏差与实验变量的交互作用和重复实验处理都会影响外部效度)。
(多组)不相等实验组控制组前测后测设计(O1 X O2) O3 O4 其实就是在固定组比较设计中增加了前测。 优点:(1)由于增添了控制组,基本控制了历史、成熟、测验因素对实验的干扰;(2)由于两组都有前测,实验者可以了解实验处理前的初始状态,从而对选择因素有了初步的控制。 局限:(1)由于没有随机分配被试,实验组和控制组实际上是不对等的,因而选择与成熟、选择与实验处理的交互作用可能会降低该设计的效度;(2)又由于两组都有前测,因而其实验结果不能推广到无前测的情境中去。
不相等实验组控制组前测后测时间序列设计(多组)(O1 O2 O3 O4 X O5 O6 O7 O8) O9 O10 O11 O12 X O13 O14 O15 O16 也就是在不相等实验组控制组前测后测设计的实验处理前后插入了一系列周期性的测量。 优点:兼有两者优点,基本控制了历史、成熟、测验、选择与成熟交互作用的影响。
缺点:实验的反作用效果即测量次数(多次测验会增加或降低被试对测验的敏感性)和选择偏差与实验处理X的交互作用都可能会成为影响该设计外部效度的因素。 拉丁方设计(平衡设计)(ABCD,BACD,BCAD,BCDA)A=X1 O1 ;
B=X2 O2
是一种设计的模式,为了达到实验控制的目的,使各组被试都接受不同的实验处理,并对实验处理的顺序进行了轮换。而且是只有后测的设计。 优点:抵消平衡的方式避免了顺序效应。
缺点:由于不能采用随机分配被试的方法,选择因素可能与历史,成熟,练习产生交互作用。 4、真实验设计
与前两种实验的最大区别在于能随机选择被试并将各被试随机地分配到各个处理水平上,从而能更客观的反应实验处理的作用。(在随机化原则上选择和分配被试,对实验条件控制较高,可有效操纵实验变量,控制额外变量的影响。)
完全随机单因素实验设计:也叫被试间设计,研究中只有一个自变量,但有两个或多个水平。将被试随机分成几组,然后依据实验目的对各组被试随机实施不同处理。 随机实验组控制组前测后测设计( R O1 X O2)
R O3 O4
就是不相等实验组控制组前测后测设计的随机化。 优点:(1)随机选择和分配被试,可控制选择、被试的中途退出及选择和成熟的交互作用的干扰;(2)有控制组,基本控制了绝大多数影响内部效度的因素(如历史、成熟、测验和仪器等因素)。
缺点:由于前测而获得的经验,可能对后测产生敏感性,出现反作用效果,导致对实验设计外部效度的影响。
随机实验组控制组后测设计(R X O1)
R O2
由于前测会影响外部效度,所以去掉了前测(是理想的实验设计)。 优点:(1)控制了历史和成熟因素以及选择和被试中途退出等对内部效度的影响; (2)控制了测验与实验处理的交互作用对外部效度的影响。 随机多组后测设计(R X1 O1)
R X2 O2 R X3 O3
仅在实验处理的个数以及相应的被试组数上增加了。其它同上 所罗门设计
以最简单的形式把前测—后测控制组设计和仅施后测控制组设计组合起来可以得到一种新的设计,这是所罗门(Solomon,1949年)提出的,该设计有4个组,包含控制组、实验组各两组,而实验组接受的实验处理是相同的。实验组和控制组中各有一组接受前测,实验结束对4组都进行后测。每组被试都是随机分配的。 RG1 O1 X O2 RG2 O3 -- O4 RG3 -- X O5 RG4 -- -- O6
因为是4组设计,实验包含4个组,只有一种实验处理。比较实验组和控制组后测得分可确定实验效果。只有一种实验处理,X无下标。组1和组3是实验组,组2和组4是控制组(图中没有X)。
因为对一些组进行了前测,而一些组不测,所罗门4组设计的优点在于能使研究者检验前测带来的可能的影响。前测影响后测得分,前测与实验处理相互作用都是可能的。也就是说,实验处理的效应对前测过和没有前测过的组是不同的。因为在实际的课堂实践中前测不是规定要做的,所以它经常是效度所要考虑的问题。(对实验处理的效果进行两次检验,既可以①确认实验处理的效果,还可以②检验测验与实验处理的交互作用。)
完全随机多因素实验设计:又称完全随机析因设计,是指在实验中有两个或两个以上因素(即自变量),并且每个因素至少有两个水平,各因素的各个水平互相结合,构成多种处理