如果把对条件的叙述记为a,把对行为的叙述记为b,那么因素型假设就是“如果a,那么b”的形式。一切科学定律、法则虽然表面上不一定都符合这个形式,但实际上却包含先行条件(自变量)和后继条件(因变量)这样的逻辑关系。以对于缪勒—莱尔错觉(Müller\\|Lyer illusion)为例,“如果变化夹角的大小,那么视错觉就有变化”就是确定夹
角是否是视错觉的要因的因素型假设。
假设的另一种陈述方式是用函数关系来表示,它用方程式b=f(a)来表明自变量a与因变量b共变的函数关系,这个方程式表示b为a的函数,或b数量地依存于a。应用这个模型,就可将缪勒—莱尔错觉中夹角与视错觉的关系改为“视错觉的量与夹角的余弦成正
比”,这就是函数型假设。
(二)选择被试
选择被试是实验研究程序的第二步,涉及的问题有:应当使用人类被试还是非人类被试,被试应具备哪些机体特征,用哪一种取样方法才能使被试样本代表总体等。总体来讲,这些
问题的解决主要取决于两个因素:课题的性质以及研究结果的概括程度。
课题的性质可以指导实验选择人类被试还是非人类被试。许多实验心理学研究课题涉及人类的心理和行为,因此往往首选人类作为被试。但是在以下两种情况下,研究者应该考虑选择非人类被试:第一,实验程序有可能对人类被试造成身心损害,如“噪音对情绪稳定性的影响”这样的实验课题就不能选择人类被试;第二,非人类被试有助于实验对无关变量的控制。例如,许多实验动物都是纯种的、在相同环境下培育成长的,因此动物被试的个体差
异远远小于人类被试,更有利于实验控制。
实验研究结果所要求的概括程度可以指导被试选择如何取样的问题。心理学研究的群体可能只是一个小群体,他们仅具有某种特性,如某个国家的所有人、某个民族的所有人、所有大学生、某个学校的学生等都可以作为心理学研究的总体。而选定什么样的被试样本,要
依研究的问题和据此而推论的全体而定。
如果被试的取样出现偏差,就会影响实验效度,而要减少这种偏差,方法有如下两种:第一是随机抽样法,这是最基本的方法,实验中的被试是随机抽选出来的,也就是说每个个体从总体中被抽选的机会是均等的,任何个体的选择与其他个体的选择都没有关系,彼此之间的选择都是独立的;第二种是分层随机取样法,当总体由不同大小的小组和层次组成时,分层方法最适用。例如,研究中国成人的听力与外国成人的听力是否有所差异,研究者就必须在中国采用一定数量的被试,他们最好是不同年龄段、不同性别、不同职业、来自国内不
同地区甚至不同民族的成人,只有这样才能得到代表中国成人听力的结果。
(三)确定实验控制
控制是实验的精髓所在,对实验进行有效控制的技术甚至已经发展成一门独立的学科──实验设计(experimental design)。关于实验设计的内容,我们将在下一章用专门的一节进行介绍。这里,我们着重解答初学者对实验控制的最大疑惑:实验控制究竟做到什么程度
才算合适?它有没有止境或界限?
事实上,这个问题不仅对于初学者,即使对老到的研究者也常常成为反复出现的困扰。一方面,出于某些理论上的考虑,研究者总希望尽可能地将实验控制深入再深入;而另一方面,无限地沉迷于实验控制,又可能将实验者的过多精力导向细枝末节而失去了对核心部分的关注。作为初学者,首先要明白的是:实验控制本身不可能有止境,因为实验所关注的自变量和因变量永远是有限的,而这世上所有可能的变量是无限的;在有限的实验变量之外,永远有着无数可能的额外变量存在。因此,想要将所有可能的额外变量一一控制,注定是不可能的任务,反而会使实验过于复杂臃肿,最终失去可操作性。从最根本上说,我们一方面不可能保证被试之间的差异为零──即使是同卵双生子同时参加实验,也还会有空间位置上的差别!另一方面我们也不可能保证被试在不同时间的任务丝毫不受时间流逝的影响──起
码被试的新陈代谢不可能停止,任何时间的被试都和一秒钟之前不尽相同!
这些事实很容易使初涉实验心理学的人感到沮丧,从而觉得再怎样努力进行实验控制也是徒劳无功的,因为总还有一些变量可能混淆进来。但是他们忘记了:实验研究本身就隐含着这样的前提,即人们总能够以某种方式理解世界。而将诸如被试的空间位置和新陈代谢等都当做可能对感兴趣的现象产生不可预料影响的因素,无疑将使所有事物都变得无法理解,
而这有悖于科学方法的初衷。
因此,只要我们仍然愿意采用科学实验的方法来理解问题,就要学会接受无法控制一切变量到达极致的现实。我们所要做的,是从课题确立阶段的资料准备开始,圈定最可能影响实验的那一部分变量进行控制。至于在此之外无数可能成为干扰的额外变量,一方面要理解其中许多会影响因变量的可能性基本上为零,因而不必为此花费心思;另一方面还可以有赖科学方法本身独有的自我完善特性,留待将来的理论构思把当前遗漏的某些变量重新纳入考
虑。 (四)数据整合
实验的目的就是进行控制条件下的观察,观察的结果被系统记录下来,也就形成通常意义上的数据或资料。心理学研究所能收集到的资料大致分为计数资料(enumeration data)、计量资料(measurment data)、等级资料(ranked data)、描述性资料(descriptive data)
四类。
一是计数资料,即按个体的某一属性或某一反应属性进行分类计数的资料。计数资料只反映个体间质的不同,而没有量的差别,例如被试的性别、婚否、成年或未成年,反应的有
或无、对或错等。
二是计量资料,即用测量所得到的数值的大小来表示的资料,例如被试的年龄(岁)、
智商(IQ)、反应频率(次/秒)等。
三是等级资料,它介于计数资料和计量资料之间,可称为半计量资料。例如,将被试的
领导能力划分为强、中、弱三个等级,就能得到等级资料。
四是描述性资料,即非数量化的资料。描述性资料可以补充说明数据,使数据更有说服力。但是由于没有数量指标作为客观尺度,描述性资料在进行解释时容易产生主观片面的错
误,因此对描述性资料的解释必须小心谨慎。
实验的因果结论,往往依赖于对数据的整合分析而得出,因此针对实验数据的特点选择合适的统计分析过程,就成为能否从数据中挖掘尽可能确切的实验结论的关键。在心理学研究中,等级资料有时可以升级转换为计量资料使用,比如通过量表制订将心理健康的等级评价变成计量资料;或者等级资料也可以直接降格作为计数资料使用。所以,下面主要介绍计
数资料和计量资料在实验变量上的不同组合,各自适用怎样的数据处理方法。
1.自变量为计数资料,因变量为计量资料
当研究者试图理解男女之间的反应时差异,或者不同民族的记忆广度有无差别时,就构成此类研究的例子。在整合这一类数据时,最恰当有效的统计工具是方差分析(ANOVA)。方差分析技术将对应自变量每个水平的因变量数据叫做一个组,并告诉研究者各组数据之间是否存在差异。方差分析是十分强大且常用的统计分析技术,甚至在数据形态并不严格符合这一方法的前提假设时(比如因变量的分布并不很好地符合正态),它也能较好地完成实验
数据的比较。
方差分析允许进行多自变量和多因变量的数据处理。多自变量的方差分析可以提供自变量间交互作用的信息;而多因变量的方差分析则构成所谓的多元方差分析,它能揭示所有因变量的线性组合是否随自变量的变化而呈现差异。方差分析技术的另一大优点在于,它能够通过引进协变量,构成协方差分析,从而对实验设计中无法直接排除或抵消的一些额外变量进行事后的统计控制。例如,研究者对某种策略能否增进记忆广度感兴趣,为此需要比较实验组和控制组在运用策略前后的记忆广度。但是研究者担心被试原先的记忆力水平会是一个重要的额外变量,却又很难将实验组和控制组被试在记忆力水平上严格匹配。方差分析允许研究者将被试原本的记忆力水平作为协变量引入统计分析,这样就能计算出排除了这一效应
以外的、纯粹由自变量操作引起的因变量变化是否具有统计显著性。
在一些结构最简单的实验中,如果自变量和因变量都只有一个,并且自变量只有两个水平,那么也可以选用t检验作为评价因变量均数差异的方法。而有关t检验、方差分析和协方差分析的具体操作过程,可以参考各类心理统计教材,在本书的附录中也能查到相应的说
明。
2. 自变量和因变量都为计量资料
当自变量和因变量都为计量资料时,比如研究记忆保持量如何随着学习次数增多而增
加,研究者可以考虑以下数据分析技术。
如果研究者愿意,当然可以将计量资料的自变量降级为计数资料使用。这样,上面所介绍的诸如方差分析和t检验等技术也都可以适用于此类情况。例如,研究者完全可以将学习次数分成较少、较多、很多三个水平,并进行方差分析,考察三种水平下记忆保持量是否存
在不同。
如果我们不希望将自变量降级使用,就应该选择一些基于相关的统计技术。需要指出的是,基于相关的统计分析,和此前我们所说的科学研究方法中的相关研究法,是不一样的概念。前者是实验数据的整合分析技术,实验设计本身已经保证了因果结论的可靠性;而后者
则并非实验研究,不能作出明确的因果结论。
心理学家常见的情况是:需要用多个计量资料的自变量来解释单个计量资料的因变量。这种情况下,多元回归是最合适的选择,它能够提供因变量对多个自变量的函数关系。一般来说,多元回归过程能同时提供多个备选的函数关系式,并提供每个关系式对实验数据的解
释能力,研究者可以结合自己的理论预期,据此作出选择。
3. 自变量为计量资料,因变量为计数资料
此类情况在心理学实验中并不常见。一般情况下,心理学家总是喜欢尽量选择等级较高的因变量,这是因为计数资料的因变量过于简单,不易显示出自变量操纵的影响。心理学实验中以计量资料为自变量、以计数资料为因变量的典型,有心理物理学的阈限测量实验。在这些实验中,自变量是可以量化表示并连续变化的物理刺激强度,而因变量即被试的反应则
只有两种:感受到和未感受到。
通常对于这类实验,研究者往往只是找到因变量变化的转折点,在阈限实验中就是求出阈限的值。不过,如果研究者仍然希望进行更深入的统计处理,那么可以选用的方法就是logistic回归。这一方法十分复杂,在心理学实验中的应用并不多见,若想学习关于
logistic回归的详细内容,可以查阅一些介绍高级统计方法的教材。
4. 自变量和因变量都为计数资料
这类实验是心理学实验中最为简单的类型,也是从数据解释潜力来看最薄弱的实验。比如,研究者仅仅想知道男女两性在特定情境下产生某一行为的概率是否存在差别,就会构成此类实验的例子。这是因为自变量是计数资料──男和女;因变量也是计数资料──产生行
为或不产生。
由于此类实验的所有数据都没有达到计量等级,因此在数据统计技术上留给研究者的选择余地较为狭窄,研究者只能从所谓的非参数检验中寻找自己需要的方法。对于上面的例子,较好的选择是进行卡方检验,这一方法能告诉研究者数据的频数分布(男女在产生特定行为上的比例)是否符合某一假定的分布(比如1比1,即男女的行为发生概率没有差异)。在此例中,如果卡方检验推翻了我们关于男女产生特定行为的概率1比1的虚无假设,也就意
味着男女间在这一行为的发生率上确实是存在差异的。
(五)撰写研究报告
撰写研究报告是心理学实验研究程序的最终步骤。关于怎样读和写实验报告,在本书的第三章会用整章篇幅专门进行介绍,这里仅列举撰写研究报告时必须注意的一些要点:(1)研究者需要回顾与研究有关的前人工作,无论前人的研究结果是否符合研究者本人的理论观
点;(2)研究者应该清晰明确地描述实验设计和研究过程,并报告实验所涉及的重要信息,如对自变量的操作定义等;(3)实验报告应能做到使专业领域的同行可以据此重复研究者的工作,以保证必要情况下研究结论能够得到科学的反复检验;(4)实验报告中的客观描述和研究者本身的主观解释应当能清晰地区分开来,这将有助于阅读者理解报告中哪些部分
属于实验结果,又有哪些是研究者对结果所作的解释。
总之,心理学的实验研究必须同时遵循科学原则和道德准绳。熟知心理学研究的伦理原则,能使研究者谨慎确定实验方案,不至于损害被试的权益。而按照心理学研究的一般程序开展研究计划,则能使研究者的工作更好地保持科学性,并方便同行之间的交流和相互论证
检验。