比较这类资料时,要先求出各个体实验前、后的差数,然后求出各差数的平均数及标准误。和所有统计推理一样,第一步作无效假设,即假设实验处理是什么作用。依据这一假设,实验处理前后差数应等于0,而现在的实际观测差数的平均数为X?检验这X与0之间有无显著性差异。第二步实际计算。第三步站在n%意义层级上讲话,看是否拒绝无效假设。
比较同一批实验对象实验前、后差异是否有显著性的计算公式是:? 3. 比较二个样本的平均差异的显著性
设两个母样都是常态分布,标准误差相等,各自抽取一个子样,子样的容量为n1和n2,子样平均值为X1和X2,子样标准差为S1和S2,可以证明统计量:? 上述t值计算公式也可写为:?
检验二个子样是否来自母体平均数相等的常态母体的步骤亦可分为三步: 第一步,先作无效假设; 第二步,按公式算出t值;
第三步,按照采取的信度(如5%)查t分布表,自由度为(n1+n2-2)。如果t值大于信度水平,则可认为两个母体平均数是有差异的。 (三)F检验
F检验(或F检定)(Ftest)是以数据的方差(变异数)分析为基础,故又称方差分析(或变异数分析)。
上面讲到的t检验法只能对两组的平均数加以比较,而方差分析法却能对二组和二组以上的平均数加以比较。F检验的功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。 1. 方差分析的基本原理
方差分析(或变异数分析)(analysisofvariance,简称ANOVA)是一种应用非常广泛的变量分析方法,它乃是用试验结果的观察值与其平均值之差的平方和,来分析某些因素对试验结果是否有显著影响。设所考察的因素为A,把A的变异分成b个等级,每一等级重复a次试验,以Xij表示第j个等级第i次试验的观测值(指标),于是得到单因素分析的一个子样,容量n=ab, 则上式分解式就是S总=S误+SA。
此式说明围绕总共平均值的波动值S总由两部分组成:一部分表示偶然误差引起的数据波动值S误, 一部分为因素取不同等级引起的数据波动值SA。
有了上述各等式,我们就可进行F检验。为了检验因素A的不同等级对试验结果的影响是否显著,我们只要比较S误和SA的大小就行了。设所考察的指标的母体服从常态分布
2. 单因素方差分析
只考虑一个因素的变异对试验结果是否有显著影响的问题,就是单因素方差分析(simplefactoranalysisofvariance)的问题。进行F检验法时,常将实验数据列成下列方差分析表,计算起来比较方便(见表2-22)。
从表2-22可以看出组与组间变差的平方之和与组内变差的平方之和相加得总的平方之和。这个总的平方之和相当于以前在未加分组的情况下所算得的Σ?相同,现在却可以划分为两部分了。自由度照样依此划分为两部分。 3.双因素方差分析
方差分析中,最常见双因素方差分析(twofactorsanalysisofvari-ance)。 (四)X2检验
X2检验(或X2考验,卡方检定)(chi-squaretest)是比较观察次数与理论次数之间的差异的统计方法。
在统计学中,检验分为参数检验(parametictest)和非参数检验(nonparametictest)。 前者如某一总体指标是否等于某一数值;后者如某一随机变量是否服从常态分布。
在以实用常态分布和t分布作为准则尺度去检验统计假设时,这些假设都是有关参数的假设。为了使得
检验结果有效,它们都需要在事件假定与检验对象相适应的特种分布形态。
另一些统计检验是用来检验分配,而不是用来检验参数的。它们所检验的分配在先验的假定上并不要求具有一定的形态,故称为自由分配’而用来作假设检验的准则量数就叫非参数的统计量数。X2即属于这种非参数统计(nonparameticstatistics)之列。 X2的定义可用下式表达之:
【:实际值(或实计数)T:理论值(或预计值)Σ:总和n:计数组】 自由度越大,其分配形态便越接近于常态。 在进行X2测验时应注意以下几点:
1.计算X2值过程中,必须用绝对值,切不可用相对数,因X2值的大小与频数有关。
2.做X2检测时,应先检查每一格的理论值是否够大,如理论值小于5时,应将附近两组或几组合并使用数值增大后,再进行X2测验,否则易导致错误结论。当只有两项对比(4格)而不能合并时,如理论值小于5,则应进行校正。校正公式为(其他公式可参考统计专著):
3.这只列举了X2测验的基本公式。从此基本公式还可根据不同需要演变成许多公式,使计算更为简捷。
非参数统计方法有许多优点,除了可以应用于许多总体分布不明确的情况外,由于非参数统计方法在收集资料时可用“等级”或“符号”来评定观察结果,因而收集资料也十分方便,在分析时也可以应用“等级”或差异的“正负号”,因而一般都比较简便而易于掌握,但如果资料的总体分布接近某一有标准理论的分布(如常态分布),或资料可以转换成这种分布,那么非参数方法效果较差。此时如无效假设是正确的,非参数法与参数法一样好;但如无效假设是错误的则非参数法效果较差,如需检验出同样大小的差异往往要较多的资料。 本章摘要
1.实验设计乃是进行科学实验前做的具体计划。它主要是指控制实验条件和安排实验程序的计划。它的目的在于找出实验条件和实验结果之间的关系,做出正确的结论,来检验解决问题的假设。
2.实验设计根据自变量的多少,各自变量内处理水平的多少,和被试情况的不同,而构成不同类型的实验设计。
3.实验设计大体上分为三类:被试者内设计,被试者间设计,混合设计。被试者内设计乃是指被试者在自变量发生变化的所有情况下接受实验。被试者只接受多个自变量情况中的一个,即不同的被试者接近不同自变量的情况,则称为被试者间设计。兼有被试者内设计和被试者间设计的实验设计为混合设计。 4.多自变量是指一个实验中包含有两个或两个以上的自变量。它不是指同一自变量的多个水平。多自变量实验具有三个明显的优点:(1)工作效率高;(2)实验的控制较好;(3)实验结果更有价值。 5.当一个自变量的水平受到另一个自变量的水平的不同影响时,交互作用就发生了。在有交互作用的情况下,分别讨论每一自变量的效应就不够了。此情况下还必须分析讨论出现交互作用的原因和后果。 6.多因素实验设计是指在同一实验里可以同时观测两个或两个以上自变量的影响,以及自变量与自变量交互作用效果的实验设计。在心理学实验中,居多的是多因素实验设计。
7.拉丁方设计是多自变量实验设计中较为常用的设计方案。只要是实验中自变量的个数与实验处理水平数相同,而且这些自变量之间没有交互作用存在时,都可采用拉丁方设计方案。拉丁方设计能抵消实验中因实验顺序、被试差异等所造成的无关变量的效果。
8.统计表是对被研究的心理现象和过程的数字资料加以合理叙述的形式。它在叙述统计资料方面有着重要作用,有人称之为统计的速记。统计表是由表题、横行和纵栏、数字资料等要素组成。统计表可以以形式及内
9.统计图乃是依据数字资料,应用点、线、面、体、色彩等绘制成整齐而又规律,简明而又数量化的图形。常用的统计图形有曲线图、条形图、直方图、点图、圆形图等等。
10.偶然误差是指实验中无法控制的偶然因素所引起的误差。有时在实验中还会出现另一种类型的误差,它的观测值不是分散在真值的两侧,而是有方向性或系统性的,这就是系统误差。
11.对数据的概括了解,在统计学上常由二种趋势来度量,一为集中趋势,一为离中趋势。度量集中趋势的统计量称集中量,度量离中趋势的统计量称差异量。集中量有平均数、中数和众数。差异量有全距、平均差、四分差、百分位差、标准差和方差等。
12.显著性检验的主要用途是检验两个或两个以上样本的统计量是否有显著差别。一般可按三步进行检验。第一步,提出假设或假定样组的平均数是从全域中取出来的。第二步,通过实际计算,求出t、F、或x2
等值。第三步,对假设作出取舍的决定。
13.在心理学实验中,两项实验结果之差,有时是随机引起的差异,有时则是由自变量所造成的。t检验就是分辨随机差异与自变量引起的差异的常用手段之一。
14.F检验是以数据的方差分析为基础的,故又称方差分析。t检验只能对两组的平均数加以比较,而方差分析能对二组或二组以上的平均数加以比较。
15.在统计学上,检验分参数检验和非参数检验。x2检验属于非参数的统计量数。它所检验的分配在先验的假定上并不要求具有一定的形态。