第二篇 SPSS与统计基础统计分析
表8-7 Contrast Coefficients
年龄范围
Contrast
18-30 31-45
1 1 -.5 46-65 -.5
表8-8 Contrast Tests
Contrast
Assume
每小时薪水
variances
Does not assume equal variances equal
Value Contrast -1.4253
of
Std. Error
t
df
Sig. (2-tailed) .000
1 .20137 -7.078 2908
1 -1.4253 .20129 -7.081 681.958 .000
表8-7和表8-8列出先验对比检验的结果,表8-7列出先验对比检验的检验系数,系数确定了是18-30岁年龄段护士平均工资和31-45岁、46-65岁两个年龄段护士平均工资的平均数做检验,从表8-8检验结果来看,由于方差是齐的,因此看第一行结果,显然检验统计量t观测值为-7.078,说明18-30岁年龄段护士平均工资低于另外两个年龄段工资的平均数。检验概率P值接近于0。显然小于显著水平,应该拒绝原假设,认为两组工资的差异是显著的。即年轻护士的平均工资显著少于中年和老年护士。
8.3 多因素方差分析
和单因素方差分析不同,如果我们需要研究两个以上控制因素是否是对观测变量有显著影响,将采用新的方法,由于考虑了多个控制因素,所以叫做多因素方差分析;多因素方差分析模型比单因素方差分析模型复杂,因为不仅要分析单个控制因素独立的对观测变量的影响(相当于多个单因素方差分析),而且还要考虑多个控制因素的交互作用对观测变量的影响,我们将在后面的叙述中详细解释这种差异。下面我们仍然从一个具体的例子来认识多因素方差分析的模型和假设检验过程。让读者了解多因素方差分析的具体操作步骤和结果解释。
8.3.1 引例:多因素方差分析概述
本小节中,我们将从具体的一个例子出发,研究多因素方差分析的模型、假设检验过程、和主要注意的问题。请看下面的例8-2:
例 8-2 继续例8-1研究护士小时工资的问题,将护士的小时工资作为观测变量,现在控制变量我们考察两个:年龄段和工作经验,请对护士工资进行多因素方差分析。(数据见光盘8-2.sav) 在例8-1中,已经证明了年龄段对护士工资有显著影响,现在增加了工作经验这一新的控制因素,分析时不仅要考虑年龄段和工作经验单独对护士工资的影响,还需要检验这两个变量控制变量是否有交互作用,其交互作用是否也要影响护士工资。因此多因素方差分析模型比单因素方差分析模型更加复杂,需要检验的因素也更多。
『 12 』 第8章 方差分析
多因素方差分析的模型我们简要说明如下:
假设观测变量可能受两个控制因素A、B的影响,其中因素A有p个水平,因素B有q个水平,则两个因素的交叉将观测变量分成了p×q个水平,每个水平的观测变量的样本我们可以描述为:
Xijk??i??j??ij??ijk,i?1,2,...,p;j?1,2,...,q;k?1,2,...,nij
式中,Xijk表示因素A的第i个水平,因素B的第j个水平中第k个样本;?ijk表示相应的随机误差,服从正态分布;而?i,?j分别表示因素A和因素B各自在i、j水平上的总体均值,代表了因素独立的影响;而?ij代表了两个因素的i、j水平的交互作用对观测变量样本的影响。本例中p=3,q=5。
当因素A对观测变量没有显著影响时,?i等于常数,此时变量主要受因素B和交互作用及随机作用影响,因素A不是主要影响因素;同理可以分析因素B,交互作用AB……
对于因素的影响,和单因素方差分析一样,仍然是从样本方差入手,只是现在计算的样本方差更多,我们对样本方差SST的分解为:
SST????(Xijk?X)2?SSA?SSB?SSAB?SSE
i?1j?1k?1pqnij式中,nij表示观测变量在因素A的i水平,因素B的j水平样本数。有
?ni?1pij?n?j,?nij?ni?,??nij?n
j?1i?1j?1qpq式中ni?,n?j分别代表观测变量在i、j水平边际样本数,n代表样本总数。其它统计量可以定义为:
SSA???nij(X?X)??ni?(XiA?X)2
Ai2i?1j?1i?1pqqpqp2SSB???nij(X?X)??n?j(XB?X) jBj2i?1j?1j?1SSE????(Xijk?XijAB)2
i?1j?1k?1pqnijSSAB?SST?SSA?SSB?SSE
对交互作用,我们直观解释如下,如果因素A水平发生变化,例如从水平1变化到水平2,如果无论因素B取哪个水平,观测值变量要么同时增加,要么同时减小,即因素A的变化就可以决定观测值的变化,此时称A、B无交互作用;反之,如果因素A从水平1变化到水平2,观测值在B的不同水平上
第二篇 SPSS与统计基础统计分析
变化方向不同,在有些水平上增加,在有些水平上减小,即需要A、B交叉的水平才能确定观测变量的变化,此时称A、B因素存在交互作用,下面的表8-9和8-10可以帮助读者更好理解交互作用。
表8-9 无交互作用的观测变量在各因素取值
A因素水平1 A因素水平2
B因素水平m B因素水平n
表8-10 有交互作用的观测变量在各因素取值
A因素水平1 A因素水平2
B因素水平m B因素水平n
表8-9中,因素A水平从1到2时,无论因素B取m水平还是n水平,观测变量的值都上升,反过来当因素B水平由m到n时,无论A取何水平,观测变量的值都上升,此时两因素无交互作用。 表8-10中,因素A水平从1到2是,观测变量在因素B的m水平上增加,n水平减少,即是说需要因素A、B共同的水平,例如:1×m→2×m,观测变量值增加;1×n→2×n,观测变量值减小,此时两因素有交互作用。
多因素方差分析就是要检验这些各因素单独的影响和因素之间的交互影响是否存在,我们需要利用样本方差构造统计量完成假设检验,假设检验基本步骤为:
提出假设检验原假设:多因素方差分析原假设为各因素的各水平下,观测变量各总体均值无显著差异,用公式表达为:
3 8 7 5 3 5 7 10 H0:?1??2?...??p??,?1??2?...??q??,?ij?0,i?1,...,p,j?1,...,q
选择检验统计量:和单因素方差分析相同,多因素方差分析也是选用F统计量,针对三个不同的原假设,需要构造3个不同的统计量:
FA?SSA/(p?1)MSA ?SSE/(n?pq)MSESSB/(q?1)MSB?
SSE/(n?pq)MSEFB?FAB?SSAB/(p?1)(q?1)MSB?
SSE/(n?pq)MSE从上面式中看出,各统计量的构造形式和单因素方差分析基本一致,只是其中具体计算公式有所不
同,统计量的构造体现了多因素方差分析的思想。在原假设为真时,这些统计量都服从不同自由度的F分布。
『 14 』 第8章 方差分析
计算样本统计量观测值和概率P值,SPSS会自动计算各统计量观测值和对应的概率P值,并以表格的方式输出。
根据P值,进行统计检验。如果P值大于显著水平,则不能拒绝原假设,仍为因素水平上没有显著差异,如果P值小于显著水平,当然就要拒绝原假设,认为在各因素水平上有显著差异。注意,此处有三个统计量,因此要计算三个P值,完成三个检验,分别对应A、B因素各自的影响和AB交互作用的影响。
三个因素的多因素方差分析和两个因素的多因素方差分析类型,只是模型更加复杂,需要检验的统计量更多,例如:三因素时,样本方差的分解为:
SST?SSA?SSB?SSC?SSAB?SSAC?SSBC?SSABC?SSE
共需考虑7个统计量,完成7个假设检验。
本例中,年龄段有3个水平,工作经验有5个水平,两者交叉就有15个水平,我们要检验工资在年龄段因素、工作经验因素各水平上均值是否显著差异,还要检验均值在两因素有交互作用的水平上差异是否显著。需要运用3个建设检验。
多因素方差分析同样需要满足第8.1.2列出的三个条件,只是验证起来更加繁琐,就本例来说共需要验证3+5+15=23次正态性和23次方差齐性检验。下面我们来看完成此功能的SPSS操作。
8.3.2 多因素方差分析的SPSS实现
由于篇幅关系,本小节不再列出对方差分析条件的验证,请读者仿造8.2节相关内容进行验证,需要强调的是,这个验证过程不能省略,否则在不知道是否可以运用方差分析的情况下强制使用方差分析,可能带来更大的误差。下面我们仅介绍多因素方差分析的操作。
Step1:选择【Analysis】菜单→【General Linear Model】菜单→【Univariate】菜单
在图8-5的主对话框中,Dependent Variable框中代表观测变量,Fixed Factor(s):代表固定效应,即人为可控的控制变量,Random Factor(s):代表随机效应,即人为不可控制,但是取值是有限个,可以作为控制因素的控制变量。Covariate(s):代表协变量,我们将在8.4节中进行介绍,而WLS Weight表示选择加权最小二乘方法的加权变量。右边有5个按钮用于多因素方差分析进一步分析使用。
Step2:选择观测变量和控制变量
将变量“每小时薪水(hourwage)”选入观测变量框Dependent Variable中,将变量“年龄范围(agerange)”和“工作经验(yrsscale)”选入控制变量框Fixed Factor(s):中,因为这两者都是固定效应而非随机效应的。设置完成后点击
完成操作。
第二篇 SPSS与统计基础统计分析
图8-5 多因素方差分析主对话框
另外,和单因素方差分析一样,多因素方差分析也有进一步分析,只是其中有些功能很少用到,我们就不介绍了,我们只重点介绍进一步分析的几个重要分析。
1. 多重比较检验
多重比较检验和一元方差分析一样,这里就不对方法进行介绍了,只是看看菜单界面有什么不同。点击进入图8-6对话框,对话框中所提供的多重比较检验的方法是一样的,只是多了多种比较检验变量的选择,由于前面已经做过年龄的,我们这里做工作经验的多重比较检验,将变量“yrsscale”选入Post Hoc Tests for:框中,选择LSD和Bonferroni方法,点击点击
按钮回到主对话框。
图8-6 多重比较检验对话框
2. 模型选择
这是多因素方差分析比单因素方差分析增加的功能。SPSS默认是对所有的影响作用都要做检验,例如本例是2个因素,就需要做3个假设检验,分析控制变量主效应和交互效应。这种考虑了所有情况的模型称为饱和模型,如果不选择模型,则SPSS按默认的饱和模型完成多因素方差分析。
我们可以通过点击按钮进入图8-7模型选择对话框,在Specity Model单选框组中选择Custom即自定义模型,我们可以选择Build Terms框中的Type下拉菜单有6个选项,下面分别介绍如下:
Main effect:主效应,即控制因素单独对观测变量的影响,选择此项时只需直接将控制变量选入右