『 16 』 第8章 方差分析
边框中即可;Interaction:交互效应,即两个以上因素的交互作用对观测变量的影响,选择此项时,要同时选中两个以上变量,在点击中间箭头,此时右边框中会出现yrsscale*agerange字样,表示交互效应,本例中,选择了两个变量的主效应和它们的交互效应以后就等价于饱和模型了;对于后面的All 2-way到All 5-way表示从2次到5次的所有效应,这些选项使用很少。本例中只分析主效应,不选交叉效应,则选择两个变量,选Main effect选项。点击
按钮回到主对话框。
图8-7 模型选择对话框
3. 对比检验
对比检验可通过点击按钮进入图8-8对话框,选择控制变量,在下拉菜单中选择Simple后点Change就可以了,对于下拉菜单的选项,解释如下:
Diviation 表示检验观测变量总的均值和各水平上均值的差异,Simple 表示检验第一水平First或最后水平Last与各水平上均值的差异,Difference 表示当前水平上的均值和前一水平均值比较,Helmert表示当前水平均值和后一水平均值比较。这里我们对yrsscale变量进行Simple检验。点击到主对话框。
按钮回
图8-8 对比检验对话框
对所有进一步检验设置完成后点击下面我们来看多因素方差分析的结果。
完成操作。
8.3.3 多因素方差分析的结果分析
首先我们看没有进行进一步分析的多因素方差分析结果:
第二篇 SPSS与统计基础统计分析
表格8-11列出了每个控制变量的水平及在每个水平上有多少样本,由于各水平上样本数不同,在进行多重比较检验是只能选择LSD方法和Bonferroni方法。
表格8-12列出多因素分析重要结果,
第一行表示校正的模型,即总体结果,F统计量观测值为15.797,对应P值接近0,说明检验结果显著,即年龄段和工作经验各水平上总体均值(即平均工资)有显著差异。
第二行是截距项,没有明显的统计意义,可以不予关注;
第三行是年龄段各水平上总体均值是否显著差异,从结果来看,P值为0.879,不能拒绝原假设,年龄段各水平上总体均值无显著差异。
第四、五行和第三行类似分析,结论是工作检验各水平上总体均值有显著差异,交互作用各水平上总体均值无显著差异。
第六行是组内样本方差数据,第七行是样本总方差数据,第八行是校正以后的样本总方差数据。
表8-11 Between-Subjects Factors
Value Label
1 18-30
N 468 1582 861 221 460 752 729 539
年龄范围
2 31-45 3 46-65 1 小于等于5 2 6-10
工作经验(年)
3 11-15 4 16-20 5 21-35
6 大于等于36 210
表8-12 每小时薪水Tests of Between-Subjects Effects Source
Corrected Model
Type III Sum of Squares df 3086.856 336305.109 3.863 628.261 109.518 43545.092 1212879.422 46631.948 a
Mean Square 237.450 336305.109 1.931 125.652 18.253 15.031
F 15.797 22373.954 .128 8.359 1.214
Sig. .000 .000 .879 .000 .296
13 1 2 5 6 2897 2911 2910
agerange yrsscale
agerange * yrsscale Error Total
Corrected Total a. R Squared = .066 (Adjusted R Squared = .062)
『 18 』 第8章 方差分析
接下来,我们看多因素方差分析进一步分析结果:
首先是变换模型以后的检验结果,列在表8-13中比较表8-13和8-12,发现表8-13少了交互作用这一行,这是因为我们在模型选择中已经去掉了交互作用,检验结果类似,都是整体显著、工作检验水平上显著,年龄段水平上不显著。虽然结论一致,但是注意到具体统计量的值已经有所变化,这是因为我们少考虑了一个交互效应,交互效应的样本方差SSAB会分配到SSA和SSB中,使得这两个组间方差增大,从而导致较大的F统计量观测值和较小的P值出现。
表8-13 每小时薪水Tests of Between-Subjects Effects
Source Type III Sum of Squares
Corrected Model 2977.338
a
df
7 1 2 5 2903 2911 2910 Mean Square 425.334 798792.583 14.339 391.929 15.038
28.284 53119.129 .954 26.063
F
.000 .000 .385 .000
Sig.
798792.583
agerange 28.678 yrsscale 1959.647 Error 43654.610 Total 1212879.422
Corrected Total 46631.948 a. R Squared = .064 (Adjusted R Squared = .062)
接下来看多重对比检验,这里限于篇幅,仅列出LSD方法计算的多重对比检验,其余方法不列出。
表8-14 每小时薪水Multiple Comparisons
Mean Difference (I-J) Std. Error
-.8754* -1.6200* -2.2460* -3.2178* -3.5926* .8754* -.7446* -1.3707* -2.3425* -2.7172* .31739 .29672 .29778 .30975 .37370 .31739 .22954 .23091 .24615 .32295
第二篇 SPSS与统计基础统计分析
1.6200* .7446* -.6261* -1.5979* -1.9726* 2.2460* 1.3707* .6261* -.9718* -1.3465* 3.2178* 2.3425* 1.5979* .9718* -.3747 3.5926* 2.7172* 1.9726* 1.3465* .3747 .29672 .22954 .20156 .21885 .30266 .29778 .23091 .20156 .22029 .30370 .30975 .24615 .21885 .22029 .31545 .37370 .32295 .30266 .30370 .31545
从表8-14中我们可以看出,大于等于36岁和21-35两个水平上总体均值差异不显著,在其他水平上总体均值都是显著差异的。
最后来看看对比检验的结果,
表8-15 每小时薪水Test Results Source
Sum of Squares df
5 2903 Square 391.929 15.038 F 26.063
Sig. .000
Contrast 1959.647 Error 43654.610 从表8-15结果看,对比检验是显著的,说明工作检验中,各水平和最差一个水平相比,都是有显著的差异。
接下来我们来看对比检验的具体结果,限于篇幅,我们仅列出表格中差异值,P值等重要量,其余
『 20 』 第8章 方差分析
的一些量如置信区间、检验值等就不列出了,读者分析时可以看到这些值的结果。
表8-16 Contrast Results (K Matrix)
工作经验(年) Simple Contrast
Contrast Estimate
Level1 vs level6
Std. Error
Sig.
Contrast Estimate
Level2 vs level6
Std. Error
Sig.
Contrast Estimate
Level 3 vs. Level 6
Std. Error
Sig.
Contrast Estimate
Level 4 vs. Level 6
Std. Error
Sig.
Contrast Estimate
Level 5 vs. Level 6
Std. Error
Sig. a. Reference category = 6
a
Dependent Variable
每小时薪水 -3.863 2.754 .161 -2.741 1.070 .010 -2.365 .468 .000 -1.585 .367 .000 -.367 .350 .295 仅从表8-16结果来看,虽然整体来说,1-5水平上的总体均值和第6水平上的均值有显著差异,但是具体检验每一水平的总体均值,我们发现水平1和水平6上总体均值没有显著差异(P值为0.161),水平5和水平6上总体均值也无显著差异(P值等于0.295),其他水平上总体均值有显著差异。
比较表8-14和表8-16,我们发现表8-16的P值偏大,有些结论也与表8-14背离,其原因是表8-14的结果是采用多重比较统计量,其标准误差的计算涉及全部水平的样本,因此更准确;而表8-16的结果采用是类似两独立样本t统计量,其标准误差的计算只用到了要比较均值的两个水平样本,精确度较差。例如,我们观察表8-14中level1和level6标准差是0.3737,而在表8-16中则为2.754,放大了8倍左右,因此两个表中检验的结论就不一致了。当两个表中结论不一致时,我们应该以精度更好的表8-14多重比较检验的结果为准,而表8-16的检验结果仅作为参考。这也是很多书籍在介绍多因素方差分析时仅介绍多重比较检验,不介绍对比检验的原因。
8.4 协方差分析
细心的读者比较例8-1和例8-2也许发现了问题:在例8-1中,年龄段对护士平均工资是有影响的,