o Degree下拉列表 和Polynomial复选框配合使用,可选则从线性趋势一直到最高五
次方曲线来进行检验。
o Coefficients框 定义精确两两比较的选项。这里按照分组变量升序给每组一个系数
值,注意最终所有系数值相加应为0。如果不为0仍可检验,只不过结果是错的。比如说在下面的例7.2中要对第一、三组进行单独比较,则在这里给三组分配系数为1、0、-1,就会在结果中给出相应的检验内容。
【Post Hoc钮】
弹出Post Hoc Multiple Comparisons对话框,用于选择进行各组间两两比较的方法,有:
o Equar Variances Assumed复选框组 一组当各组方差齐时可用的两两比较方法,共有
14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
o Equar Variances Not Assumed复选框组 一组当各组方差不齐时可用的两两比较方
法,共有4种,其中以Dunnetts's C法较常用。
o Significance Level框 定义两两比较时的显著性水平,默认为0.05。 【Options钮】
弹出Options对话框,用于定义相关的选项,有:
o Statistics复选框组 选择一些附加的统计分析项目,有统计描述(Descriptive)和方
差齐性检验(Homogeneity-of-variance)。
o Means plot复选框 用各组均数做图,以直观的了解它们的差异。
o Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的
变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。
7.5.2 分析实例
例7.2 某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?
石棉肺患者 可疑患者 非患者 1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0
2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4
2.9 3.2 2.7 2.8 2.7 3.0 3.4 3.0 3.4 3.3 3.5
解:设数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为X。此处先进行单因素方差分析,然后进行两两比较,这里选择S-N-K法进行两两比较。操作如下:
o Dependent List框:选入X o Factor框:选入group
o Post Hoc钮:选中S-N-K复选框:单击Continue钮 o 单击OK钮
7.5.3 结果解释
上题的输出结果如下: Oneway
上面实际上是一个典型的方差分析表。给出了单因素方差分析的结果,可见F=84.544,P<0.001。因此可认为三组矿工用力肺活量不同。上表的标题内容翻译如下: Post Hoc Tests
Homogeneous Subsets
上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,石棉肺患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1.000(自己和自己比较,当然绝对不会有差异了)。
第四章:征服一般线性模型
――General Linear Model菜单详解(上)
§8.1 两因素方差分析
例8.1 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?
区组号 A营养素 B营养素 C营养素
1 2 3 4 5 6 7 8
50.10 47.80 53.10 63.50 71.20 41.40 61.90 42.20
58.20 48.50 53.80 64.20 68.40 45.70 53.00 39.80
64.50 62.40 58.60 72.50 79.30 38.40 51.20 46.20
根据统计分析的要求,我们建立了三个变量来包括上述信息,即group表示区组,food代表使用的营养素,weight表示最终的重量,即:
group food weight 1 1
1 2
50.01 58.20
依此类推。
8.1.1 univarate对话框界面说明
这里只有一个结果变量weight,要采用univarate对话框,如下所示:
在上面的这些框框钮钮中,最常用的有:Dependent Variable框、Fixed Factors框、Model钮、Post Hoc钮,下面我们来一一解释。 【Dependent Variable框】
选入需要分析的变量(应变量),只能选入一个。这里我们的应变量为weight,将他选入即可。
【Fixed Factors框】
即固定因素,说的通俗一些,就是--哎呀,我都不知道怎么解释好了,这样,如果你搞不明白,那么绝大多数要分析的因素都应该往里面选。这里我们要分析的是group和food两个变量,把他们全都给我抓进去!
固定因素指的是在样本中它所有可能的取值都出现了,比如例中的food,只可能有1、2、3这三个值,并且都出现了,就被称作固定效应;而相对应的随机效应的因素指的是所有可能
的取值在样本中没有都出现,或不可能都出现,如本例中的group,实际上总体中当然不可能只有这8窝,因此要用样本中group的情况来推论总体中group未出现的那些取值的情况时就会存在误差,因此被称为随机因素。我这里让group也选入固定框是基于下面的事实:这样做统计分析的结论是完全相同的。不同的只是推论的那部分。 【Random Factors框】
用于选入随机因素,如果你弄不明白,假装没看见他就是了。 【Covariate框】
用于选入协方差分析时的协变量,现在还用不到,不过下一个例子我们就要给他送礼了。 【WLS Weight框】
即用于选入最小二乘法权重系数。别理他,根据我的理解,只有统计分析的变态狂才会想起来用他! 【Model钮】
单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Full factorial,即分析所有的主效应和交互作用。我们这里没有交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的custum,这时中部的Build Term下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。这里我们只能分析主效应:选择main,再用黑色箭头将group和food选入右侧的model框中,如果对这段叙述不太清楚,请参考下面的动画。
该对话框中还有两个元素:左下方的Sum of squares框用于选择方差分析模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可。 【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少,反正我都没用过,就干脆就不介绍了。
【Plots钮】
用于指定用模型的某些参数作图,比如用food和group来作图,用的也比较少(指国内,因为它主要是用来做模型诊断用的)。 【Post Hoc钮】
该按钮弹出的两两比较对话框和第7章单因素方差分析中的一模一样,不再重复。本题对food作两两比较,方法为SNK法。 【Save钮】
将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保存的东东有预测值、残差、诊断用指标等。 【Options钮】
当然是定义选项啦!可以定义输出哪些指标的估计均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。
好了,都解释完了,再重复以下,我们所作的操作为:
1. Analyze==>General Lineal model==>Univariate 2. Dependent Variable框:选入weight 3. Fixed Factors框:选入group和food 4. Model钮:单击
5. Custom单选钮:选中
6. Model框:选入group和food 7. 单击OK
8. Post Hoc钮:单击
9. Post Hoc test for框:选入food 10. SNK复选框:选中 11. 单击OK 12. 单击OK 8.1.2 结果解释
按照上题的操作,结果输出如下: Univariate Analysis of Variance
这是一个所分析因素的取值情况列表,没有什么不好懂的。