4052 4999 5403 5625 5764 2 3 : : 12 13 : : 18.51 19.00 19.16 19.25 19.30 98.49 99.00 99.17 99.25 99.30 10.13 9.55 9.28 9.12 9.01 34.12 30.92 29.46 28.71 28.24 : : : : : : : : : : 4.75 3.88 3.49 3.26 3.11 9.33 6.93 5.95 5.41 5.06 4.67 3.80 3.41 3.18 3.02 9.07 6.70 5.74 5.20 4.86 : : : : : : : : : : 如果选择 ? = .05, Fcrit = 3.88 如果选择 ? = .01, Fcrit = 6.93
F比率的观测值11.28大于 Fcrit., 所以拒绝 H0 (?1 = ?2 = ?3). 报告结果
F(df组间,df组内) = Fobs, p < ?
\单因素方差分析发现学习方法有显著的效应, F(2,12) = 11.28, p < 0.01.\
注意:电脑的结果输出 会给出实际 p-值. 假设检验的逻辑 是必须事前预设Alpha水平. 如果选择了 .01, 就必须 将其用于所有的检验.所以,如果有两个实验, 电脑程序得到实验 1的 p值 = .001,实验 2的 p -值 = .01. 它们都在统计上显著. 假设检验是 yes/no 决策. 上例中,结论 都是 YES.实验 1 的结果并不比实验 2\更显著\
4. 事后检验(Post hoc tests)
ANOVA 的结果是检验H0: ?1 = ?2 = ?3 ,这是一个两点 (拒绝/不拒绝) 决策. 并未提供哪个备择假设得到支持. 也就是说, 只知道一些组与其它组不同, 但并知道差别在哪些组之间.
所以从ANOVA得到显著差异的结果 (拒绝H0)后,一定要做作 some 事后检验. 事后检验 使我们能够比较各组, 发现差异产生在什么地方.
事后检验就是比较每一个处理组与另一个处理组, 一次比较两个. 这称为成对比较.
在上例中, 可以比较 ?1 与 ?2, ?1与 ?3, 以及 ?2与 ?3. 这样的做法有没有问题?
每一个比较 都是一个单独的假设检验, 每一个都有犯I类错误的风险. 所以,比较对数越多, 作结论的风险越大。即容易发现实际不存在的差异。 这称为实验导致的(experimentwise)alpha 水平 (或族系(familywise) 误差)
αEW = 1 - (1 - a)c c = 比较对数
对于上述例子, 如果选择 ? = 0.05 作3 对比较
αEW = 1 - (1 - a)c = 1 - (.95)3 = 1 - .857 = .143
6
I类错误的机会增加到14.7%而不再是5%,多数事后检验设计中都控制了实验导致误差.
这里介绍两个事后检验: Tukey's HSD 检验 (honestly差异显著性) 检验和 Scheff 检验. a) Tukey's HSD 检验
可以计算出单一的值确定处理均值间的最小差异,考查此差异在统计上是否显著.
此检验要求各组有相等的样本容量. HSD = q * sqrt(MS组内/n)
q 值 可以从表中查出(附表6). 需要用到K和 df组内, 以及αEW
在上例中 (用αEW = .05):
HSD = q * sqrt(MS组内/n)=(3.77) sqrt(1.33/5) = (3.77)(.516) = 1.94
比较 1: H0: ?1 = ?2
2 -1 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0,拒绝 H0 比较 2: H0: ?1 = ?3
3 -1 = 1.0 - 1.0 = 0.0
HSD = 1.94 > 0.0,不能 拒绝 H0 比较 3: H0: ?2 = ?3
2 -3 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0, 拒绝 H0
所以 B 与 A 和 C不同,而A 与 C 没有差异
b) Scheff?检验
用F比率检验差异. 这是最保守的检验 (降低 I类错误的风险, 但增加II类错误的风险). 特别适用于n 不等的情况
重新计算 MS组间, 每次只检验一个比较.注意:用整体的 df组间 和整体的MS组内.
研究方法 方法 A 方法 B 方法 C 只读课本 只作笔记 借别人笔记 0 1 3 1 0 T1 = 5 n1 = 5 1 = 14 3 6 3 4 1 2 2 0 0 T2 = 20 T3 = 5 n2 = 5 2 = 4SS1 = 6 SS2 = 6 SS3 = 4 n3 = 5 3 = 1 7
来源 处理间 处理内 总的
SS 30 16 46
df 2 12 14
MS 15.0 1.33
F = 11.28
比较 1: H0: ?1 = ?2
222
SS组间 == 5/5+20/5-25/10 = 22.5 MS组间 = = 22.5/2 = 11.25 MS组内 = = 16/12 = 1.33
F比率 = MS间 = 11.25/1.33 = 8.46 MS组内 查 F表. ? = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝 H0 比较 2: H0: ?1 = ?3 SS组间== + - = 0 MS组间 = = 0/2 = 0
MS组内 = = 16/12 = 1.33
F比率 = MS间 = 0/1.33 = 0 MS组内
查 F表. ? = .05, Fcrit(2,12) = 3.88 0 < 3.88, 不能拒绝 H0 比较 3: H0: ?2 = ?3
222
SS组间 ==5/5+20/5-25/10 = 22.5 MS组间 = = 22.5/2 = 11.25 MS组内 = = 16/12 = 1.33
F比率 = MS间 /MS组内 = 11.25/1.33 = 8.46 查 F表. ? = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝 H0
注意: 与t-检验的关系
差异间独立样本 t-检验与两个水平的单因素组间 ANOVA有和区别? 没有. F比率 = t2
差异间t-检验和 ANOVA, t-检验是考察两个均值间的差异ANOVA 是考察方差. 如果只有两个组, t 统计量的平方就是F 统计量.
例:一位研究者研究三种键盘设计。记录了三组被试的错误次数:
键盘A: 0 4 0 1 0 键盘B: 6 8 5 4 2 键盘C: 6 5 9 4 6
键盘类型对打字错误有无显著的影响?
8