医学统计学
例题:某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度(?mol/L),结果见下表。问氟作业工人三个不同时间的的尿氟浓度有无差别?
氟作业工人三个不同时间的的尿氟浓度(?mol/L) 工人编号
1 2 3 4 5 6 7 8 9 10 (?Xij) 均数 xi ( ?X2ij)
工前 90.53 88.43 47.37 175.80 100.01 46.32 73.69 105.27 86.23 60.01 873.75 87.38
工中 142.12 163.17 63.16 166.33 144.75 126.33 138.96 126.33 121.06 73.69 1265.90 126.59
工后 87.38 65.27 68.43 210.54 194.75 65.27 200.02 100.01 105.27 58.95 1155.89 115.59
(?Xij) 320.03 316.78 178.96 552.67 439.51 237.92 412.67 331.61 312.65 192.65 3295.54(??X)
109.85 427280.91 (??X2)
88876.98 170744.12 167659.81
医学统计学
计算步骤:
(1) 建立假设和和确定检验水准
H0 :工人三个不同时间的的尿氟浓度相等 ?1 = ?2 = ?3 H1 :三组总体均数不等或不全相等 ?1 ≠?2 ≠ ?3 检验水准 ?=0.05
(2) 计算检验统计量F值
本例:校正数 C = (3295.54)2 / 30=362019.463 SS 总= ?X2 —C = 427280.91 – 362019.463= 65261.447
df总 = N-1 = 30-1 = 29
不同处理间:
?Cn(873.75)2(1265.90)2(115.89)2 ????362019.463?8182.893101010SS处理 ??(?Xij) df处理 = k-1 =3-1 =2 不同区组间:
n 22(320.03)(316.87)???...?362019.463?39712.98433SS区组??(?Xij)?C df区组 = n-1 =10-1 =9 SS 误差= SS 总- SS 处理- SS 区组
= 65261.447 - 8182.893 - 39712.984 = 17365.570 df误差= 29-2-9=18 MS 处理 = SS 处理/ df处理 =8182.893 / 2 =4091.447
医学统计学
MS 区组 = SS 区组 / df区组 = 39712.984 / 9 =4412.554
MS 误差 =SS误差/ df 误差 = 17365.570 /18 = 964.754 F 处理 = MS 处理/ MS 误差 F区组= MS 区组/ MS 误差
方差分析结果表
变异来源 SS 总变异 处理间 区组间 误差
65261.447 8182.893 39712.984 17365.570
df 29 2 9 18
MS
4091.447 4412.554 964.754
F
4.241 4.574
P
<0.05 <0.05
(3) 确定P值和作出推断结论 查表得P<0.01, 按?=0.05水准拒绝H0 ,接受H1.
(4) 结论:故可以认为工人尿氟浓度三个不同时间中至少两组是不同的,同时10个工人尿氟浓度有差别。
医学统计学
例2:白菜不同部位的维生素C值(毫克/%) 白菜编号
1 2 3 4 5
?Xiji白菜部位 菜心 30.52 30.10 18.18 15.46 21.10
115.36 2852.21 23.07
菜帮 24.32 24.18 16.78 10.13 10.59 86.00 1672.47 17.20
j
?Xj
Xi
54.84 54.28 24.96 25.59 31.69 201.36 4524.68
27.42 27.14 17.48 12.80 15.84
X..?20.14
?Xiji2Xj
1) 总校正数:
dfTotal?10?1?9?201.36?2C?10?4054.58
SSTotal?4524.68?4054.58?470.10SSTreatdfTreat5?2?1?122??115.36?86.00???5?4054.58?86.2022?4417.52?4054.58?362.9449dfBlocks?5?1?4SSBlocks??54.84?2??54.28?2??34.96?22??25.59?22??31.69?22
?4054.58SSError?470.10?86.20?362.94?20.96dfError?9?1?4?4医学统计学
方差分析表
方差来源 总变异 组间 行间 误差
自由度 9 1 4 4
平方和 470.10 86.20 362.94 20.96
均方 86.20 90.74 5.24
F 16.45 17.32
P <0.025 <0.01
均数间的两两比较
两个样本均数间的两两比较又称为多重比较(Multiple comparison), 当
经过方差分析,得出P<0.05的结果时,可认为样本所代表的总体均数存在差别,但由于涉及的对比组数大于2,若简单的使用t检验或u检验,会使犯第一类错误的概率 ? 增大,即可能把本来无差别的总体均数认为有差别。例如有5个样本均数(K=5),对每两个样本均数间的差别都作t 检验,可作
2c5?5!?102!(5?2)!次比较,若检验水准每次取
0.05,则每次比较不犯犯第一类
错误的概率为(1-0.05),10次比较都不犯第一类错误的概率为(1-0.05)10 =
10
0.5987,而此时犯第一类错误的概率不再是0.05, 而是1-(1-0.05)=1- 0.5987
= 0.4013,远大于0.05,因此,多个样本均数间的两两比较不能简单的使用t检验或u检验,此时有专门的计算方法。
Q(Student-Newman-Keuls multiple range test
q?xA?xBms误差11(?)2nAnB
x,xAB 为两个对比组的样本均数,ms式中:
nA,nB步骤:
误差
为方差分析中的误差均方
为两个对比组的样本例数。