lXY??b?X???Y??15.96?249.01?XY??594.25??97.48
n8lXY97.48??6.42 lXX15.18a?Y?bX?31.13?6.42?2.00?18.29
回归系数假设检验:
H0:??0,即氟含量与患病率之间无线性关系 H1:??0,即氟含量与患病率之间有线性关系 ??0.05
SS总?lYY?718.028
lXY97.482 SS回???625.983
lXX15.18 SS剩?SS总?SS回?718.028?625.983?92.045
①方差分析(见表):
方差分析表
变异来源 回归 剩余 总变异
SS 625.983 92.045 718.028
df 1 6 7
MS 625.983 15.341
F 40.805
P <0.01
2计算得F?16.147,查F界值表,得P<0.01,按??0.05水准,拒绝H0,接受H1,可认为氟含量与患病率间有直线关系。 ② t检验:
H0:??0,即氟含量与患病率之间无线性关系 H1:??0,即氟含量与患病率之间有线性关系 ??0.05
SS总?lYY?718.028
lXY97.482 SS回???625.983
lXX15.18 SS剩?SS总?SS回?718.028?625.983?92.045
2SS剩92.05??3.92 n?28?2b?0b6.42t????6.38
SbSY?XlXX3.9215.18SY?X? 按v?6,查t界值表,得P?0.001,按??0.05水准,拒绝H0,接受H1,结论同
??a?bX?18.29?6.42X来上。本题F?40.81?6.39?t,故可用直线回归方程Y描述患病率与增加氟含量的关系。
?)绝对值特大的观测数据见表 异常点即对应于(Y?Y残差的计算
? Y?Y? 序号 X Y Y1 0.47 22.37 21.31 1.06
2 0.64 23.31 22.40 0.91 3 1.00 25.32 24.71 0.61 4 1.47 22.29 27.72 -5.44 5 1.60 28.57 28.56 0.01 6 2.86 35.00 36.65 -1.65 7 3.21 46.07 38.90 7.17 8 4.71 46.08 48.53 -2.45
由散点图及残差分析,第一点(X=1.47,Y=22.29)为可疑的异常点。 根据以上的计算结果,进一步求其总体回归系数的95%可信区间。 总体回归系数?的95%可信区间
(b?t0.05,(n?2)Sb,b?t0.05,(n?2)Sb)?(6.42?2.447?3.9215.18,6.42?2.447?3.9215.18)?(3.96,8.88)
按回归系数的95%可信区间下限和上限分别代入a?Y?bX,得a1?23.21,a2?13.37。回归系数的95%可信区间上、下限对应的两条直线,回归方程为:
??Y?23.21?3.96X,Y?13.37?8.88X
(3)估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并说明含义。
SY?SY*X1n?(x0?X)(X?X)2?3.9218?(2.00?2.00)215.18?1.39
当X=2.00mg/L时,?Y?的95%可信区间:
??t?(Y?,Y?t0.05/2,6SY?)=(31.13-2.447×1.39,31.13+2.447×1.39)=(27.73,0.05/2,6SY34.53)
即总体中,氟含量为2.00mg/L时,患病率平均增加31.13mg/L,其95%的可信区间为(27.73,34.53mg/L)。
其含义为:当氟含量为2.00mg/L时,相应的平均增重服从一个正态分布(此正态分布的样本均数估计值为31.13mg/L),如果从此正态分布中重复抽样100次,这100个可信区间中理论上将有95个区间包含真正的总体均数(虽然这个总体均数真值是未知的)。 (4)求氟含量2.00mg/L时,患病率Y值的95%可信区间,并解释其含义。
SY?SY*X1?1n?(x0?X)(X?X)2?3.921?18?(2.00?2.00)215.18?4.16??18.29?6.42X?31.13,个体Y值的95%可信区间: 当x=2.00mg/L时,Y??t??t(YS?,YS?)=(31.13-2.447×4.16,31.13+2.447×4.16)=(21.95,
0.05/2,6Y0.05/2,6Y41.31)
即估计,总体中,氟含量为2.00mg/L时,由95%的患病率增加体重在20.95,41.31mg/L范围内。