度为X轴,以测定结果为Y轴做图,在图上标出针对每个样本的测定值及每个浓度水平的测定均值,手工或用计算机做图将均值点相连,观察数据点与直线间的偏差,如偏差过大,表明数据组存在明显非线性,需要对测定过程进行检查,排除因操作错误所至误差,并对样本进行重新测定。如图形与直线接近,表明可对数据组继续进行统计分析。
3.3 剔除离群值
离群值可由散点图初步判断,标准中建议采用格拉布斯(GRUBBS)法进行离群值检验。检验步骤如下:
每组数据中有4个测定结果,分别记为 y1,y2,y3,y4。
(1)将4个测定值按大小顺序排列,最大值记为max,最小值记为 min; (2)由4个测定值计算均值 和标准差S:
=(y1+y2+y3+y4)/4;
(3)根据可疑值 max或 min分别按下式计算统计量t:
t1 = (max-)/S,t2 = (min-)/S;
(4)根据给定的显著性水平a和重复测定次数查表得临界值; (5)如t值大于临界值,则相应的可疑值为离群值。
Grubbs检验临界值(Ta)值表
样本显著性水平 数 样本显著性水平 数
0.05 0.025 0.01 0.005 0.05 0.025 0.01 0.005 3 1.153 1.155 1.155 1.155 4 1.463 1.481 1.492 1.496 3.4 进行多项回归分析
对数据组进行多项回归分析,得到一级、二级与三级多项式。一级多项式为直线,二级多项式表示上升曲线或下降曲线,三级多项式表示S形曲线(在测量范围两端具有明显的非线性)。
多项式方程如下:
级数 多项式 回归自由度(Rdf) 一级 Y = b0 + b1X 2 二级 Y = b0 + b1X + b2X2 3 三级 Y = b0 + b1X + b2X2 + b3X3 4
3.5对回归方程进行线性检验
多元回归方程中以bi表示的系数为回归系数。在二级与三级方程中,b2与b3为非线性系数。对回归方程进行线性检验就是对每个非线性系数作t检验,判断回归系数与零是否有显著性差异。b0与b1不反映非线性,故不需对其进行检验。对b2与b3的检验方法如下:
计算统计量t,计算公式为:
t = bi/ SEi
其中,SEi 为每个非线性系数的斜率标准误,计算公式为:S
其中,Y为回归方程预测值,与为测定均值。
由公式df = L*R-Rdf 计算自由度,L为样本数,R为每个样本的测定次数,Rdf为回归自由度,即回归方程中系数(包括b0)的个数。如测定5样本,每个样本重复测定4次,则对测定数据进行回归分析后其三级多项式中L=5,R=4,Rdf=4,df=5*4-4=16。在t值表中寻找t界值(双边检验,α=0.05),将计算出的t值与界值比较,如p>0.05,表示非线性系数与零无显著性差异,数据组被认为具线性,此时可对数据组进行精密度检验,具体方法见后。当精密度符合线性判断要求时,数据分析可结束。如p<0.05,表示此非线性系数具有统计学显著性,数据组为非线性,此时应进行临床标准的线性与非线性检验。
3.6 临床标准的线性与非线性检验
上述多项式回归分析主要是利用统计学方法进行线性判断,统计学标准的线性可称为一阶线性,对数据组的要求很高。对于在临床实验室中使用的测定方法,在其临床应用实践中允许有一定的非线性误差,此时通过对统计学标准的非线性作程度判断,可得到临床标准的线性,即二阶线性。
临床标准的线性检验中使用了两个统计量,ADL(偏离直线平均差异average deviation from linearity)与PctBnd(百分区界 percent bound) ,对于大多数分析物PctBnd取5%。如ADL小于所要求的临界判断值,则可认为数据组具有临床可接受的线性,所拟合出的最适非线性多项式无临床意义。
(1) ADL值的计算:
ADL表示最优拟合曲线与直线的平均差异,其计算公式如下:
[p(x)?(a?bx)]?Lx 100% ADL = 2x?Xcp(x):最优拟合二阶或三阶方程的拟合值 a+bx:拟合一阶方程的拟合值 L:样本数
c:总平均浓度(全部测量数据的平均值) c= (y1+y2+y3+……+yn)/n
(2)将ADL与临界值比较
一般设定ADL小于5%为临床允许误差,即取PctBnd为5%,通过查表(见附表A与B)得到ADL临界值。如ADL小于临界值,可认为多项式具有临床可接受的非线性,为二阶线性。如ADL大于临界值,则为临床不可接受的非线性。
3.7 对数据组进行精密度检验
测量数据的精密度可直接影响多项式回归分析的结果,为提高统计功效,
需对数据组进行精密度检验。
(1)计算最优拟合方程的回归标准误(σ)
σ = ?[yi?1ni?p(xi)]2n?d?1yi: 各个测量值
p(xi): 最优拟合方程的拟合值 n: 样本数乘以重复次数(L x R) d: 最优拟合方程的阶数
(2)计算不精密度
用最优拟合方程的回归标准误(σ)与总平均浓度(c)的百分比代表不精密度。
(3)数据组的不精密度检验 跟据以下公式进行判断:
?c?PctBndL?RC?σ:最优拟合方程的回归标准误
c:总平均浓度
?L:样本数 R:重复测量的次数 C:常数(附表C) PctBnd:取5%
不精密度满足判断式时, 说明数据的精密度好可作线性评价。反之则表示数据的精密度差,不能作线性评价。当PctBnd取5%时, 尚可通过查不精密度