测定次数 2 3 4 5 6 7 8 9 10 11 21 ∞
90% 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.725 1.645
置 信 度 95% 12.706 4.303 3,182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.086 1.960
99% 63.657 9.925 5.841 4.604 4.032 3.707 3,500 3.355 3.250 3.169 2.846 2.576
前表为最常用的 t 值表。表中的P称为置信度,表示随机测定值落在(μ±ts)区间内的概率,称为显著性水准,用α表示,即α=1-P。应用表时须加脚注,注明显著性水准和自由度,例如:t0.05, 9是指:置信度为95%(显著性水准为0.05),自由度为9时的t值。
统计量 t的表达式t?x??s中:
sx称为平均值的标准偏差(平均值x与总体平均值μ
x相符的程度),与样本容量n有关,即:
sx?s n从图2-6中可见,当测定次数n>10时,
sx的值降低
己不明显。所以,一般的测定平行做3~4次,要求较高的5~6次,要求更高的测定做10~12次也足够了。
2.3.2 平均值与真值的关系—平均值的置信区间
图2-6 平均次数的关系值的
标准偏差与
用样本研究总体时,样本均值x并不等于总体均值μ,但可以肯定,只要消除了系统误差,在某一置信度下,一定存在着一个以样本均值x为中心,包括总体均值μ在内的某一范围,称为平均值的置信区间。
由t的定义式得:??X?tsn
式中X?ts称为置信区间,其大小取决于测定的标准偏差、测定次数和置信度的选择,n置信区间愈小平均值x愈接近总体平均值μ。
11
【例题2-5】:测定 SiO2 的质量分数,得到下列数据,28.62, 28.59, 28.51, 28.48, 28.52, 28.63。求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。
【解】:x?28.62?28.59?28..51?28.48?28.52?28.63?28.56
6(0.06)2?(0.03)2?(0.05)2?(0.08)2?(0.04)2?(0.07)2s??0.06
6?1查表 2-2 置信度为 90%,n = 6 时,t = 2.015。
??28.56?2.571?0.06?28.56?0.05
6置信度为 95% 时:
??28.56?2.571?0.06?28.56?0.07
6由计算知,置信度增大,置信区间也变大。一般将置信度定为95%或90%。
【例题2-6】:测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次, 测得的数据为1.11%, 1.16%和1.12%。计算两次测定和五次测定平均值的置信区间(95%置信度)。 【解】:n = 2 时,x?1.12%?1.15%?1.14%
2(0.015)2?(0.015)2s??0.021
2?1查表 2-2,得 t95% = 12.7。
WCr?1.14%?12.7?0.021?1.14%?0.19%
2n = 5 时:x?1.12%?1.15%?1.11%?1.16%?1.12%?1.13%
5 12
?(x?x)2s??0.022
n?1查表 2-2,得 t95% = 2.78。
WCr?1.13%?2.78?0.022?1.13%?0.03%
5在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,即可使测定的平均值与总体平均值μ接近。 【思考题】
2-3 u分布和t分布曲线有何不同?
2.4 分析结果的数据处理
2.4.1 可疑数据的取舍(Outlier rejection)
在实验中得到一组数据,往往发现个别数据离群较远,这一数据称为异常值又称可疑值,如果这是由于过失造成的,必须舍去。若不是这种情况,不应随意取舍。应按一定的统计方法处理。下面我们介绍几种简单的方法。
判断离群值是否仍在偶然误差范围内,常用的统计检测方法有格鲁布斯检验法、Q检验法和4d检验法。
2.4.1.1 格鲁布斯检验法(Grubbs)
步骤:(1)将测量值从小到大排列,
x1?x2???xn,其中x1或xn为可疑值;
(2)算出平均值x及标准偏差s;
(3)若G>G表 时,可疑值舍去;若G 表2-3 GP,n值表 13 测定次数 n 3 4 5 6 7 8 9 10 11 置信度(P) 95% 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 99% 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 测定次数 n 12 13 14 15 16 17 18 19 20 置信度(P) 95% 2.29 2.33 2.37 2.41 2.44 2.47 2.50 2.53 2.56 99% 2.55 2.61 2.66 2.71 2.75 2.79 2.82 2.85 2.88 2. 4.1.2 Q检验法(测定次数在10次以内) 步骤:(1)将测量值从小到大排列, (2)算出Q值, x1?x2???xn,其中x1或xn为可疑值; x2?x1x?x1 (2.10) 当x1可疑时,Q = nxn?xn?1xxn?x1 (2.11) 当n可疑时,Q = (3)若Q>Q表 时,可疑值舍去;若Q 表2-4 QP,n值表 测量次数n Q0.90 3 0.9 4 0.7 5 0.6 6 0.5 7 0.5 8 0.4 9 0.4 10 0.4 14 Q0.95 0.90.80.70.60.50.50.50.4 【例题2-7】 测定某药物中Co的质量分数(×10-6)得到结果如下:1.25,1.27,1.31,1.40。用格鲁布斯检验法和Q检验法判断1.40×10-6这个数据是否保留。 【解】:(1)格鲁布斯检验法 x=1.3110-6,s = 0.06610-6 1.40?1.310.066 = 1.36 G = 置信度选95%,n=4,查表得G表 = 1.46,G xn?xn?11.40?1.31xn?x1 = 1.40?1.25 = 0.60 Q = n=4,查表得Q0.90 = 0.76,Q 统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差?有下列关系? = 0.7979 ? ? 0.80 ? 。4? ? 3?,偏差超过4? 的测量值可以舍弃。 步骤:(1)将可疑值除外,求其余数据的平均值 x n ? 1和平均偏差 d n ? 1; n? (2)求可疑值x与平均值 1之间的差的绝对值x?xn?1; x (3)判断 x?xn?1?4dn?1,舍弃。 【例题2-8】:测量得结果:1.25、1.27、1.31、1.40,试问1.40这个数据是否应保留? 【解】:不计异常值1.40,得:x?1.28,d?0.023,4d?0.092。 异常值与平均值的绝对值差: 1.40?1.28?0.12?4d,1.40这个数据应舍去。 15