误差理论与数据处理基础知识
在科学研究和实验过程中,往往离不开对某个物理量的测量。物理实验除了定性地观察物理现象外,也需要对物理量进行定量测量,并确定各物理量之间的关系。
由于测量设备、环境、人员、方法等方面诸多因素的影响,使得测量值与真实值并不完全一致,这种差异在数值上表现为误差。随着科学水平的提高和人们的经验、技巧、专门知识的丰富,误差虽然可以被控制得越来越小,却始终不能把它消除。因此,对实验中测量获得的数据,要选择合适的方法进行处理,并对其可靠性做出评价,否则,测量结果是没有价值的。
误差与数据处理理论已发展为一门学科,它涉及的内容丰富,且较为复杂。在此,将简单介绍大学物理实验中常用的一些初步和基本知识。
第一节 测量与误差
1.1 测量
一、定义
所谓测量,就是借助于专门设备,通过一定的实验方法,以确定物理量值为目的所进行的操作。它是一个实验比较的过程,即把一个量(待测量)与另外一个量(标准量)相比较。
测量由测量过程与测量结果组成。
测量过程是执行测量所需的一系列操作。包括建立单位、设计工具、设计测量方法、研究分析测量结果、寻找减小误差的途径等方面。
测量结果表示由测量所获得的待测量的值,一般由数值、单位和精度评定三部分组成。
二、分类
从不同的角度考虑,测量有不同的分类法。
按照测量结果获得方法的不同,测量分为直接测量和间接测量。 用预先校对好的测量仪器或量具对被测量进行测量,直接读取被测量数值的大小,称为直接测量。例如,用米尺测物体的长度,用秒表测时间,用天平与砝码测物体的质量,用电压表(或电流表)测电压(或电流)等都属于直接测量,相应的被测物理量称为直接测量量。
如果待测量的量值是由若干个直接测量量经过一定的函数运算获得的,这种测量称为间接测量。例如,体积、密度等物理量的测量往往采用间接测量,相应的被测物理量称为间接测量量。
实际测量中多数为间接测量,但直接测量简单、直观,是一切间接测量的基础。 按照测量条件的不同,测量可分为等精度测量和非等精度测量。
在相同的测量条件下(同一测量水平的观测者,同一精度的仪器,同样的实验方法和环境等)对某一待测量所做的重复性测量,称为等精度测量。大学物理实验学习阶段,主要考虑等精度测量。
在不同的测量条件下对某一待测量所做的重复性测量,称为非等精度测量。非等精度测量获得的所有数据的可信赖程度是不同的,在数据处理过程中应按精度高低,区别对待。
按照被观测对象在测量过程中所处的状态,可分为静态测量和动态测量。 如果待测量在测量过程中是固定不变的,这时所进行的测量为静态测量。静态测量不需要考虑时间因素对测量结果的影响,应把被测量或误差作为随机变量进行处理。
5
如果待测量在测量过程中随时间不断变化,这时所进行的测量为动态测量。动态测量需考虑时间因素对测量结果的影响,应把被测量或误差作为随机过程来进行处理。
1.2 误差
一、定义
误差是指测量值与被测量的真值之差。用式子表示为
误差???=测量值?x?-真值?x0? (1-1) 其中,误差可正可负,反映了测量值偏离真值的程度;测量值是通过测量得到的被测量的值;真值是某一物理量在一定条件下所具有的客观的、不随测量方法改变的真实数值。一般情况下,真值是未知的,所以误差的概念只具有理论意义。只是在某些特殊情况下,真值可认为是已知的,主要包括:
1.理论真值:通过理论方法获得的真值。例如,三角形内角之和为180°;理想电容或电感构成的电路,电压与电流的相位差为90°等。
2.计量学的约定真值:国际计量机构内部约定而确定的真值。例如,7个SI基本单位量的确定,即长度单位米(m)、时间单位秒(s)、电流强度单位安培(A)、质量单位千克(kg)、热力学单位开尔文(K)、物质的量的单位摩尔(moL)、发光强度单位坎德拉(cd)。
3.标准器的相对真值:当高一级的标准器的误差小于低一级的标准器或普通计量仪器的误差一定程度后,高一级标准器的指示值可以作为级别低的仪器的相对真值。
二、误差的分类
根据误差的性质,可将误差分为系统误差、随机误差和疏失误差三类。 1.系统误差
系统误差是指在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。
一个完整的测量系统,通常由实验源、实验体、观测系统、实验环境4部分组成,因此系统误差来源可以归纳为以下几个方面:
(1)仪器设备、装置误差 ① 标准器误差
标准器是作为与被测量相比较时提供标准值的器具。例如,标准电池、标准量块、标准电阻等。由于使用条件或制作不够完善等原因,标准器本身也会产生附加误差。
② 仪器误差
测量仪器是指能将被测量转化为可直接观测的指示值或等效信息的计量器具。例如,天平、电桥等比较仪器;温度计、秒表、检流计等指示仪器。仪器设计制造不完善、调节使用不当、老化等原因都会造成测量误差。
③ 附件误差
为使测量方便进行而使用的各种辅助配件,均属测量附件。例如,开关、导线、电源等各种辅助配件也会引起误差。
(2)环境误差
由于各种环境因素,如温度、湿度、压力、震动、电磁场等,与要求的标准状态不一致而引起的测量装置和被测量本身的变化所造成的误差。
(3)方法误差
6
由于测量方法或计算方法不完善、不合理等原因引起的误差。例如,瞬时测量时取样间隔不为零;用单摆测量重力加速度时,公式g?4?L/T的近似性;用伏安法测电阻时,忽略电表内阻的影响等。
(4)人员误差
由测量人员分辨力有限,感官的生理变化,反应速度及固有习惯等原因引起的误差。例如,测量滞后与超前、读数倾斜等。
从不同角度,系统误差又可分为不同种类。 按对误差掌握程度,系统误差可分为已定系统误差和未定系统误差。已定系统误差的大小和符号是可以确定的,如千分尺、电表的零位误差,伏安法测电阻电表内阻引起的误差等。这类误差可以修正。未定系统误差是大小和符号不能确定,只能估计出大小变化范围的系统误差,如仪器误差。
按误差的变化规律,系统误差又可分为不变系统误差和变化系统误差。不变系统误差的大小和符号保持恒定不变。变化系统误差的大小和符号按某一确定规律变化,如线性、周期性等规律。
2.随机误差
在同一测量条件下,多次测量同一物理量时,误差的绝对值时大时小,符号时正时负,以不可预知的方式变化,这种误差称为随机误差。随机误差是由测量过程中一些随机的或不确定的因素引起的。例如,人的感官灵敏度及仪器精度有限,实验环境(温度、湿度、气流等)变化,电源电压起伏,微小振动等都会导致随机误差。由于引起随机误差的因素复杂,又往往交叉在一起,不能分开,因此,随机误差是无法控制的,无法从实验中完全消除,一般通过多次测量来达到减小的目的。
从一次测量来看,随机误差是随机的。但当测量次数足够多时,随机误差服从一定的统计规律,可按统计规律对误差进行估计。
3.粗大误差
粗大误差又称疏失误差,它是由于工作人员疏失、仪器失灵等原因造成的超出规定条件下预期的误差。含有粗大误差的测量值明显偏离被测量的真值,在数据处理时,应首先检验,并将含有粗大误差的数据剔除。
应当指出,系统误差是测量过程中某一突出因素变化所引起的,随机误差是测量过程中多种因素微小变化综合引起的,两者不存在绝对的界限,变化的系统误差数值较小时与随机误差的界限不明显。随机误差和系统误差有时可以相互转化。
三、误差的表示形式
1.绝对误差
用绝对大小给出的误差定义为绝对误差。用式子表示为
误差???=测量值?x?-真值?x0? (1-2)
绝对误差是带有单位的数,可正可负。绝对误差反映测量值偏离真值的大小与方向。 2.相对误差
绝对误差与被测量真值的比值称为相对误差?E?。用式子表示为
相对误差?E?=绝对误差/真值 (1-3) 由于一般情况下真值未知,通常用测量值代替真值。相对误差是无量纲数,通常用“%”表示。相对误差可以反映测量的精度高低。
例1-1 测量两个长度量,测量值分别为L1?100.0mm,L2?80.0mm,其测量误差分
7
22别为?1?0.8mm,?2?0.7mm。试比较两个测量结果精度的高低。
解:E1??1L1?100%?0.8?100%?0.8%, 100.0E2??2L2?100%?0.7?100%?0.9% 80.0从绝对误差的角度看,第一个量测量值的误差大于第二个量的误差;但从相对误差的角度来看,第一个量的测量精度却高于第二个量。
1.3 精度
精度又称为精确度,用来描述测量结果与真值的接近程度。它是一个定性的概念,不能用数值大小来表示,只能讲高低。主要分为
一、精密度
精密度用来描述测量结果中随机误差的大小程度,即在一定条件下,进行多次重复测量时,各测量值之间的接近程度。精密度反映随机误差大小的程度。
二、正确度
正确度用来描述测量结果与真值的偏离程度,它反映系统误差的大小程度。
三、准确度(精确度)
准确度反映系统误差与随机误差综合大小程度。准确度高说明测量结果既精密又正确。 通过图1-1打靶弹着点的分布图,可以形象地说明上述三个概念。图中(a)表示精密度高,正确度低;图(b)表示正确度高,精密度低;图(c)表示正确度与精密度都高,即准确度高,或精度高。
(a) (b) (c) 图1-1 精度示意图
1.4 测量不确定度
8
由于真值的未知性,使得测量误差的大小与正负难以确定。因此,在对测量结果的质量进行定量评定时,往往只是给出误差以一定的概率出现的范围。而这个用来定量评定测量结果质量的参数,即为测量不确定度。
测量不确定度是表征合理赋予被测量值分散性的一个参数。测量不确定度的来源较多,因而测量不确定度是由许多分量组成的。而评定各分量值的方法各不相同,按评定方法一般可将其分为两大类:
一、A类不确定度
用统计方法评定的不确定度称为A类不确定度,用uA表示。
二、B类不确定度
用非统计方法评定的不确定度称为B类不确定度,用uB表示。
不确定度的分类是按评定方法进行的。它们都基于概率分布,都用方差或标准差表征,称为标准不确定度。其中A类标准不确定度由观测列概率分布导出的概率密度函数得到;B类标准不确定度由一个认定的或假定的概率分布函数得到。不确定度的分类方法与误差分类相比,避免了由于误差之间界限不绝对,在判断和计算时不易掌握的缺点。评定不确定度时,不考虑影响不确定度因素的来源与性质,只考虑评定方法,从而简化了分类,便于评定与计算。
1.5 有效数字
一、定义
有效数字是指能正确表达某物理量数值和精度的一个近似数,由准确数字和可疑数字组成。(如果该数值绝对误差界是最末位数据的半个单位,那么从这个近似数左边第一个非零数字起到最后一位数字止,都叫有效数字。)
为了便于理解,举一例子加以说明。如图1-1所示,用最小刻度为1mm的米尺测量一物体的长度,不同的测量者测得结果不同,可能为2.55cm,2.56cm,2.57cm等。其中,前两位数是根据米尺的刻度准确读出的,不随观测者变化,是可靠的,称之为准确数字,最后一位数是在两个刻度之间估计读出的,随观测者个人情况可能略有不同,显然是不准确的,称为可疑数字。尽管可疑数字不准确,但它能客观、合理地反映出该物体比2.5cm长,比2.6cm短的事实,是有效的。因此,测量结果的有效数字是由若干位准确数字和一位可疑数字组成的。
0 1 2 3 4 5
图1-1 长度测量示意图
二、有效数字应注意以下几个问题:
1.有效数字与测量条件密切相关
9