普通物理实验 第3章 数据处理
第3章 数据处理
对实验数据进行分析处理方法是建立在统计规律上的、严格的处理方法;是实验中不可缺少的一环。 数据处理问题贯穿于整个实验的全过程中的。
实验之前:根据实验结果不确定度的要求设计实验方案。 1.考虑实验理论的近似对实验的影响; 2.考虑环境因素对实验的影响;
3.考虑实验仪器、设备的选择问题等等。
实验进行中:随时利用数据处理的原则对测量数据进行粗略的判断,大致确定其准确度。这样可以在实验过程中发现大部分错误。
实验结束之后:对实验所得数据进行处理,从而得出实验结果及不准确度,并对实验结果作出最后的评价。通过对数据的分析发现规律,再回过头来调整实验方案,重新进行实验,直到得出满意结果为止。
综上所述,要想做好物理实验,必须掌握有关数据处理的知识。
3.1 测量
所谓测量,以确定量值为目的的一组操作。指用实验的方法确定被测对象量值的的过程。 测量的形式是多种多样的,一般可分为两大类: 1.直接测量
直接测量是指被测量和同类单位的标准物或计量器具直接比较,得出被测量量值的测量。 例如:用米尺测量物体长度、用天平测量物体质量等。 2.间接测量
间接测量指由一个或几个直接测得值通过已知函数关系计算出被测量值的测量。 例如:重力加速度的测量、物体密度的测量等。
在物理实验中,大多数物理量是不能直接测量的,只能作间接测量。 3.仪器
仪器是指用以直接或间接测出被测对象量值的所有器具,如天平、游标卡尺、停表、惠斯登电桥、光栅摄谱仪等。 4.测量结果
所谓测量结果,是指由测量所得到的赋予被测量的值。
完整的测量结果应包括被测量值的测量结果和测量不确定度。
一个国家的最准确的计量器具是主基准,在全国各地又有经过主基准效准过的工作基准,实验室使用的仪器应由工作基准进行效准。 5.仪器的准确度等级
测量时以仪器为标准进行比较。这就要求仪器是准确的(至少应满足实验本身不确定度的要求)。但是,实验中,由于测量的目的不同,对仪器准确度的要求也就不同。即使是同一实验中的不同直接测量值,由于它们对最终结果的误差贡献大小不同,在测量仪器的精度上也应作不同的选择。为了适应各种测量对仪器的准确度的不同要求,国家规定仪器应分为若干准确度等级以适应不同测量的要求。各类不同等级的仪器,又有对准确程度的具体规定。
仪器的准确度等级,是指符合一定的计量要求,使其误差保持在规定极限内的计量器具的等别或级别。但是,并不是每一种仪器设备都要规定相应的准确度等级。一般来说,量具、仪器及测量传感器,可按其允许误差大小划分其准确度级别;但对指零仪器以及为测出某个量值要进行多种读数或把多次测的值加以运算而给出算术平均值作为测量结果的仪器,可不划分准确度等级。
实验仪器有许多性能指标。但在实验中要注意的、最基本的是它的测量范围、准确度等级以及工作条件。
综上所述,在对实验仪器的选择时,对仪器的准确度等级的选择要恰当,一般是在满足测量要求的条件下,尽可能选用准确度低的仪器。减少准确度高的仪器的使用次数,可以减少在反复使用时的损耗,
6
普通物理实验 第3章 数据处理
延长其使用寿命。
3.2 误差
实验中各被测量在实验条件下都有不以人的意志转移的真实大小:真值。真值就是与给定的特定量的定义一致的量。理想的测量结果是真值,但实际上它是不可知的。因为:
1.测量仪器精度有限;
2.实验环境条件对实验有较大的影响;
3.观察者的操作和读数不能做到百分之百的准确; 4.实验原理上的近似处理。
由于上述原应,在实验中往往采用约定真值来充当真值。所谓约定真值是指对于给定目的的具有适当不确定度、赋予特定量的值,有时该值是约定的。
误差定义:测量结果减去被测量的真值:
测得值(x)-真值(a)=误差(ε)
误差ε是一个代数量,它可以是正数,也可以是负数。由于真值是不能确知的,因此测得值的误差也不可能确知,因此,测量的任务就是:
1.给出被测量真值的最佳估计值
2.给出真值最佳估计值的可靠程度的估计
这个最佳估计值是误差最小的值,可靠程度最高。为减小误差,需找到误差来源,在测量中尽可能消除或减少其影响。测量误差是多种因素引入的误差的综合效应。
例如:用单摆测量重力加速度的实验。理论上要求:用一根无质量无弹性的线,悬挂一质点,在摆角接近于零时,摆长和周期之间存在T?2?l的关系。但由于种种原应,在实验中有许多不满足理论g要求。该实验的误差主要来源有:
★ 米尺和秒表本身的不准确; ★ 对仪器的操作不准确; ★ 仪器读数不准确; ★ 摆线质量不为零; ★ 摆锤体积不为零; ★ 摆角大小不为零; ★ 存在空气浮力和阻力; ★ 支点状态不理想; ★ 支架震动或空气流动。 这些误差的来源可以概括为: 1.理论:理论上的近似处理; 2.仪器:仪器精度;
3.实验装臵:仪器之间的连接和配合;
4.实验条件:实验装臵对实验条件的满足程度及对理论要求的满足程度; 5.观测者:人自身的心理和生理条件的限制。
3.3 几种常见的误差
从上面的分析可知,不同因素引起的误差的类型应该是不同的。那么在测量中就应根据产生误差的原因,把各种误差降到最低,并给出在测量条件下的最近真值(最佳估计值)以及对该值的可靠性评价。
误差处理应视其产生的条件,采用不同的处理方法。这首先需要了解各种不同类型误差的特点、产生的原因、服从的规律,从而有针对性的解决问题,将误差减小甚至消除。 3.3.1 系统误差 1.系统误差的定义
系统误差是指在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的值值
7
普通物理实验 第3章 数据处理
之差。它在同一被测量的多次测量过程中,保持恒定或已可以预知de方式变化的测量误差,即在测量中所得到的测量值的差异在重复测量时不变或呈现某种规律性的误差。
系统误差在形式上呈现出的规律性。可归结为某一因素或某几个因素的函数,而这个函数可以用解析公式、曲线或数表来表示。例如:某些电量是频率的函数,圆盘偏心引起的角度测量误差按正弦规律变化等等。由于变化规律不同,系统误差又可以分为:线性系统误差、周期系统误差、复杂规律系统误差等等。
系统误差在确定的实验条件下是不会变化的。但是,实验条件发生变化时,有的系统误差要发生变化,而有的又不会发生变化。前者称为可变系统误差,后者称为恒定系统误差。
由系统误差特有的规律性,可采取一定的措施削减或消除它。 (1)研究系统误差目的是:
A.探索系统误差的来源,设计实验方案消除或削减该项系统误差; B.估计残存系统误差的可能范围。 C.系统误差产生的原因 (2)系统误差产生的主要原因
系统误差的规律性往往和实验仪器、实验原理有关。系统误差产生的主要原因有: A.仪器误差
仪器误差是指由仪器自身的误差所造成的。例如:仪器安装不符合要求、环境条件未达到仪器的要求、仪器零点不准确等等。
B.理论与实验条件符合不好
物理实验中,理论上要求的环境条件和仪器的工作条件不可能完全被满足。实验中往往是采用接近于理论要求的实际条件来近似代替理想条件,这就造成理论和实际的差别,是肯定会带来误差的。
C.人身误差
对于不同的实验者,由于其心理和生理上的特点不同,它们各自的观察能力也就不同,这会产生误差。例如:人的反应速度、眼睛的好坏等等。
除上述几种系统误差来源之外,还有其它的系统误差来源。例如:装臵、环境等因素。
由于系统误差的来源比较明确,采取适当措施是可以把它对实验结果的影响降到最低甚至消除。一般地,要想减小系统误差,主要应从实验原理和仪器上着手。 3.3.2 偶然误差 1.偶然误差的定义
所谓偶然误差,是指测量结果与在重复条件下,对同一被测量进行无限多次测量所得结果的平均值之差,又称为随机误差。
在相同条件下进行重复测量得到的测量值一般不尽相同,这表明每次测量的误差是不同的,并且这种差异在测量之前不可预测的。这说明,偶然误差的成因是不可预测的、偶然的。 2.偶然误差产生的原因
偶然误差是由一些偶然因素的综合作用造成的。要想找出确定的因素是不可能的。从总体上来说,造成偶然误差的主要因素是:人的感官的灵敏度、仪器精密度的限制、周围环境因素的干扰以及随测量而来的其它干扰(这是不可预知的)。但是,偶然误差也不是没有规律可循。实验证明,偶然误差遵从统计规律:
(1)每次测量的偶然误差是不确定的; (2)出现正号或符号偶然误差的机会相近; (3)出现绝对值小的偶然误差的机会多一些。
由此可知,偶然误差实际上是遵从正态分布的(误差分析理论中的高斯分布)。 3.减小偶然误差的方法
根据偶然误差的上述特点,可以找到减小偶然误差的方法:增加测量次数,用算术平均值来代替真值可以减小偶然误差。 4.算术平均值
8
普通物理实验 第3章 数据处理
设对某一物理量进行测量,多次测量的结果如下:
x1、x2、……、xn的误差为ε1、ε2……εn,真值为a,则:
(x1整理后可得:
a)+(x2a)+…+(xna)=ε1+ε2+L+εn
11(x1+x2+…+xn)a=(ε1+ε2+Lεn) nn其中:
x=1(x+x2+…+xn)为测量值的算术平均值。 n1由此式可知,算术平均值和真值的差异是很小的,考虑到ε的正负,x更接近于真值,可以将算术平均值作为被测量的真值的最佳估计值。
利用算术平均值代替真值的最佳估计之后,偶然误差基本上已被减小到最小值。但是,这个最佳估计值中还包含了系统误差,因此必须消除。
消除或减小系统误差的方法是:在算术平均值的基础上加上一个修正值,这才是真正的真值最佳估计值。而这个修正值与系统误差的绝对值相等,符号相反。
实验结果的误差包含偶然误差和系统误差,因此实验结果不会是真值。研究误差的目的在于: (1)尽量减小测量值中的误差;
(2)对残存的误差的大小给出某种估计。 3.3.3 粗大误差
粗大误差是指用客观条件不能解释为合理的那些实验误差。粗大误差产生的原因很多,在此不作一一介绍。但是,粗大误差的出现会歪曲实验结果,因此在实验中必须避免。 3.3.4 引起误差的原因
引起误差的原因通常可分为:
★ 测量装臵(包括计量器具)的基本误差; ★ 在非标准工作条件下所增加的附加误差;
★ 所用测量原理以及根据该原理在实施测量中的运用和实际操作的不完善引起的方法误差; ★ 在标准工作条件下,被测量值随时间的变化; ★ 与观测人员有关的误差因素。
3.4 几个基本概念
3.4.1 绝对误差
绝对误差是指测量值与真值之差。它所反映的是测量值偏离真值的程度——测量的可靠程度。它和测量值有相同的单位。
绝对误差在用于衡量测量结果的好坏时,有一个很大的缺陷:不能用于不同测量之间的比较。 3.4.2 相对误差
在实验中,很多时候需要通过对不同测量之间的比较作实验的优化,为此引入相对误差,它使得测量具有可比性。
所谓相对误差,是指某测量值的绝对误差与它本身的测量值的比值,用百分比表示。一般来讲,相对误差越小,测量结果就越准确。
3.5 直接测量值的误差估计
物理实验中,绝大多数测量都是间接测量,但是,间接测量是建立在直接测量的基础上的。因此,直接测量结果的好坏,直接影响到间接测量的准确度。对直接测量结果的好坏的评价,可从两个方面考虑:
1)数据的分散范围;
2)该范围内数据的集中程度。
9
普通物理实验 第3章 数据处理
一般情况下,可用标准偏差作为评价直接测量值好坏的标准。 3.5.1 测量结果的表示方法及其物理意义
在实验中所得到的许多数据,经过一定的数据处理之后就可得出最后结果,这个最后结果表示为:
X?x?s
用测量值的算术平均值代替了真值。其物理含义是:待测量在[x?s,x?s]范围内的每一个取值都是符合要求的。即s给出了测量值的取值范围。它反映了测量的可靠程度。
在这个表示形式中,x应是修正系统误差之后的结果。在误差评定之后,根据臵信概率,给出上述表达式。而当测量结果的表达式形式采用了不同于0.95的其他臵信概率,应在结果的后面用括号将其臵信概率给出。测量结果的最后表示形式中,单位只能出现一次,并放在最后。 3.5.2 直接测量值的误差估计 1.在重复条件下的测量列
在重复条件下,对被测量X多次测量,获得一个测量列xi,因此,其数学期望为EX,标准差为s(X)。根据概率论和数理统计原理可知,数学期望削弱了偶然误差(但没有对系统误差作出修正),此时,期望估计值的标准差用下述表达式计算:
s?s(X)n??(xi?1ni?x)
n(n?1)n为测量次数。这个表达式也称为测量列的标准偏差。
所谓测量列,指在重复条件下对同一被测量进行多次测量而得到的一组数据。这组数据中的每个值是不完全相同的,或者说存在着一定的差异,而这个差异就可用标准偏差来评价。
必须注意:s不是待测量的实验误差,也不是指它的误差范围,而是对该组数据可靠程度的一种估计。它越小,说明测量数据的可靠程度越高。 2.从测量列计算标准差的其他方法
在测量结果接近正态分布,而且测量列中的次数n一般不小于5(应尽可能大)时,为了计算上的方便,可采用下列方法:
(1)最大残差法
s?Cnmax|v|
(2)最大误差法
s?Cnmax|?X|
(3)分组极差法
当测量列分为m组,每组包括n个测量结果时,每组均有一个极差。设这m个极差的平均值为w,则:
s?1w C3.标准偏差的统计意义
测量列的算术平均值的标准偏差的大小反映了数据的分散范围和集中程度,其统计意义是:
[x?s(x)]~[x?s(x)]范围包含真值的概率为68%;
[x?1.96s(x)]~[x?1.96s(x)]范围内包含真值的概率为95%; [x?2.58s(x)]~[x?2.58s(x)]范围内包含真值的概率为99%。
10