误差及数据处理基础理论知识综述
计量小编 · 2012-11-07 08:58 · 76454 次点击
前言
由于各行各业有各自的误差理论及数据处理理论,但基础理论都是一致的,大同小异。现就在检验(测量)领域的误差理论及数据处理基础知识进行理论文字上的综述,尝试作一次理论上的探讨,与各位同仁共同学习和提高,如有不妥及错误之处请各位批评指正。
一、误差基础知识
在各种测量领域,我们经常使用一些术语,例如测量误差、测量准确度和测量不确定度等来表示测量结果质量的好坏。现我们从上述三个术语的定义出发,给出这些术语的基本概念,并指出它们之间的差别,以利于正确使用这些术语。
(一)测量结果
测量结果的定义是“由测量所得到的赋予被测量的值”,因此测量结果是通过测量得到的被测量的最佳估计值。由于任何测量都存在缺陷,因而通常测量结果并不等于真值。完整表述测量结果时,必须给出其测量不确定度,必要时还应说明测量所处条件,或影响量的取值范围。以便使用者可以正确地利用该测量结果。
测量结果可能是单次测量的结果,也可能是由多次测量所得。对于前者,测得值就是测量结果;若为多次测量所得,则测得值的算术平均值才是测量结果。因此在给出测量结果时,通常说明它是示值、未修正测量结果或已修正测量结果,同时还应表明它是否为几个值的平均。
测得值,有时也称为观测值,是指从一次观测中由测量仪器或量具的显示装置中所得到的单一值。一般地说,它并不是测量结果。测量结果是指对测得值经过恰当的处理(如按一定的规则确定并剔除测得值中的离群值)、修正(指必须加上由各种原因引起的必要的修正值或乘以必要的修正因子)或经过必要的计算而得到的最后提供给用户的量值。因此测得值或观测值是测量中得到的原始数据,是测量过程的一个中间环节。对于间接测量而言,测得值或观测值往往具有和被测量不同的量纲。而测量结果则是整个测量的最后结果。在不会引起混淆的情况下有时也将测得值称为测量结果。
(二)测量结果误差
1、测量误差的定义
测量误差的定义是:测量结果减去被测量的真值。
注:
真值从理论上说,样品中某一组分的含量必然有一个客观存在的真实数值,称之为“真实值”或“真值”。用“μ”表示。但实际上,对于客观存在的真值,人们不可能精确的知道,只能随着测量技术的不断进步而逐渐接近真值。实际工作中,往往用“标准值”代替“真值”。
标准值采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值,是一个比较准确的结果。实际工作中一般用标准值代替真值。例如原子量、物理化学常数:阿佛伽得罗常数为6.02×10等。与我们实验相关的是将纯物质中元素的理论含量作为真实值。
(1)由于真值不能确定,实际上用的是约定真值。
(2)当有必要与相对误差相区别时,此术语有时称为测量的绝对误差。注意不要与误差的绝对值相混淆,后者为误差的模。
根据误差的定义,测量误差是测量结果与被测量真值之差。一个量的真值,是在被观测时本身所具有的真实大小,只有完善的测量才能得到真值。任何测量都存在缺陷,完善的测量是不存在的,因此真值是一个理想的概念。既然真值无法确切地知道,因此误差也无法确切地知道。故在实际工作中,误差只能用于已知约定真值的情况,但此时还必须考虑约定真值本身的不确定度。
产生误差的原因是测量过程的缺陷,而测量过程的缺陷可能是由各种各样的原因引起的,因此测量结果的误差往往是由多个分量组成的。误差与测量结果有关。而测量结果只有通过测量才能得到,因此误差也只能通过测量得到。通过分析评定的方法是无法得到误差的。对于同一个被测量,当在重复性条件下进行多次测量时,可能得到不同的测量结果,因此这些不同测量结果的误差是不同的。
由定义还可知误差是两个值之差,因此误差表示的是一个差值,而不是区间。当测量结果大于真值时误差为正值,当测量结果小于真值时误差为负值。因此误差既不可能、也不应当以“±”号的形式出现。
测量误差常称为绝对误差,这是为区别于相对误差而言的。相对误差定义为测量误差除以被测量的真值,实际上只能用测量误差除以被测量的约定真值,而在具体工作中则通常用测量结果来代替约定真值得到相对误差。绝对误差的量纲与被测量的量纲相同,而相对误差是无量纲量,或者说其量纲为1。
2、误差的分类
误差按其性质,可以分为系统误差和随机误差两类。
系统误差的定义为:
在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。
注:
(1)如真值一样,系统误差及其原因不能完全获知。
(2)对测量仪器而言,其系统误差也称为测量仪器的偏移。
a.系统误差
由定义可知,由于系统误差仅与无限多次测量结果的平均值有关,而与在重复性条件下得到的不同测量结果无关。因此,在重复性条件下得到的不同测量结果应该具有相同的系统误差。
由于系统误差和真值有关,而真值是无法确切知道的,只能用约定真值代替,因而可能得到的只是系统误差的估计值,并具有一定的不确定度。由于误差等于负的修正值,因此系统误差的不确定度就是修正值的不确定度。
不宜按过去的说法将系统误差分成已定系统误差和未定系统误差。也不宜说未定系统误差按随机误差处理。未定系统误差其实是不存在的,过去所说的未定系统误差从本质上说并不是误差,而是不确定度。
系统误差一般来源于影响量,它对测量结果的影响已经被识别并可以定量地进行估算。这种影响称之为“系统效应”。若该效应比较显著,也就是说如果系统误差比较大,则可在测量结果上加上修正值而予以补偿,得到修正后的测量结果。
b.随机误差
随机误差的定义为:测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差。
注:
(1)随机误差等于误差减去系统误差。
(2)因为测量只能进行有限次数,故可能确定的只是随机误差的估计值。
在无限多次测量结果的平均值中,已经不含有随机误差分量,故其只存在系统误差。由于测量不可能进行无限多次,因而在测量结果中随机误差和系统误差分量都存在。在重复性条件下得到的不同测量结果具有不同的随机误差,但有相同的系统误差。
1993年前,随机误差被定义为在同一量的多次测量过程中,以不可预知方式变化的测量误差分量。这里所谓的不可预知分量是指在相同测量条件下的多次测量中,误差的符号及其绝对值变化不定的分量。其大小用多次重复测量结果的实验标准差表示。
1993年后,随机误差是按其本质来定义的。但由于该定义中涉及无限多次测量所得结果的平均值,因此与系统误差一样,能确定的同样只是随机误差的估计值。随机误差一般来源于影响量的随机变化,故称之为“随机效应”。正是这种随机效应导致了测量结果的分散性。
就单个测量结果而言,随机误差的符号和绝对值是不可预知的。但就相同条件下多次测量结果而言,其总体上仍存在一定的规律性,称为统计规律性。