四不像——十四论不确定度论
史锦顺 · 2011-05-24 07:17 · 54262 次点击
**四不像——十四论不确定度论**
史锦顺
四不像,本是一种动物名称,又用来比喻不伦不类的东西。
四不像这种动物的学名叫麋鹿,是原产于我国的稀有动物。19世纪末被外国掠走,此后,野生的一度绝迹。二十多年前,国外送回三群,随后重新在我国形成野生种群。四不像者,像又不像。头脸像马,角像鹿,尾像驴,颈像骆驼,但从整个来看,又哪一种动物都不像。
本段以四不像来比喻不确定度论,有人可能反感。莫急,听我慢慢说。
什么是不确定度?回答起来很难。我们从名称、含义、定义、包含对象四方面来考察。
第一不像——名称
网上有篇署名文章“从测不准原理到测量不确定度”(本栏目已载,原作者为安徽省淮北市计量测试研究所王新),大意是说测量不确定度一语来自量子理论。“测不准原理”一词是我国的旧译,英文原文是“uncertaintyprinciple”准确的译文是“不确定性原理”,而英文中表达“不确定性”与“不确定度”的是一个词uncertainty。好,说测量学的这个不确定度就是量子理论的那个不确定性,这就给人造成一种假象:似乎测量不确定度出身名门,传承有序,于是也就懵人给力。其实,这是滥用名词。测量中的误差,是可以定量确定的(只要有更高等级的测量仪器或标准),并没有像量子理论的不确定性问题。测量学中的不确定度,与量子理论的不确定性,似像而完全不同。
第二不像——含义
不确定度论说它讲究的是不可信的程度。这又是个似是而非的说法。人们在测量计量上信不信的说法有两种含义。
第一种含义是对测量结果的数据信不信,比如说测量黄金手镯,用杆秤和天平都可以测量,但人们相信天平,而不相信杆秤,因为天平准,即测得值误差小,而杆秤测得值误差大。
第二种含义是测量结果标示的误差范围(或量值的包含范围)的可信性。
不确定度论正是在这两种可信性上,混淆、懵人。
不确定度论讲可信性,在引入不确定度概念时,好像讲第一种可信性,但虚晃一枪,并不给出不确定度是不可信性的相关定义,连如何称呼都不说。我们知道,可信性是要表成1-α的形式的,把不确定度当做不可信度α吗?试试看:一台普通的频率计很易达到西格玛为1E-6,难道能称其为可信性99.998%(取k=2),或失误率为0.002%吗?显然不能。
GUM在讲置信系数、置信区间、置信概率时(VIM的讲法是包含系数、包含区间、包含概率),才正式的讲可信性。原来可信性是关于区间(包含区间)的量,取k=2,区间半宽为2σ,置信度(可信度)是95.45%,而不可信度是4.55%;若取k=3,则可信度为99.73%,而不可信度是0.27%。可见,科学的、统计意义上的可信度,仅是置信系数k的函数。k小则可信度低;k大则可信度高。可信度与具体仪器性能即σ无关。(仅与区间半宽对σ的比值有关。)
有趣的是科学的可信度与日常人们对测量的信不信恰恰相反。对同一台仪器,σ是一定的,取k大,则误差区间(包含区间)大,则可信度高。也就是,对特定的仪器,把误差范围说大,可信;把误差范围说小,不可信。
不确定度论说它讲究的是不可信的程度,其实不是;它明明是在讲误差,却因那不难理解的原因,而排斥误差。
有个有趣的例子是河南省计量科学院开出的证书,对仪器的检定结果是:
不确定度(准确度):++++++
就是说,河南省的文件(检定证书有法定效力),把不确定度当做准确度。(上级让叫不确定度,而检定人员明知这是准确度,又不许叫准确度,只好这样写。)而不是写那个似是而非的可信性。
再具体看看中美两国关于铯原子基准指标的给法。
第一条消息
中国继法、美、德之后于2003年自主研制成功NIM4铯喷泉原子钟。频率不确定度5E-15。
第二条消息
2007年2月27日,中共中央、国务院在北京隆重举行国家科学技术奖励大会。这次大会奖励共计329项,其中,国家科技进步一等奖20项。中国计量科学研究院“NIM4激光冷却-铯原子喷泉时间频率基准装置研究”荣获国家科技进步一等奖。经过实验测试和评估,我国最新一代时间频率基准“NIM4激光冷却一铯原子喷泉时间频率基准”频率准确度达到5×10^-15,相当于600万年不差一秒,达到世界先进水平。
第三条消息
NIM5铯原子喷泉时间频率基准通过专家鉴定(科技日报2010年12月08日)。NIM5可搬运激光冷却—铯原子喷泉时间频率基准,达到性能指标:频率不确定度达到2×10^-15,把我国时间频率基准的准确度提高到1500万年不差一秒。
第四条消息
ThepresentcombinedstandarduncertaintyforNIST-7is5E-15.
当前(大概是1993年),NIST-7(美国铯束原子频率基准,1993-1999)的合成的标准不确定度是5E-15.
第五条消息
TheuncertaintyofNIST-F1islessthan2x10^-15,whichmeansitwouldneithergainnorloseasecondin20millionyears!
NIST-F1(1999-2001)的不确定度小于2x10^-15,这意味着2000万年不差1秒。
第六条消息
NIST-F2isacaesiumfountainatomicclock.TheclockwillreplaceNIST-F1,acaesiumfountainatomicclockusedsince1999.NIST-F1hasafractionalinaccuracyoflessthanδf/f<5×10−16,theplannedperformanceofNIST-F2isδf/f<1×10−16.(13April2011)
2011年4月13日消息:NIST-F2铯喷泉原子钟将代替从1999年开始应用的NIST-F1铯喷泉原子钟。NIST-F1的相对不准确度为δf/f<5×10^−16,而NIST-F2的设计指标是δf/f<1×10^−16。
看了以上六条消息,我们比较一下。原来中国、美国的原子频率基准的性能指标,或者用准确度表示,或者用不确定度表示。我们明显地看出,在中国,不确定度就是准确度;而在美国,不确定度就是不准确度(准确度的反说法)。两国为了说明什么是不确定度,都讲了多少多少年才差一秒(那是准确度的通俗比喻,只有承认不确定度就是准确度才能推导出时差频差关系式,即相对时差等于相对频差)。不同的是十年二十年前,美国人称不确定度,现在改为称不准确度,明显地由不确定度论派走向误差论派;而中国本来称准确度,现在却称不确定度,标示已由误差论派倒向了不确定度论派。
真奇怪,美国NIST推销的不确定度论,严厉禁止用“不准确度”一词,而就是同一个NIST,各类标准中的最高标准,现在公然用“不准确度”一词,说明真理的力量是无穷的,是压制不住的。
有人理解为:误差讲准确性,不确定度讲可信性。如果此说成立,上6例中,每一次公布都应该同时写两个指标;其实不然,表征原子钟水平的是一个指标,不确定度或准确度,写了一个就不能写另一个。这说明,二者等效。二者等效的场合,仅限于常数测量(即测量仪器误差与被测量的变化不能区分),而原子钟的本质不过是当今世界最高水平的常数测量。其他物理常数测量最高的1E-10,大部分是1E-6的水平。(光速在1984年后是定义值,不算。)
以上中美两国关于原子钟指标的给法,说明不确定度就是用来取代准确度(或称不准确度)的,至于GUM所说的不确定度是可信性的说教,是似像而不像的、似是而非的瞎扯,不是其真实意图,更不是事实。不确定度论的本意是颠覆人们长期来形成的对误差理论的信任,以便由不确定度来取而代之。
第三不像——定义
不确定度的主定义是分散性。什么是它所指的分散性,让人参不透。分散性,对量值、仪器、标准这些要表达的对象来说,到底指什么?只是一个分散性,能反映测量的水平吗?好像是测量水平的标度,其实又不是,因为测量的基本问题是准不准的问题,一个分散性,远远不够。
第四不像——结果
不确定度论给出的最后结果是A类、B类评定的所谓扩展不确定度。像是测量仪器的误差,又包含了被测量的变化;像是被测量的稳定性,却又包含了测量仪器的误差。
有网友抱怨说:“我四年念完大学,学不确定度五年,就是学不懂”。我说:朋友,你莫急,只要你换个思路,那个不确定度不过是四不像,你就会一通百通。