两种西格玛-误差与不确定度辨析(9)
史锦顺 · 2012-03-25 07:54 · 59134 次点击
**两种西格玛**-**误差与不确定度辨析(9)**
史锦顺
-
**(一)单值的西格玛与平均值的西格玛**
西格玛是方差的平方根。物理书上常称其为均方根值。经典测量学称其为标准误差,变量统计理论称其为标准偏差。
测量一组数据,共N个。代入贝塞尔公式计算。计算过程为:先求N个数据的平均值;各数据减平均值得N个残差;每个残差取平方;对各残差的平方求和,得残差的平方和;将残差的平方和除以(N-1),再开方,即得到西格玛。这是单值的西格玛。此西格玛表征每一个单个的测得值。也就是说,西格玛是一组测量中各个单值的共同特征,是单值对期望值偏差的统计表征量,是单值的分散性的度量。在正态分布的条件下,三倍西格玛是包含概率为99.73%的取值区间。
平均值的西格玛,简称西格玛(平)。西格玛(平)等于西格玛除以根号N。西格玛(平)是平均值对期望值偏离的统计表征量。
-
**(二)基础测量要用平均值的西格玛**
对常量的测量,称基础测量。
生活、生产、交易中的测量,是认识量值,求得量值,一般只测一次。
对常量进行精密测量,要进行多次。测一次是必要测量,另外的N-1次测量,是重复测量,又称冗(róng)余测量。测得值的变化由测量仪器引起,测得值的分散性是手段问题,要用多次测量的方法减小手段的影响,要取平均值,用西格玛(平)来表征测得值的平均值接近被测量真值的程度。
-
对慢变量的测量,实际是基础测量。例如测量晶振的日老化率,必须进行时间间隔为1日的2次测量。这2次测量是必要测量。现在通常的作法是每隔一日测量一次,共7次测量,冗余量为5(7减2)。注意,这里的一次测量的“次”,应是三到五个测得值的平均值。
-
在基础测量中,测得值的分散性由测量手段引入,称随机误差。手段要改进,方法之一是增加测量次数,因而取平均值,用平均值的西格玛来表征随机误差。
总之,基础测量用平均值的西格玛。
-
**(三)统计测量要用单值的西格玛**
对随机快变量的测量,是统计测量。其模型是,每个测得值是准确值(误差可略),测得值的变化,表现被测量本身的变化。取得单个测得值所用的时间称采样时间。每个测得值是采样时间内的各时刻量值的平均值。单个测得值及其表征量,都是采样时间的函数。这种表达模式,在时频界,已成功应用。
-
对迅速变化的量,测量只能进行一次。如发射运载卫星的火箭,测速、测距都无法重复,因为速度在变,距离更在变,此刻的值不等于下一刻的值。这样,对测量系统的要求,是单值的西格玛,而不是平均值的西格玛。
-
对统计测量来说,西格玛是量值分散性的表征量,称随机偏差。3倍西格玛是量值的变化范围。平均值的西格玛是平均值的变化特性,对单个客观量的实际变化,已无实际意义。因此统计测量的表征量是单值的西格玛,而不是平均值的西格玛。
统计测量的标准偏差,是单值的西格玛。
**例1狼的活动范围**
一座小山的岩石洞中,有个狼窝,住着狼和几只狼崽。狼每天外出巡猎,又要顾及狼崽,不时回窝照看,这样就大致有个行动范围。狼离小山的距离,简称狼距,在一个区间内。设每天狼的活动规律大体相同。
一天中抽样测量狼距,测10次,算西格玛为20公里,取3西格玛为狼距范围,是60公里。狼距平均值的西格玛是7公里,狼距平均值的范围是20公里。
如一天中抽样测量狼距1000次,算西格玛为20公里,狼距范围是60公里;西格玛(平)为0.7公里,狼距平均值的范围是2公里。
小山周围是大草原,杂居着羊和兔。羊国布告:按狼距3西格玛是危险区,即小山60公里范围,羊等莫入。兔国布告:按狼距3西格玛(平)是危险区,即小山2公里范围(或写成20公里),兔等莫入。
结果很明显。3西格玛是狼可能到达的范围;3西格玛(平)无安全上的意义。羊国以3西格玛(60公里)为危险范围是正确的。兔国采用3西格玛(平),危险范围仅2公里(或20公里),上当。
-
**例2孵鸡的温度范围**
孵鸡的温度要求,大致为38℃,温度范围1℃。即温度高,不得高于39℃;温度低,不得低于37℃。
孵箱的温度,是温度控制的结果,是随机变量。孵箱温度测量是统计测量。
现有温箱A、B、C三个。测量结果如下
-
A温箱
10次测量σ=0.3℃σ(平)=0.1℃
100次测量σ=0.3℃σ(平)=0.03℃
B温箱
10次测量σ=1.0℃σ(平)=0.3℃
100次测量σ=1.0℃σ(平)=0.1℃
C温箱
10次测量σ=3.0℃σ(平)=1.0℃
100次测量σ=3.0℃σ(平)=0.3℃
-
如上温箱温度测量表明,单值西格玛是温箱温度控制水平的表征,而西格玛(平)与测量次数有关,是测量手段的函数,不是被测对象的客观属性。要用西格玛来判断合格性,而不能用西格玛(平)。
以上温箱,能用来孵鸡的只有A温箱。因为要按单值的西格玛,温度变化范围是0.9℃,满足温度变化小于1℃的要求。
B温箱的温度变化范围是3℃,不符合孵鸡要求。C温箱的温度变化是9℃,绝不能用来孵鸡。
-
如果按现行的不确定度论行事,用西格玛(平),以三倍西格玛(平)当做温度变化范围,则不仅B温箱合格,C温箱也得算合格。C温箱100次测量的西格玛(平)是0.3℃,温度平均值的范围是1℃。
用C温箱孵鸡,鸡胚必将全部死光。问题出在求温度变化范围,应该是单值温度的变化范围,是9℃;而不能用温度平均值的范围。
-
**例3频率稳定度的测量**
以上二例,都是假想,但说明的道理是正确的。频率稳定度的测量则是现实可能的情况。
频标的稳定度,一定要用单值的西格玛表达,不准用平均值的西格玛。如果可以用平均值的西格玛来表达,那就乱套了。一台晶振1毫秒采样稳定度σ为3E-9;销售商测100次,σ为3E-9,而σ(平)为3E-10;生产厂测量10000次,σ为3E-9,而σ(平)为3E-11。计量部门有严格的规矩(详见《JJF1180-2007》),不管你测量一百次,还是测量一万次,都要用单值的西格玛。此晶振稳定度的表征量是西格玛,就是3E-9。按现行不确定度论,此晶振的稳定度可表为3E-10,也可表为3E-11,那是不对的。
在时频界,自从1972年采用阿仑方差表征频率稳定度以来,一律用单值的西格玛,这一点,至今全世界是一致的;从而避免了推广不确定度可能引入的混乱。这正是时频界能抵制不确定度论的一个重要原因。
-