计量培训:测量不确定度表述讲座
国家质量技术监督局 李慎安
3.1 实验方差s2(qk)是方差σ2的无偏估计的含义为何?标准偏差s是否也是总体标准差σ的无偏估计?
在用贝塞尔公式
计算任一次测量结果qk的实验标准偏差s(qk)时,未开方前以及用本讲座2.12问题中给出的式子计算时,未开方前,均称为实验方差s2(qk)。σ称为总体标准偏差,σ2则称为总体方差或简称方差,在计量学中,特别是测量不确定度评定中,总体是指被测量Y在重复性条件下或复现性条件下无限多次的测量结果。根据这无限多次测量结果计算出的标准偏差就是σ。由于实验中,重复的次数n总是有限的,计算出的实验方差s2只是σ2的一个估计值。n越大,这个估计值越可靠。所谓无偏估计,可以简单地理解为:s2比σ2大的概率与s2比σ2小的概率相等,即均为50%。而且当次数n越大时,差值(s2-σ2)的总和越趋近为零,当n为无穷大时,s2-σ2就等于零。当s2是σ2的无偏估计时,s就不是σ的无偏估计而是有偏的了,s是σ的偏小估计,即s-σ是负值的概率大于s-σ是正值的概率。在测量不确定度评定中,可以不去考虑这种偏小,因为随n的增大它们会趋于相等。
3.2 为什么在按贝塞尔公式计算的实验标准偏差时,次数n应充分大(开方后为什么只取正值)复现性条件下的重复测量结果可否采用贝塞尔公式计算一次测量结果的实验标准偏差?
次数n越大,计算出来的实验标准偏差s(qk)越可靠。一般文献均提出应充分大,当然是越大越好,尽可能多地重复测量。不过一般来说,次数n≥30就认为充分了。因为n等于40或50虽比n=30好一点,但好不了多少。当我们研究测量仪器的特性,特别是其示值分布的情况时,则是另一种目的,次数n往往要超过100甚至200。
数字中的平方根,总是带有正负号的,例如=±10。但是,在标准差的计算中,开方后的值只取正值,原因在于标准差表示的是分散性,而分散性所给出的是一个区间或理解为一个范围。作为物理量的区间的大小,用负值是没有意义的。这也就是测量不确定度只有正值而不存在负值的原因。
复现性条件下的重复测量结果之间,也存在分散性,这种条件下的任一次测量结果的实验标准偏差,也无例外地可以用3.1或2.12中给出的式子进行计算。复现性条件似乎不是等精度测量所要求的条件,但是,所谓等精度是个定性的概念,重复性条件下的测量结果有大有小,它们的测量误差也各不相同,但应该说是有限程度的等精度。复现性条件下出现了某些条件的变化,导致测量结果分散性某种程度的扩大,但仍可以用实验标准偏差来定量表述,也可称之为等精度测量。参阅2.9。
3.3 测量不确定度的定义如何理解?
测量不确定度定义的英文为:Parameter,associated with the result of a measurement,that characterizes the dispersion of the values that could reasonably be attributed to the measurand。一般译为:与测量结果相联系的参数,用来表征合理地赋予被测量之值的分散性。上述译文把“associated with”译为“相联系”不太贴切,英文的含义是“与…一起”,而“相联系”一词在汉语中,特别是在科技文献中,往往令人要问,如何联系,函数形式如何?其实,在这里测量不确定度与测量结果之间的“联系”,只不过是“在一起”,除此以外无其他含义。
当我们在重复性条件下,对一稳定的被测量X独立进行了n次重复测量,在这一测量列中,通过n个结果按贝塞尔公式计算出的,第i次结果xi的实验标准差s(xi),与xi之间有怎样的联系?这里的xi虽指第i次测量结果,而其实际含义则为:任一次的测量结果。因此,s(xi)=u(xi)表明这个不确定度(分散性)是这个测量列中任意一次的结果的不确定度。当然,如果在相同的重复性条件下再测一次,得到的结果xi的标准不确定度同样也是s(xi)。我们能看出这里的一次测量结果的标准不确定度u(xi)与xi之间有怎样的联系呢?没有。
怎么叫合理?怎么是非合理?在《导则》中未予交代。有人说,这里“合理”一词妙极,合理就是合理。没有,也不必要有任何解释。只要赋予被测量之值的分散性不能用不确定度来表征,则赋予被测量之值就不合理。如果是这样,我们如何理解不确定度的概念呢?
定义中所谓的合理,是指处于统计控制状态下的测量。当测量是处于统计控制状态下时,其结果的分散性才能用不确定度这一参数表征,否则不行。
国际上对实验标准差的定义是表征结果分散性的,还有,1994年12月公布的国际标准ISO 5725—《测量方法与测量结果的准确度》其中对重复性标准差以及复现性标准差(sr与sR),都是明确规定重复性条件下和复现性条件下,对同一被测量独立测量若干次的测量列,按贝塞尔公式所得到的分散性用标准差定量地给出的值,ISO分别用了标准化的符号sr与sR以示区别。
所谓统计控制状态的含义,在统计学中就是指随机控制过程状态。在计量学中,一般来说,可以具体化为:重复性条件和复现性条件可以保证下的状态。
当我们把测量过程中所用的标准测量仪器,按证书所给的修正量或修正曲线,对其示值(某些情况下就是测量结果)进行修正后,由于修正值的不确定度导致的误差,其期望是可以,而且往往只能,作为零来估计的,这就是一种统计控制状态,因它处于随机过程之中。
不确定度是否就是测量结果的可能误差?答复是肯定的。不确定度的含义虽为赋予被测量之值的分散性,但是,分散性的形成:一是随机效应;二是系统效应。系统效应导致的误差分量其期望(指对那些已知系统误差进行过修正后的)与随机效应导致的误差分量一样,都是为零。因此,只要没有遗漏重大的不确定度分量,最后给出的扩展不确定度,无论是U还是Up,都是一种可能误差(possible error)的量度。事实上,在计量学中,过去给测量不确定度曾经有过一个定义:由测量结果所给出的被测量估计值中,可能误差的量度。这个定义虽已为1995年的《导则》放弃,但是,其概念与当前所采用的定义并不矛盾,可能误差在大多数情况下,表达为一种误差限,或最大允许误差等。因此,我们在按检定证书或某些仪器的技术规范中的这一指标,来估算其所导致的不确定度分量时,就有理由把它们作为U或Up来对待。例如:证书上给出了最大允许误差不超出±18μA,就可认为U99=18μA。而其标准不确定度在正态分布的前提下可估算为U99/3=18μA/3=6μA。
测量不确定度是否仍可理解为被测量真值所处范围的量度?答案也是肯定的,JJF1001-1991中,曾对测量不确定度按当时国际上的意见定义为:表征被测量的真值所处量值范围的评定。这一定义也为国际计量学界所放弃,原因是这两个定义中均涉及到“真值”、“误差”这样的理论上的概念而不具有“可操作性”。虽然如此,其所表达的概念并未被国际计量学界所否定。德国于1996年3月所公布的标准DIN1319—3《单一被测量测量结果不确定度的估算》中,对测量不确定度的定义却是采用了:和测量结果一起,用于说明被测量真值所处范围的一个参数。
不确定度与测量结果有多大的联系?
例如:1个三等砝码,交给某个实验室,按检定规程的要求进行了测量,得到其质量为m1。然后,把这个砝码交给另一个实验室,同样按检定规程进行测量,得到其质量为m2,这两个实验室各自使用自己的二等标准砝码与天平,m1≠m2是常见的。但是,这两个测量结果的不确定度是十分接近的,都不超过检定规程的三等砝码的要求。因此,只要测量程序、条件相同,不同的测量结果可以有相同的不确定度。反之,如果测量程序、条件并不相同,虽然测量结果相同,也未必有相同的不确定度。从这个意义上来看,测量不确定度独立于测量结果。
应该认为:测量不确定度主要决定于测量程序与条件,而测量结果应是这一测量程序与条件下的测量结果而非其他。其联系仅此而已。
不确定度指测量结果的可疑程度,即对测量结果正确性的可疑程度。其值大则表示不可靠,其值较小,则表示较为可靠,其准确度较高。
测量不确定度无例外地只用正值表述。例如:扩展不确定度U95=0.45 mA。如与测量结果用数学符号联系起来,则另加正负号(±)。例如:电流I=(70.000±0.054)A。
[page_break]
3.4 不确定度分为哪些类?
不确定度的定义与概念已如3.3所述,当不确定度除以真值(或测量结果)时,称之为相对不确定度。这是个无量纲量,通常用百分数或10的负数幂表示(例如10-6,10-9)等,而其符号则加下标rel,例如:U95rel。
不带形容词的不确定度指一般概念,当需要明确某一测量结果的某种不确定度时,要适当采用一个形容词,常用的形容词有:标准、扩展(展伸或范围)。在这两个形容词前,还可再加“相对”。例如:相对扩展不确定度Urel。
当不确定度是用标准偏差表述时,称为标准不确定度。
当不确定度是采用统计方法(例如用2.12或3.1给出的计算式)得到时,称A类评定,而得出的不确定度称为A类标准不确定度。当用不同于统计方法的其他方法得到时,称为B类评定,所得出的不确定度称为B类标准不确定度。由各个不确定度的方差和协方差之和算出的标准不确定度,称为合成标准不确定度,它是测量结果标准偏差的估计。
扩展不确定度则是合成标准不确定度乘一个包含因子(见3.5)之后扩大了两倍或两倍以上的不确定度,它给出的区间能包含被测量可能值的大部分(例如:95%,99%等)。但也可以不必给出其百分数。
不确定度的分类可用下图表明:
上图中所给出的各类不确定度均可对应地给出它们的相对不确定度,即再除以测量结果。
决不可以用随机不确定度和系统不确定度这样的概念和术语。因不确定度只是一个分散性区间,这个区间没有什么随机与系统性的问题,更不存在系统的分散性或系统的分散区间。如需要表明某不确定度是怎样的原因所导致的,可以用随机效应导致的不确定度或系统效应导致的不确定度,以避免概念上的混淆。必须注意,随机效应导致的不确定度既可以是A类,也可以是B类,而系统效应导致的不确定度也不一定都是B类。
3.5 包含因子k的概念如何?用在不确定度评定中的什么场合?
包含因子又称覆盖因子,它等于扩展不确定度与合成标准不确定度uc之比。由于扩展不确定度有U与Up两类(下标p为置信概率,Up给出置信概率为p的置信区间半宽)。包含因子亦有k与kp两类,k与kp在名称上没有区别,使用时,如需区别,必须给出符号。k一般为2,有时为3。而kp则是在给定概率p时所要求的因子,对于被测量Y之估计值接近正态分布的情况下,kp就是t分布给出的t值。在扩展不确定度Up的计算中,有了p与自由度ν即可查表得到kp,从而得到Up。如只要求给出扩展不确定度U,则无需kp而只用k即可。
3.6 自由度的含义如何?不确定度评定中起何作用?什么情况下可以不必进行自由度的估算?
自由度一词在不同学科有不同定义,例如在运动学中,指物体活动空间是几维。质点只能沿固定轨道进退为1维,在一个面上自由运动则是2维,在空间自由运动则是3维,分别称为自由度等于1,2,3。刚体加上旋转的自由,最大等于6。自由度从字面上看是指松动程度。计量学中,如一个被测量只测了一次,有一个结果,不存在选择余地,自由度为零,但有了两个测量结果,就多了一个选择。不确定度的评定中,自由度用于表明所得到的标准偏差的可靠程度,它被定义为方差计算中和的项数减对和的限制数。按贝塞尔公式(见3.1)计算方差s2(qi)时,∑符号后的项数等于n,因为重复了n次,被测量Q有n个结果,与其平均值之差就有n个,成为n项之和。但有一个限制,就是由于这n个残差之和必为零,即∑(qi-)=0,这算一个限制条件。自由度ν=n-1。
一般,我们可以认为自由度等于测量次数n减被测量的个数m,即ν=n-m。
自由度越大,这个标准差越可靠,自由度ν与这个标准差s的相对不确定度的平方成反比。
自由度只用于包含因子kp的获得,如果在扩展不确定度的评定中只要求U而不是Up,则不必进行自由度的评定及有效自由度的计算。合成标准不确定度的自由度称为有效自由度νeff。
3.7 置信概率的含义如何?与置信区间有何关系?
按测量不确定度的定义,合理赋予被测量之值的分散区间是包括全部被测量的测量结果的,即测量结果100%存在于这一区间。这一分散区间的半宽一般用a表示。但是如只要求某个区间只包含其95%的赋予被测量之值,这个区间就称为概率p=95%的置信区间,其半宽就是扩展不确定度U95,如要求99%的概率,则为U99。相应的概率称为置信概率,有:
U95<U99<a
至于大多少,与赋予被测量之值的分布情况有关。
3.8 测量误差的定义、分类以及使用时应注意哪些问题?
测量误差(简称误差)的定义从20世纪70年代以来没有改变,定义为:测量结果减被测量的真值。但是,长期以来,国内外计量学界常错误地使用误差一词。从定义看,误差与测量结果有关而与测量方法无关。不同的测量结果有不同误差,相同测量结果有相同误差,而不论测量结果是来自何种测量方法。合理赋予被测量之值,各有其误差而并不存在一个共同的误差。一个测量结果的误差,如不是正值就是负值,取决于这个结果是大于还是小于真值。因此,误差决不会带有正负号(±)。
测量结果的误差往往由若干分量组成,这些分量按其特性分成随机误差与系统误差两大类,而测量结果的误差无例外地是全部分量的代数和。即,对误差的合成只有代数和这一种方式。
随机误差的定义在1993年以来作了原则性的改变,它被定义为:测量结果减重复性条件对同一量进行无限多次测量结果的平均值。测量结果是真值、系统误差与随机误差这三者的代数和,而无限多次结果的平均值则只是真值与系统误差的代数和。它们的差则是这一测量结果的随机误差分量。
注意:不再有偶然误差这一术语,也不再有另外的定义。
系统误差也有了原则性的改变,它被定义为:重复性条件下对被测量的无限多次测量结果的算术平均值减被测量的真值。由于只能有限次数的重复,而真值只能用给定真值代替,因此,所得到的系统误差只是个估计值,并具有一定的不确定度。这个不确定度也就是修正值的不确定度,与其他来源的不确定度分量一样进入合成标准不确定度,仅此而已。而不是把系统误差分成为已知系统误差和未知系统误差,也不能说未知系统误差按随机误差处理。因为这里所谓的未知系统误差并非误差分量而是不确定度,而且,所谓按随机误差处理,概念是不清的。
至于误差限、最大允许误差、可能误差、引用误差等术语,它们前面带有正负号(±),是一种可能误差的分散区间,而并非一个测量结果的误差。
过去所谓的误差传播定律,所传播者并非误差而是不确定度。现在已改称为不确定度传播定律。
应该注意,误差一词只能按其定义使用。今后不应用它来定量表明测量结果的可靠程度。
3.9 测量误差与测量不确定度之间存在哪些主要不同之处?
下表给出它们之间的主要不同之处:
3.10 什么叫变量之间的相关?如何定量表达?不确定度评定中如何给出其估计值,什么情况下发生相关?有没有B类估算?
一切被测量的估计值,由于诸多不稳定因素的影响,它们不是固定的,因而称之为变量。也就是说量的测量结果都是变量。
当某些被测量的估计值有相同的不确定度来源,特别是受相同的系统效应的影响,例如用了同一个标准器,则这样的变量间存在相关。均可能偏大或均可能偏小,称为正相关;一个偏大而另一个偏小,称为负相关。这种相关性导致的方差称为协方差,进入合成方差的计算,从而扩大了所得的合成方差(合成方差是合成标准差的二次方)。
协方差的评定既有A类评定也有B类评定。往往也可通过测量的操作程序来避免相关的产生,即使其协方差小到可忽略不计,例如通过改变所用的标准器等。
内容推荐
更多>2019-03-28