中国计量科学研究院 王春艳 陆梅 高蔚 钱钟泰
一、引言
在我国JJF1059-1999规范《测量不确定度评定和表示》(以下简称“JJF1059-1999规范”)和国际规范《测量不确定度表示指南》ISO1995(E)(以下简称“GUM95”)中,术语“测量不确定度”无疑是最重要的概念。JJF1059-1999规范给出“测量不确定度”定义中引用GUM95定义的部分如下:
【2.11[测量]不确定度
表征合理地赋予被测量之值的分散性,与测量结果相关系的参数。
注:
1.此参数可以是诸如标准差或其倍数,或说明了置信水准的区间的半宽度。
2.测量不确定度由多个分量组成。其中一些分量可以用测量列结果统计分布估计,并用实验标准差表征。另一些分量则可用基于经验或其他信息的假定概率分布估算,也可用标准差表示。
3.测量结果应该理解为被测量之值的最佳估计,全部不确定分量均贡献给了分散性,包括那些由系统效应引起的(如,与修正值,参考计量标准有关的)分量。】
JJF1059-1999规范编者根据自己对GUM95有关内容的理解为定义加上4、5、6、7四条“注”,在此从略。
GUM95定义的用词过于晦涩,使人难以理解。例如什么是“被测量之值的分散性”?什么是“被测量之值的最佳估计”?“被测量之值的分散性”作为一种客观存在,如何才能“赋予”?怎么样才是“合理地”?……。因此,对术语“测量不确定度”的含义即使在GUM95或JJF1059-1999规范编者间也是各有各的理解。
量值的分散性是统计学中随机变量的特性。为使大家对术语“测量不确定度”有明确和唯一的理解,有必要用统计学术语明确“测量不确定度”及有关术语含义中的量值关系。这就是本文的主要内容。
二、有关的基本概念
1.随机变量及其统计特征值
如果变量X的量值随观察而变,则称变量X为随机变量。随机变量X的全部统计学特性由其[概率]分布函数Fx(x)或[概率]密度函数px(x)表示,其定义分别如式(1)和式(2)所示:
Fx(x)=P(X≤x) (1)
px(x)=d〔Fx(x)〕/dx (2)
式(1)中,P(X≤x)表示出现事件X≤x的概率值。
由于函数Fx(x)或px(x)是自变量X在无穷区间内的函数,在一系列场合下不便于应用,例如不便于比较随机变量的大小。经常采用有确定量值的参数表征随机变量X的某种统计学特性,本文称这些参数为变量X的统计参数。变量X最重要的统计参数是它的任意函数f(X)的期望E〔f(X)〕,其定义为:
如果对函数f(X)作多次抽样,将其第i次抽样值表示为f(Xi),可以证明式(4):
式(4)表明,期望是抽样次数无限增大时抽样值平均值的极限。
变量X期望表征着随机变量的稳定部分的大小,变量X扣除其期望E(X)后的残留部分被称为其中心化变量,用X~表示。即有:
X~=X-E(X) (5)
中心化变量X~是变量X的分散部分,任何中心化变量的期望都将为零,它的大小表征着变量X的分散性,可以由变量X的标准差σ(X)来表征。标准差σ(X)是变量X方差V(X)的正平方根。即有:
σ(X)=〔V(X)〕1/2 (6)
方差V(X)是变量X的二阶中心矩。称变量X对确定量值a之差n次方的期望为变量X对值a的n阶矩,用μna(X)表示,即有:
μna(X)=E〔(X-a)n〕(7)
当a=0时,相应矩被称为原点矩,变量X的n阶原点矩μn0(X)为:
μn0(X)=E(Xn) (8)
当a=E(X)时,相应矩被称为中心矩,变量X的n阶中心矩简化表示为μnx或μn(X),它同时是中心化变量X~的n阶原点矩,即有:
μnx=μn(X)=E{〔X-E(X)〕n}=E(X~n)(9)
由此变量X的方差V(X)可以用式(10)表示:
V(X)=μ2x=E{〔X-E(X)〕2}=E(X~2) (10)
本文将称表征变量大小,与变量同量纲的统计参数为变量的统计特征值。期望E(X)与标准差σ(X)是变量X的两个重要的统计特征值,它们分别表征着变量X稳定部分及分散部分的大小。为表征整个变量X的大小,可以采用变量X的有效值(或均方根值)σ0(X)作为其统计特征值,其定义如下:
σ0(X)=〔μ2x(0)〕1/2=〔E(X2)〕1/2 (11)
按所述的各种定义,再令:
X==E(X) (12)
不难证实下列等式:
σ0(X~)=σ(X) (15)
σ0(X)=〔E(X)2+σ(X)2〕1/2=〔σ0(X=)2+σ0(X~)2〕1/2 (16)
上述公式表明,变量的期望E(X)和中心化变量X~可以看作相互独立的两部分,其大小分别由期望E(X)与标准差σ(X)表征,它们的有效值之间的综合服从方和根(平方和的平方根)法。
2.客观存在的量值和它的人为估计值
任何客观存在的“量值”完全独立于人类对它的认识之外,人们可以用各种方法评估它们,得出它们的各种评估值。所有评估值都不会完全准确地等于客观存在的“量值”,但所有评估值都将努力趋近于客观存在的“量值”。因此,在实践中所有客观存在的“量值”都是不能完全准确地确定的,但它同时又是所有评估值趋近的目标,在实践中能以需要的准确度逼近它。科学研究的对象是“客观量值”间的关系,这样的关系当然也是无法完全准确地确定的;科学定理是上述规律的有限地近似描述。在应用科学定理时,代入其数学表示式的所有量值和得出的结果都将是“客观量值”的人为估计值;但上述事实并不能否定“科学研究的对象是‘客观量值’间的关系”这样的根本事实。忘记这一根本事实将使科学发展失去目标,并在研究中引入一系列概念混乱。上述情况已由科学发展所证实,同样适用于“测量”。
在很多情况下,没有必要明确区分客观存在的“量值”和其人为的评估值。当研究“量值”间的关系时,自然是针对客观“量值”进行的;在进行实际数值运算时,采用的必然是这些量值大小的评估值。客观“量值”与其人为的评估值各有其适用范围,是相互补充的。
本文采用符号XΛ表示变量X的估计值,即用上标符号“Λ”表示取左侧量值的估计值。
变量X的估计值XΛ对变量X的差值ΔXΛ被称为估计值XΛ的估计误差。即有:
ΔXΛ=XΛ-X (17)
估计误差ΔXΛ的大小表示估计值XΛ对变量X的客观量值的逼近程度,这个逼近程度被称为估计值XΛ的准确度。
在式(18)成立时,统计学中称估计值XΛ为变量X的无偏估计:
E(ΔXΛ)=E(XΛ)-E(X)=0 (18)
在无偏估计的情况下,估计误差ΔXΛ是中心化变量。即有:
ΔXΛ=(ΔXΛ)~ (19)
现在用本节的概念表述GUM95“不确定度”定义所用到的词汇的涵义:
在“国际通用计量学基本术语”(第二版)(以下简称“VIM93”)中,多处用到了“赋予(某客观量)之值”的内容,按本节所述的概念更合适的表述是“为(某客观量)确定的估计值”。因为客观量值是客观存在,是无法人为“赋予”的。例如“VIM93”给出的“测量结果”的定义是“由测量所得到的赋予被测量之值”,应该改为“由测量所得到的被测量的估计值”。
用统计学术语正确解读“被测量之值的最佳估计”,应该是“被测量值的无偏估计”。
注意由客观量值为变量的函数也是一种客观量值,同样是仅能以需要的有限准确度确定它们的估计值。这样客观量值的实例有随机变量的总体统计参数,如期望、方差、标准差和峰度等。
3.量值的极值控制和极限值
实践中使用的对变量X量值控制基本上是控制其范围,即使变量X量值符合下列不等式:
Ul(X)≤X≤Uh(X) (20)
这里Ul(X)是变量X的下限值,Uh(X)是变量X的上限值。
式(20)的可靠性是如下保证的:检测变量X量值总体的所有子样,保留符合式(20)的所有子样(称之为合格值),删除不符合式(20)的所有子样(称之为异常值或超差值),由合格值组成的变量X量值新总体将可靠地符合不等式(20)。这样的变量X量值子样的选择过程被称为合格评定或检验。受合格评定或检验控制的变量X量值有着严格的式(20)的极限范围。检验合格的变量X量在式(20)以外范围的概率分布因被删除而为零,这样的概率分布形象化地称之为“截尾”。所有“截尾”概率分布的“峰度”值都是负的。检验合格变量X量值在式(20)以内范围的概率分布没有受到控制,因此是随机的。理论上是不重复的,任何分布都是可能的。
合格评定或检验是控制变量极限范围,对极限范围内变量概率分布未加控制。本文称这样的控制为“极值控制”。
针对“极值控制”的实际情况,建议对随机变量的“极限值”采用下列定义:
【极限值limit[value]
当随机变量X足够可靠地满足下列不等式:
X│≤U0(X) (21)
则称U0(X)为变量X极限值
注:
(1)随机变量X′的极限范围的一般表示形式为:
Ul(X′)≤X′≤Uh(X′) (22)
称Ul(X′)为X′的下限,Uh(X′)为X′的上限。
定义中将上、下限对称的情况作为标准状态,即有:
-Ul(X)=Uh(X)=U0(X) (23)
如果将变量X′经下列变换成变量X:
X=X′+〔Ul(X)+Uh(X)〕/2 (24)
则X具有对称上、下限U0(X)为:
U0(X)=〔Uh(X′)-Ul(X′)〕/2 (25)
(2)当随机变量X分布为无限时,对有限的极限值U0(X)必然存在下列情况:
│X│>U0(X) (26)
这种情况叫“异常”或“超差”。存在“异常”情况还能认为极限值U0(X)足够可靠,必须满足下列两条件之一:
①“异常”概率足够地小,出现“异常”情况的可能极微。
②“异常”相对值η(X)={〔X/U0(X)〕-1}足够地小,使得“异常”值X和极限值U0(X)实际上没有区别。
(3)为定量地表示“异常”对极限值U0(X)可靠性的影响,可以采用不同的“可靠性指标”,如极值因子、置信水平等。
(4)极限值U0(X)的可靠性经常用检验等技术措施删除“异常”情况予以保证。如检验加工公差删除不合格加工件等。
(5)随机变量X的中心化变量X~的极限值U0(X~)被称为随机变量X的“中心化极限值”,并用U(X)表示之。
表示符号:
随机变量X的“极限值”用U0(X)表示。
随机变量X的中心化极限值用U(X)表示。】
上述的极限值定义全面地符合了检验(合格评定)实践的实际情况,摆脱了对特定“可靠性指标”的规定;同时涵盖了经典统计学中的“置信限”,它是按特定的“可靠性指标”:“显著性水平”α0X或“置信水平”(1-α0X)的给定值确定的。
由于合格评定或检验在量值控制中的广泛应用,“中心化极限值”和“极限值”成为随机变量最重要的统计特征值。
4.量值评估中分别估计的随机变量X三个相互独立的部分
在传统统计学中将随机变量X分成其期望值E(X)和中心化变量X~两部分。中心化变量X~的定义如下:
X~=X-E(X) (27)
上文已指出,变量X的总体统计特征值E(X)或σ(X)都是无法完全准确确定的。对随机变量X量值评估的结果将是统计特征估计值EΛ(X)或σΛ(X)。
评估所得的变量期望估计值EΛ(X)不会准确等于变量期望值E(X),称它们之间的差值为期望估计误差,用ΔEΛ(X)表示。即有:
ΔEΛ(X)=EΛ(X)-E(X) (28)
根据中心化变量X~和期望估计误差ΔEΛ(X)的定义将有下列随机变量X的分解式:
X=E(X)+X~=EΛ(X)-ΔEΛ(X)+X~ (29)
由式(27)在评估中期望值E(X)和中心化变量X~=X-E(X)两部分可以认为是相互独立的。存在期望估计误差ΔEΛ(X)表明确定期望估计值EΛ(X)的估计方法是不完善的。实践中引起期望估计误差ΔEΛ(X)的原因主要有两个:
(1)变量X的抽样值X的误差存在不为零的期望值,其主要的组成是“量值溯源”误差;
(2)变量X的随机性对确定有限样本量期望估计值EΛ(X)的影响。
期望估计误差ΔEΛ(X)在理论上具有确定的量值,但是无法确定。对期望值ΔEΛ(X)的评估通常将它看作可能出现值的一个抽样值,用它的可能出现值的统计特征估计值表征其大小,这样的统计特征估计值有期望估计误差可能出现值ΔEΛ(X)的期望估计值EΛ〔ΔEΛ(X)〕,标准差估计值σΛ〔ΔEΛ(X)〕或中心化极限估计值UΛ〔ΔEΛ(X)〕。在EΛ〔ΔEΛ(X)〕和σ0Λ〔ΔEΛ(X)〕或U0Λ〔ΔEΛ(X)〕符号中的变量ΔEΛ(X)已经不同于它在式(28)和(29)中确定量值的概念,已经是它的可能出现值的概念,它将由期望估计值EΛ(X)的评估方法决定而基本独立于评估结果EΛ(X)。
这样,在量值评估中随机变量X被分为三部分,分别独立地进行评估,首先是量X的期望值E(X)作无偏估计EΛ(X),其结果的数值和正负号是完全确定的;是评估所得的变量X的系统部分。另外两部分是可能的期望估计误差ΔEΛ(X)和中心化变量X~,对于它们的评定结果是标准差估计值σΛ〔ΔEΛ(X)〕和σΛ(X),或中心化极限估计值UΛ〔ΔEΛ(X)〕和UΛ(X);这两部分在一起组成了变量X在量值评估中的随机部分。
随机变量X的系统部分X=Λ和随机部分X~Λ可以分别用式(31)和(32)表示:
X=X=Λ+X~Λ (30)
X=Λ=EΛ(X) (31)
X~Λ=X-X=Λ=X~-ΔEΛ(X) (32)
变量X的分散性可以用变量随机部分X~Λ的大小来量化,即用变量随机部分X~Λ的均方根估计值σ0Λ(X~Λ)或极限估计值U0Λ(X~Λ)表征。
由于X~是变量X的中心化变量并和期望估计误差ΔEΛ(X)间相互对立,因此有式(33)和(34):
σ0Λ(X~Λ)={σΛ(X)2+σ0Λ〔ΔEΛ(X)〕2}1/2 (33)
U0Λ(X~Λ)={UΛ(X)2+U0Λ〔ΔEΛ(X)〕2}1/2 (34)
三、随机变量的不确定度和测量不确定度
1.任意随机变量的“不确定度”
量值的分散性是所有随机变量所共有的特点。如果希望有一个术语来表述对任意随机变量量值分散性的评估结果,“不确定度”是合适的术语名称。建议对任意随机变量术语“不确定度”采用下列定义:
【随机变量的不确定度uncertainty of random variable
随机变量X的不确定度是表征变量随机部分X~Λ大小的统计特征估计值。
注:
(1)变量X随机部分的表示式为:X~Λ=X-EΛ(X)=X~-ΔEΛ(X)。式中的EΛ(X)为变量X的期望估计值,即期望E(X)的估计值;X~=X-E(X)为变量X的中心化变量;ΔEΛ(X)=EΛ(X)-E(X)为EΛ(X)的期望估计误差。期望估计误差ΔEΛ(X)具有未知的确定值,有时被称为未定系统误差。由于未定系统误差的确定值是未知的,因此,对它的评估实际上是对期望估计方法可能存在的误差进行评估。所以任何变量的不确定度将由其中心变化量的不确定度及期望估计误差的不确定度两个独立部分组成。
(2)变量随机部分的均方根估计值被称为变量的标准不确定度。
(3)变量随机部分的极限估计值被称为变量的扩展不确定度。
(4)表征包括变量系统和随机两部分整个大小均方根估计值或极限估计值可以称为“全(complete)标准不确定度”或“全(complete)扩展不确定度”。它可以由变量的期望估计值和变量相应的不确定度综合得出。
(5)对某种指定目的可以对变量“扩展不确定度”规定允许值,这可以称为该目的变量的“允许扩展不确定度”。例如,机械加工的公差,测量设备的最大基本误差允许值,各种检验被检量的允许偏差等。
表示符号:
随机变量X的标准不确定度表示为σ0Λ(X~Λ)。
随机变量X的扩展不确定度表示为U0Λ(X~Λ)。
随机变量X的全(complete)标准不确定度表示为σ0Λ(X~Λ)。
随机变量X的全(complete)扩展不确定度表示为U0Λ(X)。
来源及评注:
用统计学术语表述的GUM95中术语“测量不确定度”的扩展概念。】
这术语“不确定度”的这一定义是用统计学的术语明确地表述了“不确定度”含义中的量值关系,使其概念不留任何含糊之处。这术语定义又将“不确定度”和特定的随机变量明确地联系在一起。只有明确特定的随机变量后,“不确定度”才有完整的涵义。“变量随机部分大小”和其“不确定度”之间的关系是客观存在的“量值”和其人为的评估值之间的关系。这术语定义的“注”将“不确定度”和目前广泛应用的概念衔接起来,使它们在使用中相互衔接和协调。
2.与“测量不确定度”有关的术语
和“测量”过程直接有关的随机变量有3个:测量结果Y、测量误差ΔY和被测量真值Y0,它们之间的关系如下:
Y=ΔY+Y0 (35)
对式(35)两侧作期望估计,可得到式 (36):
EΛ(Y)=EΛ(ΔY)+EΛ(Y0) (36)
将式(35)减去式(36),可得到式 (37):
〔Y-EΛ(Y)〕=〔ΔY-EΛ(ΔY)〕+〔Y0-EΛ(Y0)〕 (37)
即有式 (38):
Y~Λ=ΔY~Λ+Y0~Λ (38)
式(38)中的Y~Λ=〔Y-EΛ(Y)〕,ΔY~Λ=〔ΔY-EΛ(ΔY)〕和Y0~Λ=〔Y0-EΛ(Y0)〕分别为测量结果Y、测量误差ΔY和被测量真值Y0的随机部分。
测量误差ΔY的系统部分ΔY=Λ被称为系统误差(systematic error),其随机部分ΔY~Λ被称为随机误差(random error)。
测量误差ΔY和被测量真值Y0的量值的随机变化完全由不同的原因所引起,因此变量ΔY~Λ和Y0~Λ是独立的。则有式(39)和(40):
σ0Λ(Y~Λ)2=σ0Λ(Y~Λ)2+σ0Λ(Y0~Λ)2 (39)
U0Λ(Y~Λ)2=U0Λ(Y~Λ)2+U0Λ(Y0~Λ)2 (40)
式(39)中的σ0Λ(Y~Λ)、σ0Λ(Y~Λ)和σ0Λ(Y0~)分别为测量结果Y,测量误差ΔY和被测量真值Y0的标准不确定度,而式(40)中的U0Λ(Y~Λ)、U0Λ(Y~Λ)和U0Λ(Y0~Λ)分别为测量结果Y、测量误差ΔY和被测量真值Y0的扩展不确定度。
测量误差不确定度和被测量真值不确定度是两个相互独立的不确定度,它们分别是测量精密度评估和被测量值稳定性评估的对象。测量结果不确定度则由测量误差不确定度和被测量真值不确定度组成。因此,可以用于测量精密度评估和被测量值稳定性评估之中的任一个目的。但将测量结果不确定度用测量精密度评估时,由式(39)和(40)可以得出式(41)和(42):
σ0Λ(Y~Λ)2=σ0Λ(Y~Λ)2-σ0Λ(Y0~Λ)2 (41)
U0Λ(Y~Λ)2=U0Λ(Y~Λ)2-U0Λ(Y0~Λ)2 (42)
显然需要补做被测量真值不确定度σ0Λ(Y0~Λ)或U0Λ(Y0~Λ)的评定工作。通常在这时要求被测量真值不确定度对于测量结果不确定度是能够忽略的。
将测量结果不确定度用被测量值稳定性评估时,由式(39)和(40)可以得出式(43)和(44)
σ0Λ(Y0~Λ)2=σ0Λ(Y~Λ)2-σ0Λ(Y~Λ)2 (43)
U0Λ(Y0~Λ)2=U0Λ(Y~Λ)2-U0Λ(Y~Λ)2 (44)
这里需要补做的是测量误差不确定度σ0ΛL(ΔY~Λ)或U0Λ(ΔY~Λ)的评定工作。通常在这时要求测量误差不确定度对于测量结果不确定度是能够忽略的。
测量不确定度仅能是测量结果不确定度,测量误差不确定度或被测量真值不确定度中的一个,有必要明确它是哪一个。
按JJF1059-1999规范和GUM95所给测量不确定度定义的外延判断,所定义的应该是测量结果不确定度。但测量不确定度主要用于测量准确度评定,其中的被测量不稳定性影响应该尽量排除。因此,合理地将“测量不确定度”名称保留给测量误差不确定度。JJF1059-1999规范和GUM95所给定义的测量不确定度采用名称“测量结果不确定度”。本文建议将“测量不确定度”理解为测量误差不确定度。
这样,本文建议术语“测量不确定度”采用下列定义:
【测量不确定度uncertainty of a measurement
测量不确定度是表征测量随机误差DY~L大小的统计特征估计值。
注:
(1)测量随机误差ΔY~Λ的表示式为:ΔY~Λ=ΔY-EΛ(ΔY)=ΔY~Λ-ΔEΛ(ΔY)。式中的ΔY是测量误差,EΛ(ΔY)为误差ΔY的期望估计值,即期望E(ΔY)的估计值;ΔY~=ΔY-E(ΔY)为误差ΔY的中心化变量;ΔEΛ(ΔY)=EΛ(ΔY)-E(ΔY)为估计值EΛ(ΔY)的期望估计误差。期望估计误差ΔEΛ(ΔY)具有未知的确定值,有时被称为未定系统误差。由于未定系统误差的确定值是未知的,因此对它的评估实际上是对期望估计方法可能存在的误差进行评估。因而任何变量的不确定度将由其误差中心化变量的不确定度及期望估计误差的不确定度两个独立部分组成。
(2)测量随机误差的均方根估计值被称为变量的标准测量不确定度;
(3)测量随机误差的极限估计值被称为变量的扩展测量不确定度。】
“测量误差”和“测量不确定度”之间的关系同样是“客观随机变量”和表示它分散性大小的“统计特征估计值”之间的关系,它们同样是相互依存和统一的。
以上是本文对术语“被测量真值”与“测量误差”、“测量结果”与“测量不确定度”的理解,根据这样的理解,在“准确度评定”中将同时和协调地使用这四个术语。根据这样的理解,“测量结果”Y的“准确度评定”就是对“测量结果”Y的“测量误差”ΔY大小的评估,得出的评估结果将是包括“测量不确定度”在内的“测量误差”ΔY的各种统计特征估计值。由此将对“测量结果”Y的“准确度评定”和它的“测量误差ΔY评估”将作相同的理解。而“测量不确定度”评定就是相应“准确度评定”的一部分。
四、结束语
本文用统计学术语重新定义了术语“测量不确定度”。在重新定义过程中注意和吸收了GUM95的“不确定度方式”学说的下列合理内容。
1.区分客观量值和它的人为估计值。
2.用术语“不确定度”表述变量量值分散性的评估结果。
3.明确部分“不确定度”由“期望估计误差(未定系统误差)”引起。
但在下列的几个方面本文内容和GUM95的有关内容存在明显的差别:
1.将术语“不确定度”的概念推广应用到所有的随机变量。
2.建议“测量不确定度”采用“测量误差不确定度”的定义,而GUM95采用的是“测量结果不确定度”的定义。
3.强调完整的“测量不确定度”概念必须包含明确的“测量误差”概念。强调术语“被测量真值”和“测量误差”与“测量结果”和“测量不确定度”是相辅相成和协调的概念。而GUM95或UA学说则有着强烈的排斥“被测量真值”和“测量误差”的倾向,只提“测量不确定度”所属“测量结果”。
事实上同一个“测量结果”根据其用途的不同(如它可以充当某个测量误差的约定真值)和不同定义的“被测量真值”可以构成不同定义的“测量误差”。不同定义的“测量误差”当然对应不同的“测量不确定度”。因此很多情况下GUM95并非在评定所需要评定“测量误差”的不确定度。
4.在本文讨论中认为“测量误差”评定的大部分过程独立于测量过程,因此“测量结果”和“测量不确定度”的定义不应捆绑在一起。而UA学说正力图将它们的定义捆绑在一起。
以上对GUM95或UA学说的内容的更动目的是为了使“测量不确定度”的含义更符合客观情况,以利于其广泛地推广应用。
内容推荐
更多>2019-03-28