测量的目的是为了得到测量结果,但在许多场合下仅给出测量结果往往还不充分。任何测量都存在缺陷,所有的测量结果都会或多或少地偏离被测量的真值,因此在给出测量结果的同时,还必须同时指出所给测量结果的可靠程度。在各种测量领域,经常采用诸如测量误差、测量准确度和测量不确定度等术语来表示测量结果质量的好坏。
一、测量误差的定义
测量误差常常简称为误差。国家计量技术规范JJF1001-1998《通用计量术语及定义》中给出测量误差的定义为: 测量结果减去被测量的真值。 注:(1)由于真值不能确定,实际上用的是约定真值。 (2)当有必要与相对误差相区别时,此术语有时称为测量的绝对误差。注意不要与误差的绝对值相混淆,后者为误差的模。 该误差定义从20世纪70年代以来没有发生过变化。 根据误差的定义,若要得到误差就必须知道真值。但真值无法得到,因此严格意义上的误差也无法得到。虽然在误差定义的注解中同时还指出:“由于真值不能确定,实际上用的是约定真值”,但此时还需考虑约定真值本身的误差。因而可能得到的只是误差的估计值。何况有些测量连约定真值都无法得到,例如,地球和月球之间距离的测量。对这一类既不可能知道其真值,又无法知道其约定真值的测量,是无法得到误差的。 此外,在“误差”这一术语的使用上也经常出现概念混乱的情况,即“误差”这一术语的使用经常有不符合误差定义的情况。根据误差的定义,误差是一个差值,它是测量结果与真值或约定真值之差。在数轴上它表示为一个点,而并不表示为一个区间或范围。既然它是两个量的差值,就应该是一个具有确定符号的量值。当测量结果大于真值时,误差为正值;而当测量结果小于真值时,误差为负值。由此可见,误差这一参数既不应当也不可能以“±”号的形式表示。过去人们在使用“误差”这一术语时,有时是符合误差定义的,例如测量仪器的示值误差,它表示“测量仪器的示值与对应输入量真值之差”。但经常也有误用的情况,例如过去通过误差分析所得到的测量结果的所谓“误差”,实际上并不是真正的误差,而是被测量不能确定的范围,或者说是测量结果可能存在的最大误差,它不符合误差的定义。 必须要强调的是既然误差等于测量结果减去被测量的真值(或约定真值),因此误差只有通过测量才能得到。通过所谓的分析方法是得不到误差的,或者说通过分析方法得到的不可能是误差。
二、系统误差和随机误差
误差可以分为系统误差和随机误差两类。系统误差的定义为: 在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。 注:(1)如真值一样,系统误差及其原因不能完全获知。 (2)对测量仪器而言,其系统误差也称为测量仪器的偏差。 由定义可知,系统误差仅与无限多次测量结果的平均值有关,而与在重复性条件下得到的不同测量结果无关。因此,在重复性条件下得到的不同测量结果应该具有相同的系统误差。 由于系统误差和真值有关,而真值是无法确切知道的,只能用约定真值代替,因而可能得到的只是系统误差的估计值,并具有一定的不确定度。系统误差可以通过对测量结果进行修正而消除。由于误差等于负的修正值,因此系统误差的不确定度就是修正值的不确定度。 不宜按过去的说法将系统误差分成已定系统误差和未定系统误差。也不宜说未定系统误差按随机误差处理。未定系统误差其实是不存在的,过去所说的未定系统误差从本质上说并不是误差,而是不确定度。 系统误差一般来源于影响量,它对测量结果的影响已经被识别并可以定量地进行估算。这种影响称之为“系统效应”。若该效应比较显著,也就是说如果系统误差比较大,则可在测量结果上加上修正值而予以补偿,得到修正后的测量结果。 随机误差的定义为: 测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差。 注:(1)随机误差等于误差减去系统误差。 (2)因为测量只能进行有限次数,故可能确定的只是随机误差的估计值。 根据定义,若测量结果为无限多次测量结果的平均值,显然此时的随机误差为零,也就是说测量结果中已经不含有随机误差分量,只存在系统误差。但实际上不可能进行无限多次测量,因而在测量结果中随机误差和系统误差分量都存在。在重复性条件下得到的不同测量结果具有不同的随机误差,但有相同的系统误差。例如,在短时间内对某一砝码的质量连续称量两次,虽然得到的测量结果可能不同,例如分别为10.006g和10.008g,即它们的随机误差各不相同,但它们的系统误差是相同的。 直到现在,有许多关于误差或不确定度的教科书中还经常错误地将由多次重复测量结果计算得到的实验标准差称为“随机误差”。1993年前,随机误差被定义为在同一量的多次测量过程中,以不可预知方式变化的测量误差分量。这里所谓的不可预知分量是指在相同测量条件下的多次测量中,误差的符号及其绝对值变化不定的分量。其大小用多次重复测量结果的实验标准差表示。 由于随机变量的数学期望值等于对该随机变量进行无限多次测量的平均值,因此也可以说,随机误差是指测量误差中数学期望为零的误差分量,而系统误差则是指测量误差中数学期望不为零的误差分量。 根据定义,误差、系统误差和随机误差均表示两个量值之差,因此随机误差和系统误差也都应该具有确定的符号,同样也不应当以“±”号的形式出现。由于随机误差和系统误差都是对应于无限多次测量的理想概念,而实际上无法进行无限多次测量,只能用有限次测量的结果作为无限多次测量结果的估计值,因此可以确定的只是随机误差和系统误差的估计值。 误差经常用于已知约定真值的情况,例如经常用示值误差来表示测量仪器的特性。
三、误差、随机误差和系统误差之间的关系
由误差、随机误差和系统误差的定义可知: 误差=测量结果-真值 =(测量结果-总体均值)+(总体均值-真值) =随机误差+系统误差 或测量结果=真值+误差=真值+随机误差+系统误差 图1给出测量结果的随机误差、系统误差和误差之间关系的示意图。无限多次测量结果的平均值也称为总体均值。图中的曲线为被测量的概率密度分布曲线,该曲线下方与横轴之间所包含部分的面积表示测得值在该区间内出现的概率,因此纵坐标表示概率密度。注意图中表示随机误差、系统误差和误差的箭头方向,向右表示其值为正,反之则为负值。由图1可知,误差等于随机误差和系统误差的代数和。既然误差是一个差值,因此任何误差的合成,不论随机误差或系统误差,都应该采用代数相加的方法。这一结论与我们过去常用的误差合成方法不一致。过去在对随机误差进行合成时,通常都采用方和根法。两者的区别在于随机误差定义的改变。
图1 测量误差示意图
也有些作者将误差分为四类:系统误差、随机误差、漂移和粗差。但主要还是前面两类。漂移是由不受控的影响量的系统影响所引起的,常常表现为时间效应或磨损效应。因此漂移可以用单位时间内的变化或使用一定次数后的变化来表示。从实质上来说,漂移是一种随时间或随使用次数而改变的系统误差。 测量结果中还可能存在粗差,粗差是由测量过程中不可重复的突发事件所引起的。电子噪声或机械噪声可以引起粗差。产生粗差的另一个经常出现的原因是操作人员在读数和书写方面的疏忽以及错误地使用测量设备。必须将粗差和其他几种误差相区分,粗差是不可能再进一步描述的。粗差既不可能被定量地描述,也不能成为测量不确定度的一个分量。由于粗差的存在,使测量结果中可能存在异常值。在计算测量结果和进行测量不确定度评定之前,必须剔除测量结果中的异常值。在测量过程中,如果发现某个测量条件不符合要求,或者出现了可能影响到测量结果的突发事件,可以立即将该数据从原始记录中剔除,并记录下剔除原因。在计算测量结果和进行不确定度评定时,异常值的剔除应通过对数据作适当的检验,并按一定的规则进行。 无论随机误差或系统误差,所有的误差从本质上来说均是系统性的。如果发现某一误差是非系统性的,则主要是因为产生误差的原因没有找到,或是对误差的分辨能力不够所致。因此,可以说随机误差是由不受控的随机影响量所引起的。由随机效应引入的不确定度可以用标准偏差以及分布类型来表示。多次测量结果的平均值常常作为估计系统误差的基础。
图2 测量结果的误差类型图解
图2给出几种不同类型误差的图解。图中,直线1表示真值,它是不随时间而变化的,因此是一条与时间坐标平行的直线,但其位置是不可能确切知道的。2和3表示在两个不同的时间t1和t2进行测量所得到的分散性,即被测量的概率密度分布曲线。由于漂移的存在,在两个不同的时间得到的多次测量结果的平均值是不同的。斜线4表示测量结果的漂移,即无限多次测量结果的平均值随时间的变化。5和6分别表示在时间t1和t2进行无限多次测量所得结果的平均值(即它们的数学期望值)。于是根据系统误差的定义,它们与真值1的差7和8就分别表示在两个不同时间t1和t2进行测量时的系统误差。9和10分别表示在时间t1和t2具体进行测量时得到的某个测量结果。它们与无限多次测量结果的平均值5和6之差即为随机误差(图中11和12)。两条虚线之间所夹的区域为不确定区域,是测量结果可能出现的范围。出现在不确定区域之外的测量结果13和14是在计算中应予以剔除的粗差。 测量结果的不确定度的定义为: 表征合理地赋予被测量之值的分散性,与测量结果相联系的参数。 注:1.此参数可以是诸如标准偏差或其倍数,或说明了置信水准的区间的半宽度。 2.测量不确定度由多个分量组成。其中一些分量可用测量列结果的统计分布估算,并用实验标准偏差表征。另一些分量则可用基于经验或其他信息的假定概率分布估算,也可用标准偏差表征。 3.测量结果应理解为被测量之值的最佳估计,而所有的不确定度分量均贡献给了分散性,包括那些由系统效应引起的(如,与修正值和参考测量标准有关的)分量。 首先要注意定义中“被测量之值”这一说法的含义。一般说来,“被测量之值”可以理解为被测量的真值,但在这里不能直接将“被测量之值”理解为“真值”,因为“真值的分散性”的说法无法理解。由于JJF1001-1998中给出“测量结果”的定义为:由测量所得到的赋予被测量的值,将两者进行比较可以发现这里的“被测量之值”似乎应该可以理解为“测量结果”,但它与我们通过测量所得到的“测量结果”仍有差别。在对被测量进行测量时,最后给出一个测量结果,它是被测量的最佳估计值(可能是单次测量的结果,也可能是重复性条件下多次测量的平均值)。而这里“被测量之值”应理解为许多个测量结果,其中不仅包括通过测量得到的测量结果,还应包括测量中没有得到但又是可能出现的测量结果。例如,用一台电压表测量某一电压,且电压表读数不加修正值,若对于该测量点电压表的最大允许误差为±1V,用该电压表进行了20次重复测量,则该20个读数的平均值就是测量结果,还可以由它们得到测量结果的分散性。但“被测量之值”的分散性就不同了,它除了包括测量结果的分散性外,还应包括在受控范围内改变测量条件(例如温度)所可能得到的测量结果,当电压表的示值误差在最大允许误差范围内变化时所可能得到的测量结果,以及所有系统效应对测量结果的影响。由于后者不可能在“测量结果的分散性”中出现,因此“被测量之值的分散性”应比“测量结果的分散性”大,也包含更多的内容。这就是在定义的注3中所说的在分散性中应包括那些由系统效应所引起的不确定度分量,而系统效应引入的不确定度分量在测量结果的分散性中并没有反映出来。 根据定义,测量不确定度表示被测量之值的分散性,因此不确定度表示一个区间,即被测量之值可能的分布区间。这是测量不确定度和测量误差的最根本的区别,测量误差是一个差值,而测量不确定度是一个区间。在数轴上,误差表示为一个“点”,而不确定度则表示为一个“区间”。 测量不确定度是测量者合理赋予给测量结果的,因此测量不确定度将或多或少与评定者有关,例如与评定者的经验、知识范围、认识水平等有关。因此测量不确定度评定将或多或少带有一些主观色彩。定义中的“合理”是指应该考虑各种因素对测量结果的影响所作的修正,特别是测量应处于统计控制状态下,即处于随机控制过程中。也就是说测量应在重复性条件或复现性条件下进行。 为了表征这种分散性,测量不确定度可以用标准偏差,或标准偏差的倍数,或说明了置信水准区间的半宽度来表示。 当测量不确定度用标准偏差σ表示时,称为标准不确定度,统一规定用小写拉丁字母“u”表示,这是测量不确定度的第一种表示方式。但由于标准偏差所对应的置信水准(也称为置信概率)通常还不够高,在正态分布情况下仅为68.27%,因此还规定测量不确定度也可以用第二种方式来表示,即可以用标准偏差的倍数kσ来表示。这种不确定度称为扩展不确定度,统一规定用大写拉丁字母U表示。于是可得标准不确定度和扩展不确定度之间的关系: U=kσ=ku 式中k为包含因子。 扩展不确定度U表示具有较大置信水准区间的半宽度。包含因子有时也写成kp的形式,它与合成标准不确定度uc(y)相乘后,得到对应于置信水准为p的扩展不确定度Up=kpuc(y)。 在不确定度评定中,有关各种不确定度的符号均是统一规定的,为避免他人的误解,一般不要自行随便更改。 在实际使用中,往往希望知道测量结果的置信区间,因此还规定测量不确定度也可以用第三种表示方式,即说明了置信水准的区间的半宽度a来表示。实际上它也是一种扩展不确定度,当规定的置信水准为p时,扩展不确定度可以用符号Up表示。 测量不确定度的第二种和第三种表示方式给出的实际上都是扩展不确定度。当已知包含因子k时,扩展不确定度U是从其中包含多少个(k个,k即为包含因子)标准不确定度u的角度出发所描述的扩展不确定度。而当p已知时,扩展不确定度Up则是从该区间所对应的置信水准p的角度出发来描述的扩展不确定度。对于前者,已知k而不知道p,后者则正好相反,已知p而不知道k。两者各自分别从不同的角度出发来描述扩展不确定度,因此包含因子k与置信水准p之间应该存在某种函数关系,但它们之间的关系与被测量的概率密度分布有关。也就是说,只有在知道被测量分布的情况下,才可以由k确定p或由p确定k。而在测量不确定度评定中,经常会遇到已知置信水准p而需要确定包含因子k的情况,这就是为什么在测量不确定度评定中经常需要考虑各输入量以及被测量分布的原因。而在过去的误差评定中一般不讨论分布问题。 JJF1059-1999规定,当置信水准p为0.99和0.95时,Up可分别简单地以U99和U95表示。 误差可以用绝对误差和相对误差两种形式来表示,不确定度也同样可以有绝对不确定度和相对不确定度两种形式。绝对形式表示的不确定度与被测量有相同的量纲。相对形式表示的不确定度,其量纲为1,或称为无量纲。绝对不确定度常简称为不确定度,而相对不确定度则往往在其不确定度符号“U”或“u”上加上脚标“rel”以示区别。被测量x的标准不确定度u(x)和相对标准不确定度Urel(x)之间的关系为: 扩展不确定度也同样可以有绝对和相对两种形式,绝对扩展不确定度U(x)和相对扩展不确定度Urel(x)之间也有同样关系: 在计算相对不确定度时,分母中的x应取其真值。由于真值无法知道,实际上用的是约定真值。而在实际工作中一般常以该量的最佳估计值,即测量结果来代替。 若随机变量x的值有可能为零,则不能采用相对误差或相对不确定度的表示形式。例如,在对测量仪器进行校准时,被测量是仪器的示值误差。在表示所测得的示值误差的不确定度时,就不应该用相对不确定度来表示,因为测量仪器的示值误差有可能为零。 由于测量结果会受许多因素的影响,因此通常不确定度由多个分量组成。评定方法分为A、B两类。测量不确定度的A类评定是指用对观测列进行统计分析的方法进行的评定,其标准不确定度用实验标准差表征;而测量不确定度的B类评定则是指用不同于对观测列进行统计分析的方法进行的评定。因此可以说所有与A类评定不同的其他评定方法均称为B类评定,它可以由根据经验或其他信息的假定概率分布估算其不确定度,也以估计的标准偏差表征。所有各不确定度分量的合成称为合成标准不确定度,规定以符号uc表示,它是测量结果的标准偏差的估计值。 由于无论A类评定或B类评定,它们的标准不确定度均以标准偏差表示,因此两种评定方法得到的不确定度实质上并无区别,只是评定方法不同而已。在对各不确定度分量进行合成得到合成标准不确定度时,两者的合成方法也无区别。因此在进行不确定度评定时,过分认真地讨论每一个不确定度分量究竟属于A类评定或是B类评定是没有必要的。 不少人习惯上将由A类评定和B类评定得到的不确定度分别方便地称为A类不确定度和B类不确定度。这一说法也未尝不可,但不能由此而得到一个不恰当的结论:不确定度分为A类不确定度和B类不确定度两类。对不确定度本身并不分类,每一个分量的标准不确定度都要用标准偏差表示,而所谓的A类和B类仅是为了叙述方便起见而对其按评定方法进行的分类,而不是对不确定度本身的分类。 根据定义,测量不确定度是与测量结果相联系的参数,意指测量不确定度是一个与测量结果“在一起”的参数,在测量结果的完整表述中应该包括测量不确定度。 |