您当前的位置：首页 > 学苑 > 不确定度

［连载］第四讲有关统计方法的概念与术语

发布时间：2007-04-19 作者：李兴仁来源：jlbjb.com 浏览：7345

计量培训：测量不确定度表述讲座
湖北财经学院　李兴仁

　　4.1 什么叫统计方法？
　　测量不确定度的A类评定方法定义为统计方法。所谓统计，一般来说，是指根据从总体中随机取出的样本中所获得的信息来推断关于总体性质的方法。
　　一个被测量的某种条件(重复性条件或复现性条件)下的任一个测量结果，可视为无限多次测量结果(总体)的一个样本。通过有限次数的测量结果(有限的随机样本)所获得的信息(例如:平均值大小、实验标准偏差s(y))，来推断总体的平均值(称之为总体均值μ或称为该分布的期望值)以及总体标准差σ，就是一种统计方法。

　　4.2 什么是期望、期望值与最佳估计？
　　在不确定度评定中，无限多次的重复性条件下或复现性条件下的测量结果的平均值以及非等精度条件下的加权平均值，均为期望值或简称期望。它也是总体的均值μ，只是理论上存在。
　　有限次数的测量结果都只是被测量的一个估计。当重复了若干次测量，得到若干个测量结果时，只有它们的平均值才是最佳估计，如果存在修正值，则只能是修正后的结果才是最佳估计。
　　任何一个估计及最佳估计值均具有不为零的不确定度，而期望值的不确定度恒等于零。

　　4.3 什么是概率？概率分布与主观概率、先验概率？
　　某种事件A出现的可能性大小的定量描述。例如，一个被测量Y在一个重复性条件下的测量结果y₁中，所包含的随机误差分量是正值还是负值，其可能性一样大，我们说，正与负的概率各为50%。如果两次测量结果y₁与y₂中所出现的随机误差分量的符号相同(均为正值或均为负值)，与符号不相同(一正一负)的概率也各为50%。三个重复测量结果y₁、y₂与y₃中随机误差分量的符号相同，其概率就只有25%。
　　大大小小地合理赋予被测量Y之值y_i，在其分散区间内等间隔地分成若干(例如15个)小的区间，则y_i分别落在这些小区间中的数目多少，表明了落在这个区间的概率大小，这样，如以纵坐标表示概率，则形成了一个概率分布曲线。下图就是一个近似正态的分布曲线，Δδ_i为每个小间隔。

　　曲线表明了被测量可能值在多大时出现的概率有多大，同时，也可通过曲线估计出95%或99%的概率出现在哪个区间，即所谓置信区间(参阅3.7)。如要确定概率分布曲线，往往需要有100～200次的重复测量结果。所谓先验概率又称主观概率，则是根据观测者的实践经验，对某种事件出现的概率所作出的估计。
　　常见的用于不确定度评定的、较为规律的概率分布曲线有:矩形分布(又称均匀分布)、三角分布、梯形分布、两点分布等。其中以正态分布最为常见。例如:三个以上观测值的平均值作为被测量的结果时，这种测量结果的分布即为正态分布。

　　4.4 异常值指什么？
　　由于测量条件或测量设备的某种偶然性变化，导致测量已不处于统计控制状态；或者由于观测、计算、记录中的失误，导致某测量结果明显偏离其所属样本的其余观测值，这样的值称为异常值，过去，我们说结果中含有粗大误差。在不确定度评定中，这样的值是不应进入计算而应剔除的。但必须持慎重态度，必须按有关规则进行。特别是当观测结果较少(例如4次)的情况下，凭4个观测值来判定其中某一次是异常值往往会作出错误结论。一般应再多重复若干次，有了例如7～8次以上的值后，再判断哪一次的结果是否为异常值。国家标准GB4883—1985《正态样本异常值的判断和处理》可作为依据。

　　4.5 什么叫数学模型？
　　用数学语言给出的物理量之间或数值之间的关系式。测量的数学模型指得到被测量Y的数学计算式。因此，同一个被测量按所选择的测量方法不同而有不同的数学模型。例如要测量一个球体的密度ρ，当我们选用天平、砝码以及已知密度ρ₀的液体，用两次称重(空气中的称重与浸入液体中的称重)的方法得出时，
　　ρ=m/(m-m′)·ρ₀
　　式中m为在空气中称出的质量，m′为在浸入液体中称出的质量。但是，当我们采用测量球体体积V的方法时，就有了另外的数学模式:
　　ρ=m/V
　　如果考虑了某种修正的计算，相应地，数学模型会有一定程度的复杂化。
　　在不确定度评定中，我们一般把被测的量称为输出量。上例中的ρ就是。把与ρ有函数关系的、通常是直接用实验测出的量，称为输入量，上例中的m、m′、ρ₀以及V都是。这些输入量也可能是由若干个量得出的，例如m可能是若干个砝码之和，V是通过直径测量并经过计算得出的，甚至测V时还有温度的修正等。
　　数值关系式也可用于被测量的模型，必须注意是给定单位下的数值，其中包括经验公式。
　　数学模型的一般表达式为:
　　Y=f(X₁，X₂，…，X_N)
　　式中Y为被测量(输出量)，X_i是输入量，小写字母为它们的估计值有:
　　y=f(x₁，x₂，…，x_N)
　　最简单的模型如:Y=X。例如X是体温计上的示值，而Y是体温。如由两个砝码X₁与X₂在天平上平衡得出被测质量，则数学模型是:Y=X₁+X₂。如通过滴定管测出所消耗的溶液体积V，则滴定管上的两次读数(滴定的开始与终了)X₁与X₂同V之间的关系就是:V=X₁-X₂。如果用一个标准量块的中心长度l_s与被检量块中心长度l相比较的方法，用它们之间的差d来得出l时，数学模型只是l=l_s+d；但如果考虑两量块间的温度差δθ、温度θ以及线膨胀系数差δα、线膨胀系数α的修正时，就成了:
　　l=l_s+d-l_s[δα·θ+α·δθ]。
　　必须注意，数学模型中不能进入带有正负号(±)的项。

　　4.6 线性函数与非线性函数关系在计算被测量Y的估计值时有何不同？
　　当输入量X₁，X₂，…，X_N与输出量Y之间的函数关系是:
　　Y=a₁X₁+a₂X₂+…+a_NX_N
时，这种函数称为线性函数。例如通过两个时间的测量得到一个时间间隔，通过在等臂天平上的若干个砝码得出被测的质量等都属这一类，其特点是输入量的各项指数均为正1或负1。上式中的各项系数a_i既可以是正值也可以是负值。当函数关系式中输入量相乘或除或指数不是1时，称为非线性函数关系。例如通过球体直径的测量得到球的体积，在恒定加速度下通过时间间隔的测量得到物体所行经的距离等属于这一类。
　　例如我们对两个砝码的质量m₁与m₂在重复性条件下各测了10次，输出量(我们所要求的被测量)是m=m₁+m₂。我们可以得到的10个m₁与m₂，分别相加而得出10个m，取这10个值的算术平均值作为m的最佳估计。我们也可用另一种方法，把10个m₁与m₂的值先计算其算术平均值，然后把这两个算术平均相加作为m的最佳估计。在m=这样的线性函数时，结果相同。
　　但是，如果是通过球体的直径d的测量，求体积V，例如对d测量了10次，我们可以用每一个d的结果算出10个V取其算术平均值。第二种计算方法是把10次的d先取其算术平均值作为d的最佳估计求出体积V，由于d对V来说是非线性函数，以第一种计算方法较为优越。

　　4.7 产生不确定度的原因一般主要有哪些？
　　一般来说，最主要的有以下几个方面:
　　a.检测手段的不理想:包括所用的测量仪器计量性能、标准器的不确定度、测量方法和测量程序带来的不确定度、测量模型不够完整。
　　b.被测量本身带来的:包括被测量不稳定、取样代表性不够、被测样品测量前的制备不理想。
　　c.影响量的修正:对影响量测量不可靠、修正所用物理常数不可靠、影响量不稳定。
　　d.由于观测人员带来的:数据的估读、属于测量过程的调整、数据处理过程中的修约。

　　4.8 怎样的不确定度分量可以忽略？
　　原则上说，其量值的大小对合成不确定度的影响不大者均可忽略。例如只有两个不确定度的分量合成，其中的一个只是另一个的三分之一。由于合成是取平方和开方:=1.044≈1，因此，如果略去了这个较小者，最后的结果小了将近5%。应认为可以忽略。如果有4个分量，其中3个平均只约为最大的那个的三分之一，此时合成为，略去后则减小了13%，似也不算太大。如果有另外一个分量较大，例如是最大者的二分之一，那么去掉了3个较小的(只有最大的三分之一)也是可以的。因此，往往忽略那些量值较小的分量不去估算和合成，例如修正值的不确定度较小时、修正值本身较小也不加到测量结果中时、有时测量仪器的分辨力导致的不确定度等。

　　4.9 什么是核查标准？
　　核查标准也是一种标准器，例如:砝码、量块、电阻、电池等。当我们需要经常校准某种标准器时，为了检查整个校准过程是否处于正常状态，往往建立一个或一组核查标准，要求其性能较为稳定，用于周期性(例如每两月一次)或必要时(例如产生了怀疑)进行核查。例如在经常校准4等量块的实验室，保存一组(大小不同的几个)4等量块，每三月按常规进行一次校准，得出其长度之值以及校准过程中的分散性(实验标准偏差s)，用于核验校准是否出现超出规定的系统性的和随机性的误差，用以决定校准是否处于统计控制状态之中，可否继续进行正常工作。

　　4.10 什么是控制图？
　　一种标绘着根据从总体中相继抽取的样本计算出的某种统计量的值，并画有控制界限的图，用于监查一个过程是否处于控制状态之下。根据控制图中所用的统计量(如算术平均值、极差、实验标准偏差、不合格率等)的不同，来确定控制图的不同类型。不确定度评定中用的控制图用于校准过程控制，通过核查标准的定期和不定期校准，将校准结果纪录在图中，每次的校准结果作为一组抽样，给出平均值与标准偏差两个曲线的控制图。一般把容许标准偏差的两倍作为警戒极限。

　　4.11 用统计方法得到的实验标准差是否是测量结果的随机误差？
　　不是，标准差是分散性的，随机误差的定义见3.8，本质完全不同。分散性来源于测量过程中的随机效应，它并非某个测量结果的随机误差。