一、总体标准偏差、实验标准偏差和合并样本标准偏差
总体标准偏差(population standard deviation)规范化的符号为σ,定义为:
式中:μ——总体均值,N次测量结果分布的期望;N——测量次数,N接近无穷大;xi——N个测量结果中的第i个值。
在xi的不确定度评定中,由于N不可能接近无穷大而只用实验标准偏差s作为其估计,但s只是σ的一个偏小的估计,也就是说有以下情况:
s可能大于或小于σ,即s>σ或s<σ。
但它们的概率不等,即s>σ的概率小于50%,而s<σ的概率大于50%。这种情况在重复观测次数n较小时尤为明显。不过,当n≥4的情况下,这种偏小的情况在不确定度评定中就可不予考虑。
σ又称之为真标准偏差(true standard deviation)。含义是准确的值、理想或理论上的值,而s由于是按有限次数n所评定,只是一个近似值或估计值。
实验标准偏差(experimental standard deviation)s定义为:
式中:s(xi)——任意一个测量结果xi的实验标准偏差;xi——第i个测量结果;n——对同一被测量在规定条件下(既可以是重复性条件,也可以是某给定的复现性条件)的独立重复观测次数;个xi的算术平均值,它是μ的无偏估计。
由于式(2)所表示的是测量结果xi分散性的一个量,表达的是一个区间大小,因而在式子右边开方后不取正负号而只取正值(一般不再冠以符号)。式(2)与xi的分布状态无关。尽管xi的残差是xi的随机误差估计值(任何一个测量结果中所包含的随机误差只可能有估计值而不可能有真值),但s(xi)不能作为测量结果xi的随机误差的估计。所有这些重复的测量结果,没有一个共同的随机误差之估计,而s(xi)只是这些测量结果分布的标准偏差或误差分布的标准偏差。
当重复观测是在重复性条件下进行的情况下,式(2)给出的s(xi)为重复性标准偏差s,即方法所确认的重复性标准差,有的规范用rep作为其符号。如是在复现性条件下所得到则称之为复现性标准差sR。
通过式(2)所得出的s(xi)的不可靠程度达到。因此,n越大所得s越可靠。例如,如果要求其不可靠的程度小于1/10,则n应大于50。在不确定度评定中,比较理想的是n≥30,一般能达到n≥20就很好了。
合并样本标准偏差或组合样本偏差(pooled experimental standard deviation;pooled estimate of standard deviation)sp在ISO等7个国际组织公布的《测量不确定度表示指南》(Guide to the Expression of Uncertainty in Measurement)(1993)的正文与附录中均未提及。
sp是通过多个被测量的重复观测结果,按统计方法所获得的任意一次结果xi的实验标准偏差,更为确切地表示为sp(xi)。在计量技术规范JJF1059-1999《测量不确定度评定与表示》的4.2和4.3节中给出了几种sp(xi)的评定方法。采用sp是个简单、方便而且能够可靠地得到标准偏差的方法。它与实验标准偏差s没有本质上的区别而只是评定计算的方法不同。
二、采用合并样本标准偏差的必要前提
在JJF1059的4.3节中强调了规范化的常规测量。这是个必要前提,但并非充分前提。这一前提应理解为整个测量过程,包括从取样、样品的预处理、测量仪器的等级或技术要求、数据的处理一直到最后所得到的被测量最佳估计值这一全过程,也包括各影响量的取值及其测量均应是规范化的。
除此之外,还有一个必要前提是,这些被测量之值虽然大小各异,但其差别对单次测量结果qk的sr并不带来明显影响。如果被测量之值的大小与sr有明显的相关性,例如sr随被测量之值的增大而相应地增大,那么,应该对被测量之值限定某个范围,也可以把被测量之值按不同的sr划分为若干档次进行分别评定,也可以通过历次所测量的不同大小的被测量所得到的不同大小的sr(尽管其自由度不大),拟合成一条曲线。而通过被测量数量的增加,可以使这一曲线充分可靠。
例如:按ZBG12019-1989测量锑的质量分数、氧化钠的质量分数,其重复性标准差均可不分档次给出;按GB6549-1996氯化钾产品中的水分质量分数w(H2O),按小于和等于4%与大于4%分两个档次给出;按SH/T0253-1992的方法轻质石油产品中总硫含量测量结果的重复性标准差则应按总含量(质量分数)的变化给出一个拟合直线。按GB/T6600-1986的方法,则应按对工业用裂解碳四中组分平均质量分数的大小,用曲线给出其测量结果的重复性标准差。
三、通过过去对若干被测量Q的重复条件下观测结果评定
sp(qk)的方法与实例
为了方便计算,应挑选过去对Q重复观测次数n相同的记录。对于n并不要求很大,例如n=3、4或6均可,甚至只重复了两次(n=2)。设共有m张过去的检测记录,各为一个Q的测量,因此包括m个被测量,在每张记录中均有n个平行测量结果的平均值而可算出n个残差v。m张记录共可得m·n个残差,全部残差的平方和除以m(n-1)即单次测量结果的合并样本方差sp2(qk),其自由度达到m(n-1)。
例:历次对每个Q的重复观测次数n=6的记录共10张(m=10个被测量),其观测结果与各张上的平均值如表1。
表1 10个被测量Q的检测结果
表2 按表1所得出的60个残差
表3中的m=10个∑vi2之和,即m·n=60个残差之和为43265×10-6,所以m(n-1)=10×(6-1)=50得
表3 m·n个残差二次方及m个之和
sp2(qk)=43265×10-6/50=865×10-6
sp(qk)=29.5×10-3
即任意一次qk的合并样本标准偏差,自由度为m(n-1)=50,即总测量次数减被测量个数。
四、通过过去对若干被测量
Q的两次重复条件下测量结果之差Δi评定sp(qk)的方法与实例
两次结果之差Δi的标准偏差与s(Qk)之间存在:
因此,按统计方法评定出s(Δi)后即可计算出,而s(Δi)可通过若干被测量Q的两次重复观测结果计算出Δi,代入贝塞尔公式得出,即:
式中:m——参与评定的Q的个数;——所得m个Δi的算术平均值。
例:设对m=20个被测量Q各进行两次平行试验的历次检验记录中分别得出的q1与q2列入表4,并计算出其差值Δi和,表中给出了差值残差的以及vi2。
表4 通过两次之差Δ计算的实例
而其两次结果平均值的重复性标准偏差为
自由度为20-1=19
五、通过若干被测量
Q的平均方差计算sp(qk)
如果能按JJF1059的4.4节采用极差法对重复次数n不多的结果简单地评定出s(qk),虽然它们每个s(qk)的自由度不大,但采用平均方差计算也能得到自由度充分大的sp(qk)。例如,以本文上述表1的数值为例,这m=10个被测量在各6次重复观测中的极差R分别依次为:0.07、0.04、0.08、0.06、0.08、0.08、0.09、0.07、0.10、0.07。按JJF1059表1极差系数在n=6时为C=2.53。这样,分别得si(qk)为:0.0277、0.0158、0.0316、0.0233、0.0316、0.0316、0.0356、0.0277、0.0395、0.0277。其自由度均为4.5(按同一表)。按式
与该例所得29.5×10-3比较,大了约1%。按极差法取平均方差进行评定的结果,按JJF1059表1,s(qk)的自由度为4.5,因而这里的sp(qk)自由度为4.5×10=45,应该说也够大的了。这里应注意到采用极差法时,有个必要前提是qk可能值的分布接近正态。而表1中的各个单次结果,根据n=6不能作出是否正态分布的结论,只有按中心极限定律来判断。当不接近正态分布的情况下,使用了极差法,则据此评定的s(qk)会有所偏大。实际的分布偏离正态越远,则所得s(qk)偏得越大。本例中出现了1%的偏大应认为正常。
六、sp(qk)中所包含的不确定度分量
合并样本标准偏差sp(qk)与实验标准偏差s(qk)一样,包含了在重复观测过程中全部随机效应导致的不确定度分量。由于在计算sp时,往往采用了过去的检验记录中的平行试验结果,而且又是若干被测量的结果,其中不免包含了某些在试验过程中更换了的测量仪器,例如:滴定管、温度计等,这类在实验室中往往数量较多而且在平行试验时是随机取用的仪器的系统效应导致的分量。即它们的最大允许误差(MPE)所带来的不确定度分量。
作者单位【原国家计量局】
内容推荐
更多>2019-03-28