有关统计方法的概念与术语
湖北财经学院 李兴仁
4.1 什么叫统计方法?
测量不确定度的A类评定方法定义为统计方法。所谓统计,一般来说,是指根据从总体中随机取出的样本中所获得的信息来推断关于总体性质的方法。
一个被测量的某种条件(重复性条件或复现性条件)下的任一个测量结果,可视为无限多次测量结果(总体)的一个样本。通过有限次数的测量结果(有限的随机样本)所获得的信息(例如:平均值 大小、实验标准偏差s(y)),来推断总体的平均值(称之为总体均值μ或称为该分布的期望值)以及总体标准差σ,就是一种统计方法。
4.2 什么是期望、期望值与最佳估计?
在不确定度评定中,无限多次的重复性条件下或复现性条件下的测量结果的平均值以及非等精度条件下的加权平均值,均为期望值或简称期望。它也是总体的均值μ,只是理论上存在。
有限次数的测量结果都只是被测量的一个估计。当重复了若干次测量,得到若干个测量结果时,只有它们的平均值才是最佳估计,如果存在修正值,则只能是修正后的结果才是最佳估计。
任何一个估计及最佳估计值均具有不为零的不确定度,而期望值的不确定度恒等于零。
4.3 什么是概率?概率分布与主观概率、先验概率?
某种事件A出现的可能性大小的定量描述。例如,一个被测量Y在一个重复性条件下的测量结果y1中,所包含的随机误差分量是正值还是负值,其可能性一样大,我们说,正与负的概率各为50%。如果两次测量结果y1与y2中所出现的随机误差分量的符号相同(均为正值或均为负值),与符号不相同(一正一负)的概率也各为50%。三个重复测量结果y1、y2与y3中随机误差分量的符号相同,其概率就只有25%。
大大小小地合理赋予被测量Y之值yi,在其分散区间内等间隔地分成若干(例如15个)小的区间,则yi分别落在这些小区间中的数目多少,表明了落在这个区间的概率大小,这样,如以纵坐标表示概率,则形成了一个概率分布曲线。下图就是一个近似正态的分布曲线,Δδi为每个小间隔。
曲线表明了被测量可能值在多大时出现的概率有多大,同时,也可通过曲线估计出95%或99%的概率出现在哪个区间,即所谓置信区间(参阅3.7)。如要确定概率分布曲线,往往需要有100~200次的重复测量结果。所谓先验概率又称主观概率,则是根据观测者的实践经验,对某种事件出现的概率所作出的估计。
常见的用于不确定度评定的、较为规律的概率分布曲线有:矩形分布(又称均匀分布)、三角分布、梯形分布、两点分布等。其中以正态分布最为常见。例如:三个以上观测值的平均值作为被测量的结果时,这种测量结果的分布即为正态分布。
4.4 异常值指什么?
由于测量条件或测量设备的某种偶然性变化,导致测量已不处于统计控制状态;或者由于观测、计算、记录中的失误,导致某测量结果明显偏离其所属样本的其余观测值,这样的值称为异常值,过去,我们说结果中含有粗大误差。在不确定度评定中,这样的值是不应进入计算而应剔除的。但必须持慎重态度,必须按有关规则进行。特别是当观测结果较少(例如4次)的情况下,凭4个观测值来判定其中某一次是异常值往往会作出错误结论。一般应再多重复若干次,有了例如7~8次以上的值后,再判断哪一次的结果是否为异常值。国家标准GB4883—1985《正态样本异常值的判断和处理》可作为依据。
4.5 什么叫数学模型?
用数学语言给出的物理量之间或数值之间的关系式。测量的数学模型指得到被测量Y的数学计算式。因此,同一个被测量按所选择的测量方法不同而有不同的数学模型。例如要测量一个球体的密度ρ,当我们选用天平、砝码以及已知密度ρ0的液体,用两次称重(空气中的称重与浸入液体中的称重)的方法得出时,
ρ=m/(m-m′)?ρ0
式中m为在空气中称出的质量,m′为在浸入液体中称出的质量。但是,当我们采用测量球体体积V的方法时,就有了另外的数学模式:
ρ=m/V
如果考虑了某种修正的计算,相应地,数学模型会有一定程度的复杂化。
在不确定度评定中,我们一般把被测的量称为输出量。上例中的ρ就是。把与ρ有函数关系的、通常是直接用实验测出的量,称为输入量,上例中的m、m′、ρ0以及V都是。这些输入量也可能是由若干个量得出的,例如m可能是若干个砝码之和,V是通过直径测量并经过计算得出的,甚至测V时还有温度的修正等。
数值关系式也可用于被测量的模型,必须注意是给定单位下的数值,其中包括经验公式。
数学模型的一般表达式为:
Y=f(X1,X2,…,XN)
式中Y为被测量(输出量),Xi是输入量,小写字母为它们的估计值有:
y=f(x1,x2,…,xN)
最简单的模型如:Y=X。例如X是体温计上的示值,而Y是体温。如由两个砝码X1与X2在天平上平衡得出被测质量,则数学模型是:Y=X1+X2。如通过滴定管测出所消耗的溶液体积V,则滴定管上的两次读数(滴定的开始与终了)X1与X2同V之间的关系就是:V=X1-X2。如果用一个标准量块的中心长度ls与被检量块中心长度l相比较的方法,用它们之间的差d来得出l时,数学模型只是l=ls+d;但如果考虑两量块间的温度差δθ、温度θ以及线膨胀系数差δα、线膨胀系数α的修正时,就成了:
l=ls+d-ls[δα?θ+α?δθ]。
必须注意,数学模型中不能进入带有正负号(±)的项。(待续)
|
|