但在最新2008年第三版的VIM*将定义改为:
测量 measurement
通过实验获得并可合理赋予某量一个或多个量值的过程。
最新定义强调:测量是一个取得一个或多个量值过程,而不只是一组操作。它们有助于确定量值。
在人类科学技术以及生产、医疗等各种活动过程中都存在大量的测量工作。测量工作质量高低深深影响人类的活动或发展。可靠的测量结果将有力推动科学技术的发展,否则有可能延缓进步。在临床实验室,对人体样本中各种成分进行大量测量工作,结果是否可靠、准确将直接影响对病人诊断、治疗和预后。
因此不论在主观上还是客观上,都要求临床实验室不仅完成患者样本的测量工作,还必须说明测量结果的质量或可靠性,在过去一段时间内,人们习惯用测量的总误差来表明检验结果质量的高低,但近来,尤其进入21世纪后,不少学术团体和学者认为用“不确定度,uncertainty”可能更好地表达检验结果质量或可靠性的高低,尤其随着近年来对检验结果溯源性研究进展,在检验医学中建立了一些参考体系,逐步克服在评定测量不确定度中的困难,促进了检验界对测量不确定度的关注和研究。
“Uncertainty”翻译成中文有不少词语,例如在1978年的“现代高级英汉双解词典”中指出“uncertainty”为“变化、不可靠、不确知、不确定”;在“海量词典”中的网络释意为“不确定性、不确定度、不精确度”。计量学中翻译为“不确定度”。
此词不仅应用于计量学,事实上还广泛应用于其它学科,“海量词典”称“不确定度是一个术语,巧妙地以不同方式,应用在一些领域,包括哲学、物理学、统计学、经济学、金融学、保险学、心理学、社会学、工程学和信息科学。用它预言未来,已完成的测量,或者未知物。”
突出的应用例子是著名物理学家海森堡提出的不确定度理论,其表述为:“人们永远不能准确知道粒子的位置和速度,对其中一个知道得越精确,则对另一个就知道得越不准确”。
又如不确定性经济学是西方经济学的大家族中派生出来的交叉学科和边缘学派。在经济理论中,对不确定性的分析和认识不仅是经典的(阿罗—德布鲁)一般均衡理论的基本内容,同时也是信息经济学、行为以及实验经济学、制度经济学、演化经济学等新兴理论、以及现代金融理论、产业组织理论、企业理论、劳动经济学等学科的基本内容。不确定性的分析和认识不仅决定着经济学对现实的分析和解释力,同时也是经济学现代发展的一个极为重要的方向。
在哲学上,不确定性是一个很重要的命题,从网页搜索到作者在2009年5月28日对此哲学命题作了如下叙述:
【世界是确定的还是不确定的?这是一个具有深刻哲学意义和科学实践价值的问题,一直是科学前沿和哲学长期争论的问题。对这一问题的回答,西方哲学史上一直存在着两种对立的思想。一种认为世界是确定的,在此基础上形成了一种追求有序、必然、精确的思维,可称之为“确定性思维”。长期以来,确定思想一直占据着西方哲学的主导地位,是西方哲学的主力思想。科学理论,特别是牛顿引力论的成功,使得法国科学家拉普拉斯在19世纪初论断,宇宙是完全被决定的。他认为存在一组科学定律,只要我们完全知道宇宙在某一时刻的状态,我们便能依此预言宇宙中将会发生的任一事件。这种情形下的宿命论是显而易见的,拉普拉斯进一步假定存在着某些定律,它们类似地制约其他每一件东西,包括人类的行为。尽管很多人强烈地抵制这种科学宿命论的教义,但直到20世纪初,这种观念仍被认为是科学的标准假定。另一种则认为世界是不确定的,并在此基础上形成了一种强调无序、偶然、近似的思维,可称之为“不确定性思维”。确定性现象是指在一定条件下,必定会导致某种确定的结果;不确定现象是指在一定条件下,它的结果是不确定的。不确定思想虽然未形成主流,但这种思想从未间断过。随着现代科学的发展和人类对现代理性社会的反省、反叛、解构,人们逐渐意识到世界的绝对确定是“人们的一种错觉”,不确定才是世界的真实一面。不确定现象是客观事物的本质属性,而确定现象只是人们认识上或观念上的产物,而这既有本质区别又有内在联系,相互矛盾,相互依存,在一定条件下是可以相互转化的。确定现象往往通过大量的不确定现象呈现出来,不确定现象是确定现象的补充和表现形式,两者之间的关系是辩证统一的。在2003年第一届不确定系统年会上,清华大学的刘宝碇教授在他的报告中提出:“确定是相对的,不确定是绝对的”。】
从此段叙述,可以认识到目前医师和患者所追求的所谓准确的测量结果,其本质或内涵就存在着不确定性,正是此二者的统一使人们对测量的结果和应用有一个全面的理解,二者缺一,只报告测量所谓的准确结果而不报告其内在的不确定度,或者反之只报告不确定度都不能让人们全面理解和正确地使用测量的结果。
正是从此哲学命题出发,使用不确定度来描述测量结果的质量或可靠性比用总误差可能更为确切,更能说明不能将测量结果形而上学认为是确定不变的,测量结果的不确定性是其重要内涵。上述哲学论点似乎更能反应马克思哲学思想和唯物论对自然科学研究的指导作用。
我们如将上述二词结合在一起,就形成一个新的术语“测量不确定度”,英文为measurement uncertainty。
目前中国书籍中最常使用定义来自VIM; 1993,定义3.9,这也是当时1993年GUM所使用的定义。即:
Uncertainty(of measurement)—parameter, associated with the result of a measurement that characterizes the dispersion of the values that could reasonably be attributed to the measurand.
我国著名学者刘智敏在2000年将其翻译为“用以表征合理赋予被测量的值的分散性,它是测量结果含有的一个参数”。现在我国颁布的标准中,使用下列语句:
3.19 测量不确定度 uncertainty of measurement
表征合理地赋予被测量之值的分散性,与测量结果相联系的参数:[VIM:1993,定义3.9]
后者的翻译可能更为确切。
在此定义后,还有3个附注。原文如下:
NOTE 1 the parameter may be, for example, a standard deviation (or a given multiple of it), or the half-width of an interval having a stated level of confidence.
NOTE 2 Uncertainty of measurement comprises, in general, many components. Some of these components may be evaluated from the statistical distribution of the results of series of measurements and can be characterized by experimental standard deviations. The other components, which also can be characterized by standard deviations, are evaluated from assumed probability distributions based on experience or other information.
NOTE 3 It is understood that the result of the measurement is the best estimate of the value of the measurand, and that all components of uncertainty, including those arising from systematic effects, such as components associated with corrections and reference standards, contribute to the dispersion.
此三个附注进一步叙述不确定度的重要特性:附注1指出不确定度常是标准差或者是具有可信限的区间的一半。附注2实际上叙述了二类计算不确定度的方法。附注3指出测量结果分散性与所有分量的不确定度有关。
上述定义是第二版VIM的,笔者企图寻找第一版VIM(1984年)的定义,我国学者史锦顺在网络上发表一篇“测量不确定度理论的要害”一文中在提出列举其十条要害同时,引证了第一版的定义,翻译为:
“A 由测量结果给出的被测量的估计值中可能误差的量度。B 表征被测量的真值所处量值范围的评定。(VIM,1984,3.09)”,并认为“此二点都没离开误差、真值这些测量学的基本概念。一时曾接受不确定度论的一些人,大概与此二定义有关。”
我们如将1984年定义与1993年的定义相比,可发现,1993年定义更为合理,首先它回避使用“真值”、“误差”等模糊不清和易混肴的名词和概念。第二说明不确定度是被测量的内在属性,是被测量之值的分散性,而不简单为量值范围。在2008年JCGM*文件中有下面一段叙述,表达类似意思:
However, although these two traditional concepts are valid as ideals, they focus on unknowable quantities: the "error” of the result of a measurement and the "true value" of the measurand (in contrast to its estimated value), respectively. Nevertheless, whichever concept of uncertainty is adopted, an uncertainty component is always evaluated using the same data and related information (See also E.5.).
在2008年出了第3版VIM*,将测量不确定度定义修改为:
Measurement uncertainty
Uncertainty of measurement
Uncertainty
Non-negative parameter characterizing the dispersion of the quantity values being attributed to a measurand, based on the information used.
在我国最新的“通用计量术语及定义”的征求意见稿中,将上述英文翻译为:
测量不确定度measurement uncertainty简称不确定度(uncertainty)
根据所用到的信息,表征赋予被测量量值分散性的非负参数。
上述定义进一步丰富和充实了第二版的内容,从正文看,添加了“非负参数,non-negative parameter”和“根据所用到的信息,based on the information used”。笔者对非负参数曾询问数位专家,似无明确定义。有位专家如此说“非负参数是指非负的参数,没有什么特殊含意,如:SD、SE、CV、自由度等参数就是非负参数。有的参数可以是负值,但在统计学中较少”。至于在第三版添加“根据所用到的信息”,我认为是强调不确定度的评估与总误差的计算不同,可以大量根据所用到的信息进行B类不确定度的评定。
新定义还对原来的附注作了下列修改,原文为:
NOTE 1 Measurement uncertainty includes components arising from systematic effects, such as components associated with corrections and the assigned quantity values of measurement standards, as well as the definitional uncertainty. Sometimes estimated systematic effects are not corrected for but, instead, associated measurement uncertainty components are incorporated.
NOTE 2 The parameter may be, for example, a standard deviation called standard measurement uncertainty (or a specified multiple of it), or the half-width of an interval, having a stated coverage probability.
NOTE 3 Measurement uncertainty comprises, in general, many components. Some of these may be evaluated by Type A evaluation of measurement uncertainty from the statistical distribution of the quantity values from series of measurements and can be characterized by standard deviations. The other components, which may be evaluated by Type B evaluation of measurement uncertainty, can also be characterized by standard deviations, evaluated from probability density functions based on experience or other information.
NOTE 4 In general, for a given set of information, it is understood that the measurement uncertainty is associated with a stated quantity value attributed to the measurand. A modification of this value results in a modification of the associated uncertainty.
我国的征求意见稿进行如下翻译:
注:
1. 测量不确定度包括由系统影响引起的分量,如与修正量和测量标准所赋量值有关的分量及定义的不确定度。有时对估计的系统影响未作修正,而是当作不确定度分量处理。
2. 此参数可以是诸如称为标准测量不确定度的标准偏差(或其特定倍数),或是说明了包含概率的区间半宽度。
3. 测量不确定度一般由若干分量组成。其中一些分量可根据一系列测量值的统计分布,按测量不确定度的A类评定进行评定,并用实验标准差表征。而另一些分量则可根据经验或其它信息假设的概率密度函数,按测量不确定度的B类评定进行评定,也用标准偏差表征。
与第2版相比,附注1是新添加的,叙述不确定度分量源自系统效应和“定义不确定度,definitional uncertainty*”。还提到测量标准品赋值的纠正。如未纠正,则应将其作为不确定度分量。附注2的内容基本与原附注1相似,但叙述更为明确,例如明确了标准不确定度。同样附注3将原来叙述明确了A类不确定度评估和B类不确定度评估。附注4则更明确将测量不确定度应和测量物声称量值相结合。但不知什么原因,我国征求意见稿中没有翻译注4。
在VIM对“测量不确定度”定义进行修改同时。GUM文件也有新的补充。JCGM在2008年公布了JCGM 100:2008 GUM 1995 with minor corrections。在此最新GUM文件中,在附录D中对不确定度补加了下述说明(为了避免由于翻译不当,引起误解,所以列出原文,只翻译某些要点):
D.5 Uncertainty
D.5.1 Whereas the exact values of the contributions to the error of a result of a measurement are unknown and unknowable, the uncertainties associated with the random and systematic effects that give rise to the error can be evaluated. But, even if the evaluated uncertainties are small, there is still no guarantee that the error in the measurement result is small; for in the determination of a correction or in the assessment of incomplete knowledge, a systematic effect may have been overlooked because it is unrecognized. Thus the uncertainty of a result of a measurement is not necessarily an indication of the likelihood that the measurement result is near the value of the measurand; it is simply an estimate of the likelihood of nearness to the best value that is consistent with presently available knowledge.
在这一段中,将误差和不确定度关系,作了进一步叙述:“既使评定的不确定度小,也不能保证测量误差小;……。由于不认知,可能忽视了系统效应………”。
D.5.2 Uncertainty of measurement is thus an expression of the fact that, for a given measurand and a given result of measurement of it, there is not one value but an infinite number of values dispersed about the result that are consistent with all of the observations and data and one''''''''''''''''s knowledge of the physical world, and that with varying degrees of credibility can be attributed to the measurand.
“测量不确定度只表达了:对一特定测量物以及其测量的一定结果,并不是一个而是分散在结果的无限个数值………”。
D.5.3 It is fortunate that in many practical measurement situations, much of the discussion of this annex does not apply. Examples are when the measurand is adequately well defined; when standards or instruments are calibrated using well-known reference standards that are traceable to national standards; and when the uncertainties of the calibration corrections are insignificant compared to the uncertainties arising from random effects on the indications of instruments, or from a limited number of observations (see E.4.3). Nevertheless, incomplete knowledge of influence quantities and their effects can often contribute significantly to the uncertainty of the result of a measurement.
在这段中,提到“当测量物是确定的,标准品或仪器可用溯源到国家标准品的参考标准品进行校准时,以及当由校准纠正的不确定度,与仪器指示的随机效应,或有限次测量所引起的不确定度相比是很小时。非常幸运地,在这些实际测量情况时,不一定采用此附录中讨论的很多(复杂计算)……”。
而在临床化学和临床血液学常规项目中不少测量正如同D.5.3所叙述的情况。为我们在这些测量中,使用一个评估不确定度较简单方法,提供了可能和理由。
从这一段笔记中,笔者认为对不确定度的学习切忌将术语的定义绝对化。事实上,标准化和标准文件也是在不断进步和发展中,并不排除将来在科学发展基础上,根据检验医学专业特点,对测量不确定度做出特定的解释和应用。
纵向理解
在解释了测量不确定度含义后,笔者企图从纵向,历史发展来看测量不确定度。发现“不确定度模式,uncertainty model”,和“误差模式,error model”一直存在着争论。二者都是面对测量过程中的同一现象,即测量结果不存在绝对不变化的真值。从历史上看,200年前,随现代工业化发展,“推动了精确测量的发展,机械工具、汽轮机、枪等维修时的零件要求互换,要求考虑制造的允(许误)差”。并很快接受了误差模式的理论,在我国,国家技术监督局在1991年批准实施《测量误差及数据处理》国家计量技术规范。在检验医学中,美国的Westgards在1974年根据误差理论,即偏倚(bias)和不精密度(imprecision)发展了相应的质控理论、函数方程式和著名的Westgards质控规则。
下面一大段叙述主要引自刘智敏研究员2000年所著“不确定度及其实践”一书中1.2不确定度一节,并根据JCGM 100:2008 GUM 1995 with minor corrections引言加以补充。
【就在误差模式在计量学和检验医学得到发展的同时,也出现了不同的声音。“1953年,Beers在《误差理论导引》书中指明:当我们给出实验室误差为x时,它实际上是以标准差等表示的估计实验不确定度”。首次在表达实验结果的误差时,使用了“不确定度”术语。1963年美国标准局的Eisenhart在“仪器校准系统的精密度与准确度估计”中,明确提出使用“不确定度”的建议。但是在当时并未受到学术界的重视。
1970年英国标准机构的Deitrich在“不确定度、校准和概念”一书中给不确定度以如下描述“测量不确定度为一组测量平均值一边的范围,当作了很大数目测量时,读数的给定部分位于该范围内。”1973年,英国国家物理实验室的Burns等人在杂志“Metrologia”发表论文“误差和不确定度”中提出在讨论准确度(accuracy)时,宜用不确定度。并认为当人们说测量误差为±1%,应认为实际上是测量结果的不确定度。
到1977年,美国标准局局长Ambler提请国际计量委员会(CIPM)注意“不确定度”问题的重要性。CIPM在同年要求国际计量局(BIPM)与国家标准实验室共同讨论此问题并提出相应建议。BIPM制定了一个征求意见书,送到32个国家计量实验室。到1979年收到21个实验室回复,几乎所有实验室都希望有一个国际上都能一致同意的建议。所以1980年BIPM召开会议,讨论对此意见书的各国和国际学术团体的反馈,并提出一份“表达实验不确定度的建仪书”,简称为INC-1(1980),有如下内容:
测量结果的不确定度一般包含若干分量,按其数值评定方法,可归入两类:
A类:用统计方法计算的那些分量;
B类:用其它方法计算的那些分量。
在以前曾使用过“系统”和“随机”不确定度。建议书指出:A、B二类方法并不与此二类不确定度之间存在简单关系。并认为“系统”不确定度术语易引起误解,应避免使用。A类分量用估计方差si2(如估计标准差si)、自由度vi表达。必要时,可给出估计协方差。B类分量用量uj2表达。可认为与假定存在的方差近似,可以像方差那样处理量uj2。或像标准差那样处理量uj。必要时,用相似方法处理协方差。用通常合成方差的方法求得表征合成不确定度的量值。应以“标准差”形式表示合成不确定度及其分量。对特殊用途,须将合成不确定度乘以一个因子以获得“总”不确定度时,必须说明因子的数值。
1981年,在CIPM第70届会议,批准上述文件并形成建议书1(CI-1981)《实验不确定度的表示》。文件指出,需要找出一个可大家同意的表示不确定度方法,并可以INC-1作为同意的基础。我国国家计量研究院在1985年制定了《不确定度应用方法》,指出应按INC-1评定不确定度。在1986年CIPM第75届会议,通过了建议书1(CI-1986)《CIPM赞助进行的工作中不确定度的表示》。不仅决定推广上面介绍过的INC-1(1980)内容,还特别指出文件中第5)点有商业应用的价值,要求在CIPM支助的国际PT(能力比对)以及其它活动中,要给出合成不确定度。
1986年,由国际标准化组织(ISO)、国际电工委员会(IEC)和CIPM、国际法制计量组织(OIML)组成了国际不确定度工作组,我国计量研究院也派专家刘智敏研究员参加此项重要工作。经过多年研究、讨论,并广泛征求各国及国际专业组织意见,经反复修改,终于在1993年制定并公布了现在有关“测量不确定度”最有权威,也是基础的文件《Guide to the Expression of Uncertainty in Measurement,GUM》,并在1995年勘误后又重印,在2008年又经勘误和少些修改后重新出版。
GUM得到国际权威组织和各国计量学界广泛和热烈的响应。公布GUM文件时,不仅得到制定的四个国际组织,还得到了国际理论与应用化学联合会(IUPAC)、国际理论与应用物理联合会(IUPAP)以及检验医学中最大国际组织-国际临床化学联合会(IFCC)的批准。此七个组织组成了JCGM,到2005年国际实验室认可组织(ILAC)正式参加,成为JCGM的第八个成员。
欧洲的EURACHEM和CITAC二组织很快在1995年就制定了《Quantifying Uncertainty in Analytical Measurement,QUAM》,并在2000年修改后颁布第二版,为将GUM原则和方法运用在分析化学定量测定中评定测量不确定度,提出具体的四个步骤。在2007年又颁布了“measurement uncertainty arising from sampling”导则,对QUAM中涉及较少的分析前阶段的样本采集,处理过程中的不确定度的来源和评定作了进一步说明和解释。】
从上述历史发展可以清楚看到了“测量不确定度”的价值和意义。我国在测量不确定度方面权威刘智敏研究员在其2007年出版的《实验室认可中的不确定度和统计分析》一书的前言中写到“不确定度和统计分析是实验室建设的基石。实验室测量结果的水平如何,要以不确定度表示,实验室测量结果是否可用, 要以不确定度说明。不确定度愈小,检测水平愈高。各实验室检测结果比对时,他们的差不得超过不确定度,否则结果不可用。”
但是,对有如此重要意义的理论和概念,不同国家的认识和重视并不尽相同。以美国为例,作为积极提倡使用不确定度的计量权威单位,国家标准和计量研究院(NIST)在1992年制定了基于GUM的不确定度方针,1993年制定了基于GUM的《Guideline for Evaluating and Expressing the Uncertainty of NIST Measurement Results》,所有NIST的报告均应遵循此文件的要求,在报告测量结果时还应报告不确定度。
此项措施得到不少专业组织响应。例如1997年由美国国家标准院(ANSI)发布的国家标准《U.S. Guide to the Expression Uncertainty in Measurement》,全面采用GUM。不少专业团体,如美国检测与材料协会(ASTM)颁布了《Standard Guide for Estimating Uncertainty in Dosimetry for Radiation Processing》;又如国家实验室自愿认可计划(NVLAP)要求实验室认可时遵循GUM要求;国家标准实验室委员会(NCSL)以GUM为基础,制定了文件RP-12《Determining and Reporting Measurement Uncertainty》分发到上千家实验室,要求评定和报告测量不确定度。
形成鲜明对比的是美国检验界,其最著名的标准制定组织-Clinical and Laboratory Standard Institute,CLSI(原称National Committee for Clinical Laboratory Standards,NCCLS)从1976年成立到至今发布的近200个标准中无一个涉及到测量不确定度,反在2003发布了一个EP 21-A《Estimation of Total Error for Clinical Laboratory Methods》文件。这也从另一方面说明:虽然目前大多数国际和国家计量学以及其它专科组织接受“测量不确定度”概念和理论,但它与 “误差”概念和理论的争论仍然存在。科学和真理将在争论中得到发展和完善。
笔者认为,我们现在提倡学习“测量不确定度”并不应该是简单地肯定它和否定“测量误差”。而是应该将此二个重要概念和模式作一个客观的比较,探讨它们的优缺点和不足之处。
(第一部分完)
---------------------------------
*VIM为International Vocabulary of Basic and General Term in Metrology的简写
*JCGM为Joint Committee for Guide in Metrology的简写,开始由公布GUM的7个国际组织组成,2005年国际认可组织,ILAC正式加入,成为JCGM第8个国际组织。
*第三版VIM在2004年提出草案,并在2008年以下列题目公布:JCGM 200:2008, International vocabulary of metrology — Basic and general concepts and associated terms (VIM).
*在我国“通用计量术语及定义”的征求意见稿中,将“定义的不确定度 definitional uncertainty”翻译为: 由于被测量定义中细节量有限所引起的测量不确定度分量。作者: ttyn727 时间: 2016-8-18 22:53
很有见解,支持作者: 2支棒棒糖 时间: 2016-8-19 00:40
很有啟發。從較為宏觀上對Uncertainty作了闡述。
目前,定性分析的不确定度逐渐走入人们视野,VIM3在关于标准物质的注释1表明,定性分析也有不确定度,但这个不确定度不是通常所说的测量不确定度,言下之意目前的测量不确定度针对量的测量而对性质的判定无能为力。定性分析的不确定度究竟是什么,我们可以从DNA序列的定性一窥究竟。JRC及IRMM联合发布的指南:Guidance document on the use of RM in genetic testing认为,基因检测的不确定度是序列错误读取的可能性,可见定性的不确定度实际上是判定结果出错的概率。当然,目前尚未见到统一的关于定性不确定度分析的指南。相信各领域组织间的争论仍在继续。作者: 流氓插件 时间: 2016-8-19 02:32
不确定性是世界的本质,物理学家海森堡提出的不确定性原理指出的就是:即使排除了所有环境与方法的影响,人类也无法测量某些物理量。就像国际计量局Andrew.J.Wallard在2010世界计量日的致词中所说的,大自然限制了我们的测量能力作者: ck99945 时间: 2016-8-19 02:44
这个概念有点难度
要慢慢理解的