耐特信计量检测服务平台_计量管理软件

快捷导航
计量基础
收藏本版 |订阅

计量基础 今日: 0|主题: 1927|排名: 2 

发新帖
打印 上一主题 下一主题

标准偏差概念,您确定很理解它吗?...

[复制链接]
wangwu 发布于: 2016-8-18 15:56 1509 次浏览 7 位用户参与讨论
跳转到指定楼层
武汉大学 叶晓明

论文《The new concepts of measurement error theory》(Measurement, Volume 83, April 2016,Pages 96–105)的早期中文版曾投往国内某权威测量学报,其中有一段关于精度(精密度,precision)概念并非发散度的论述,强调单一测量结果并不存在离散问题。但是,这个版本却被审稿人直接以现有文献为依据给否定了,审稿人认为我连测绘学的精度概念都没有理解清楚。

也许您也会说,精度可不就是测量结果的发散度吗?现有测量教科书、测量标准(包括国际标准)等不都是把标准偏差解释成分散度或分散性吗?那么,我这里只能很遗憾地告诉您,您也没有真正理解标准偏差的概念内涵。而且,不仅您,当前测量界真正正确地理解这个概念的人并不多。教科书、测量标准(包括国际标准)等都把标准偏差解释成了测量结果的分散度或分散性,恰恰就说明了这个事实。

标准偏差是概率论中的概念,其定义就是σ2=E(X-EX)2。在现代测量中,有时用它表达精度(精密度),有时用它表达不确定度。但无论是精度还是不确定度,人们的思维总跟“离散度”、“发散性”纠结在一起,这些字眼在精度和不确定度的概念定义中都能看到。虽然有些学者已经注意到一个唯一的测量结果没有发散性问题,却又想当然地把它理解成未来重复测量结果的发散度,这仍然是个错误的理解。

标准偏差的概念解释是现有测量理论的一大败笔,作者在《现有测量学理论的几大败笔》(http://www.sciencenet.cn/dz/showdz.aspx?id=937)中也曾以珠峰高程结果8844.43米、标准偏差±0.21米为例指出过这个问题:

1、一个唯一的8844.43是没有发散之说的。

2、也不能解释成未来同样测量条件下重复测量结果序列的发散度。因为如果同样测量条件下重复测量,重复测量中各种测量条件(包括仪器内外各种环境条件、操作者的主观条件等)都保持绝对不变(这实际不能实现),那必然是,每个测量的误差形成过程一模一样,测量结果将永远是8844.43同一结果,测量结果序列也就不可能发散,离散度当然就是0。但每个结果的标准偏差却都仍然还是±0.21,因为每个测量过程都是一模一样。

3、也不能解释成未来不同测量条件下重复测量结果序列的发散度。因为如果每次按不同条件进行重复测量,测量结果虽然会表现离散,但那跟当前的标准偏差没有联系。如果测量条件变化太随意,结果序列必然过分离散;如果测量条件变化太少,离散度又将非常小;究竟多少变化条件刚好使离散度正好是±0.21米?只有天知道。

用珠峰高程做实验不现实,但用一个电子秤做个称重实验总还容易实现。用电子秤的MPE(最大允许误差)做依据分析出其称量的某个重物重量的标准偏差,然后分别用同样条件、不同条件重复测量试试看?看看重复测量的分散度跟前边的标准偏差能吻合否?

那么,标准偏差概念的正确解释究竟应该是怎样的呢?

首先,我们得看看概率论是做什么的。很显然,概率论研究的是一个未知事件的概率。一个已知事件是不存在概率问题的,一批已知事件也同样不存在概率问题,事件都已经是确凿已知的那还有什么概率可谈呢?

其次,一个未知事件一定只能只有一个结果,如果这个事件的演变过程的来龙去脉规律都被人类完全掌握,那么这个结果就完全可以推定出来,就当然也不需要概率论了。而事实是,人类对各种自然规律的掌握只能做到有限,仍然有许多微观细节的过程不能完全掌控,这些没有掌控的过程是模糊不确定的,或者已经掌控的过程中仍然存在没有完全掌控的模糊成分,甚至人们有时还有意地对已经掌握的规律过程也按模糊过程来处理。这些模糊的过程条件对结果的概率区间的影响毕竟都是有限的,这就是人类研究概率论的原因。就是说,事件结果未知不确定的根源是过程的模糊不确定,模糊不确定的过程条件当然就不能扯什么“同样条件”字眼了。谁能保证硬币的从抛出到着地的所有条件过程每次都是一模一样?

那么,概率论是如何对一个未知事件的概率进行研究的呢?答案是,实验统计和原理分析相结合。根据硬币二面等概率原理推定抛掷试验中各面朝上概率是50%,这就是原理分析;而根据大量抛掷实验进行统计得出各面朝上概率是50%,这就是实验统计。而诸如方差传播率等也是原理分析方面的重要规律。

标准偏差的概念定义σ2=E(X-EX)2表达的实际就是一个实验统计原理而已,通过对一批已知测量结果的离散性进行统计分析,评价其中任意一个测量结果单独发生时所存在的概率区间,这才是分散性和概率的对应关系。获得一个测量结果序列{Xi}(实验样本),通过σ2=E(X-EX)2计算出标准偏差σ,这样,对于任意一个独立发生的测量结果Xi来说,它就一定存在于一个以EX为数学期望以σ为标准偏差的概率区间内。就是说,当任意一个独立的测量结果Xi被给定了以后,独立测量结果与数学期望之差Xi-EX是个恒差,这个恒差存在于一个以0为数学期望以σ为标准偏差的概率区间内。也就是说,标准偏差σ是误差Xi-EX所存在的概率区间的评价值,它表达误差Xi-EX在概率区间内各点都有存在的可能,只是概率各不相同。但请特别注意,这并不是说误差在概率区间内随时间随机不停地变化——绝对不可以这样偷换概念!

因为测量结果序列{Xi}的获取过程是存在模糊条件的,每一个Xi的形成条件都实际上存在差异,未来的测量条件与当前测量条件无法建立确凿的比拟关系,我们自然不必要把当前的标准偏差和未来的测量结果纠缠在一起说事。我们只需说,在当前已有的n个Xi样本中,任何一个独立样本与数学期望之差Xi-EX的标准偏差都是σ。这就足够了。未来的测量自然有未来的测量结果,自然也会有它相应的标准偏差评价,是另外一回事情。

而进一步的事实是,当人们在测量实践中获取了n个离散的测量结果Xi的时候,这时必须按照一定的准则给出最佳唯一测量结果(测绘学叫平差)。譬如:按最小二乘原理可得出最佳唯一测量结果为其均值Y=(X1+X2+…+Xn)/n,这时唯一测量结果Y与数学期望之差Y-EX的标准偏差就是σ/√n了。

最终唯一测量结果与数学期望之差是个未知的恒差,这个恒差的大小程度用标准偏差来描述,标准偏差是一个含有概率意义的误差存在范围的概念,这才是标准偏差的概念实质。人们过去的误区就是只注意到分散性统计,甚至跟什么白噪声等联系起来,而忽视了分散性统计的真实目的——评价一个测量结果的一个未知误差的概率区间。把标准偏差、精度、不确定度等定义为分散性评价自然就不妥了。

现在,测量结果与数学期望之差——所谓的随机误差是个未知的恒差,这个恒差的大小程度可以用标准偏差来评价。那么,一个更进一步的问题是,数学期望与真值之差——所谓的系统误差也是个未知的恒差,是否也可以用标准偏差来评价呢?答案当然是肯定的,这只需站在造成这个恒差的上游测量的角度看问题即可,而所有上游测量那里的测量统计分析的过程和当前测量过程在本质上实际是完全相同的。

当您理解到这里的时候,请接受我的欢迎,您已经走上了我的新概念误差理论的主体思路:误差都是恒差(站在给定测量结果的角度)、都遵循随机分布且都有标准偏差评价其概率区间,误差不存在系统和随机的类别之分;误差合成——代数法则,标准偏差合成——概率法则;精度、正确度和准确度就该作废了,不确定度就有了很明确的概念内涵了。


2016 6 12于武汉大学
回复

使用道具 举报

已有7人评论

沙发
蔡鑫 发表于 2016-8-18 17:03:47
未来如何,得对未来的情形进行具体分析,以后的事情由以后去说。以后不排除与当前存在类比关系,但请注意标准差说的是当前而不是以后,请多注意下面这段文字:

因为测量结果序列{Xi}的获取过程是存在模糊条件的,每一个Xi的形成条件都实际上存在差异,未来的测量条件与当前测量条件无法建立确凿的比拟关系,我们自然不必要把当前的标准偏差和未来的测量结果纠缠在一起说事。我们只需说,在当前已有的n个Xi样本中,任何一个独立样本与数学期望之差Xi-EX的标准偏差都是σ。这就足够了。未来的测量自然有未来的测量结果,自然也会有它相应的标准偏差评价,是另外一回事情。
回复 支持 反对

使用道具 举报

板凳
dzlqsq 发表于 2016-8-18 17:06:02
根据JJF1001-1998《通用计量名词及定义》,精度一词不再使用。不知道在测绘方面这个术语方面是怎么规定的,麻烦楼主能讲解一下。
回复 支持 反对

使用道具 举报

地板
wangyoo2003 发表于 2016-8-18 17:18:20
非常感谢,您对标准偏差从数学模型中解释,每次测试得出误差都是恒差,我非常的赞同。
所有测试过的值都有恒定的误差,而为了反应未来测试时,测试值误差可能产生范围,我们进行多次测试,希望以实验统计和原理分析相结合,模拟出未来可能产生的结果。标准偏差在数学中反应的是分散性,反映组内个体间的离散程度,但我们用这个分散性反应未来的测试结果,那么必然是概率的事情。
正如楼主所说,我们做这么多次测量,给出标准偏差,给出不确定度等一系列的数据,不是为了反应之前测试的值的,那都是恒定的,在条件不同后,测试都结果都是会变的。。我们是为了反应未来的情况,在给定未来的测试条件范围后,经实验统计和原理分析,我们可以推断未来的测试结果在一定概率下存在于我们的不确定度范围内。使得计量测试得以传递,这才是目的。
回复 支持 反对

使用道具 举报

5#
lillian0630 发表于 2016-8-18 17:50:31
很专业学习了
回复 支持 反对

使用道具 举报

6#
c99945 发表于 2016-8-18 18:49:45
是这样的啊,但现在给出的测量数据的目的是给未来测试使用的 啊。。不然计量的目的何在?
我知道这些数据是当前的分析,但我们的目的,和实际的运用,都是用这些现在的数据去反应未来可能发生的测量结果,这就是概率的事情了啊。
回复 支持 反对

使用道具 举报

7#
光头人1 发表于 2016-8-18 19:57:17
给未来使用没错,但不代表未来的测量结果就一定如何如何,没有这种预测功能,至多只能说:未来如果能做到同样的测量条件(实际不可能做到,“同样”只是个理想),那么肯定还是一样的结果和一样标准差;未来测量条件和当前肯定不一样,结果就肯定说不清楚了,试想想,谁能保证未来重复测量珠峰高程多个结果的离散度正好就是0.21?一个人身高的测量结果的不确定度是1cm,谁能说未来重复测量这个人的身高其多个结果的离散度就是1cm?

测量的目的首先是要对当前的误差做出评价,当前都说不清,未来就更说不清了。
回复 支持 反对

使用道具 举报

8#
spiegesq 发表于 2016-8-18 20:11:58
精度---精密度也。主贴中有明确说明呀。

因为系统误差都被改正了(没有正确度问题),精度(精密度)就等于准确度了,就这么个逻辑。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册   

本版积分规则

QQ| 耐特信计量检测服务平台_计量管理软件  

Copyright © 2001-2016 Netson Inc.   All Rights Reserved.

Powered by Netson ( 粤ICP备14061212号-1 )

快速回复 返回顶部 返回列表