耐特信计量检测服务平台_计量管理软件

标题: 请教:当出现三次极值时,难道Dixon就无法当做异常值剔除? [打印本页]

作者: caixin    时间: 2017-5-30 18:25
标题: 请教:当出现三次极值时,难道Dixon就无法当做异常值剔除?
本论坛的罗曼先生问了一个问题,Dixon准则中的极值是不是观测值。
今晚我把Dixon先生当初的论文看了一遍,又找了几本资料,人家的确是观测值,只不过Dixon的观测值排列是随序号严格单调递增的。
但是我们的考题和日常中经常出现一些等值情况,这个时候把n看做观测次数我觉得会出现极为荒谬的事情:
比如,设备检测值未0.02%,0.03%,0.02%......0.02%,0.05%,2000%
最后的数值明显不对头了,假设大于50次测量中,2000%(或其他已经鬼知道的数值)出现了三次,那么Xn-Xn-2恒为0,故γ恒为0,γ恒≤γ‘,那些鬼知道的数值恒为正常值,岂不是无论是几都无法按照迪克逊准则进行剔除?这个时候已经不是近似正态分布说事的时候了,可是还要守着统计剔除法么?
物理辨别法也不能用,这岂不是很荒谬?请于指惑,谢谢
作者: 快乐.每一天    时间: 2017-5-30 19:40
GB/T 4883-2008 数据的统计处理和解释正态样本离群值的判断和处理,中给出了适用范围。您的例子,假设极值2000%出现3次,如果是正常的正态分布(假设真的是测量结果,那必然要先确认测量过程的,但这里只考虑数学问题),a为0.05时,出现3个2000%的概率微乎其微0.05*0.05*0.05。

那么准则中a值的含义就很能说明问题了。当一个值使用狄克逊准则D(α,n),a=0.05时被判为离群值该如何解说呢?此值有95%的概率为离群值?不被狄克逊准则判异就一定不是异常值嘛? 这和不确定度应该应该差不多,比如一个测量值的测量结果和不确定度为A=10+/-1 (k=2),那么你只能说真值有95%的概率在9~11,真值可能等于2000嘛?如果按正态分布,那是有可能啊,只是概率很低很低呗。

我估计,狄克逊准则统计判断离群值,应该和SPC控制图类似,存在误判的可能,而且判误的概率可能都是可以准确计算出来的。




欢迎光临 耐特信计量检测服务平台_计量管理软件 (http://weblims.cn/) Powered by Discuz! X3.2