耐特信计量检测服务平台_计量管理软件

标题: 一着失手整盘皆空——关于相关性的讨论(1) [打印本页]

作者: wangwu    时间: 2016-8-18 18:27
标题: 一着失手整盘皆空——关于相关性的讨论(1)
-
                                  一着失手整盘皆空
                                          —— 关于相关性的讨论(1)
                                                                                                                    史锦顺
(一)《测量不确定度评定指南》的例子
       《测量不确定度评定指南》(国家质检总局组编,2000年)以下简称《指南》。
       《指南》上的例子及计算,本文称第一组测量,史锦顺重算。
A:电压测量(单位:伏)
       序号                V11           V12            V13             V14             V15  
                            5.007         4.994          5.005          4.990          4.999
       电压平均值:V(平)1=4.999
       残差              v(V)11        v(V)12        v(V)13         v(V)14         v(V)15
                            0.008         -0.005,      0.006          -0.009            0
                                                                                                           检验 ∑v(V)1i=0
       残差平方 (×10^-4)  
                             0.64           0.25             0.36            0.81            0  
       残差平方和及处理:[∑v(V)1i^2]/4= 0.0000515  开方得:
                    σ (V) = 0.0072

                               除以根号5——2.236,得σ (V平)=0.00322 与《指南》一致。

B:电流测量(单位:毫安)
       序号                  I11            I12            I13             I14            I15
                             19.663       19.639        19.640        19.685       19.675
       电流平均值:I(平)1=19.6604
       残差                v(I)11       v(I)12          v(I)13         v(I)14        v(I)15
                            0.0026      -0.0214        -0.0204        0.0246       0.0146
                                                                                                               检验 ∑v(I)1i=0
       残差平方(×10^-4)
                             0.0676       5.5796         4.1616        6.0516       2.1316
       残差平方和(×10^-4)
       16.992 除以4得4.248  开方得 2.016(×10^-2)
                σ (I) = 0.0206

                              除以根号5(2.236)得σ (I平)=0.00922(《指南》上为0.0095,取平均值少一位,算得不准)
-
C: 相关系数计算
                    r={[∑v(V)1i v(I) 1i] /4} / [σ (V) σ (I)]
       重写A:  v(V)1i= V1i-V(平)1
       电压残差        v(V)11        v(V) 12          v(V)13         v(V)14          v(V)15
                             0.008         -0.005            0.006          -0.009             0
       电流残差        v(I) 11        v(I) 12           v(I)13          v(I)14          v(I)15
                            0.0026       -0.0214          -0.0204         0.0246         0.0146
       同序号项乘积(×10^-4)
                        v(V)11 v(I) 11     v(V)12 v(I) 12      v(V)13 v(I) 13     v(V)14 v(I) 14      v(V)15 v(I) 15
                              0.208                   1.07                   -1.224              -2.214                     0
       求和 –2.16  除以4 得-0.54  写全,分子为  0.000054    分母为σ (V)σ (I)=0.0072×0.2061=0.000145
       相关系数:
                        rb = -0.000054/0.000145     
                        rb   ≈ -0.37    (《指南》为-0.36)
       从以上算法可知,这是基于残差的一种求法,结果rb是电压电流测得值的随机误差的相关性。
-
(二)史锦顺改题:求误差间的相关系数
       本文称第二组计算。设本次测量数据来自对标准电压4.950V、标准电流19.400毫安的测量。设标准的误差范围可略。

A:电压测量(单位:伏)原题数据,着眼点测量误差(以真值为参考)
       序号                    V21            V22             V23              V24              V25  
                                5.007           4.994          5.005           4.990           4.999
       电压标准值(真值)=4.950
       误差                 w(V)21          w(V)22         w(V)23        w(V)24         w(V)25
                                0.057            0.044           0.055           0.040           0.049
       误差平方×10^-4
                                 32.49           19.36           30.25          16.00            24.01
       误差平方求和 122.11  ,   除以5得24.422   开方得4.94
                   σ (V)=0.0494

B:电流测量(单位:毫安)  I(真)=19.400
     序号                       I21              I22               I23                I24               I25
                                19.663         19.639           19.640           19.685         19.675
     误差                     w(I)21         w(I)22           w(I)23            w(I)24        w(I)25
                                 0.263          0.239             0.240             0.285           0.275
     误差平方              0.0692          0.0571           0.0576           0.0812         0.0756
     求和  0.3407   除以5   得0.06814    开方得
         
                σ (I)=0.261  
-

C: 相关系数计算
       重写A:   
       电压误差           w(V)21        w(V) 22          w(V)23        w(V)24          w(V)25
                                 0.057          0.044            0.055           0.040           0.049   
       重写B:   
       电流误差           w(I) 21         w(I) 22          w(I)23         w(I)24          w(I)25
                                 0.263           0.239            0.240           0.285           0.275
       同序号项乘积
                   v(V)21 v(I)21      v(V)22 v(I) 22       v(V)23 v(I) 23      v(V)24 v(I)24       v(V)25 v(I) 25
                        0.0150                0.0105                 0.0132                0.0114                 0.0135
       分子 求和 0.0639    除以5得0.01278
       分母  σ (V) σ (I)=0.0494 ×0.261=0.01289
       相关系数:
                rc = 0.01278/0.01289 = 0.9915  

                rc=0.99                 
-
(三)量值间的关系
       测量计量的研究对象是量值。在所研究的问题中,量值是有特定关系的,因此量值一般是相关的。
       电压、电流是两个不同的量值。谈它们之间的关系,不能空论,要结合具体的实践问题。
       第一个常见的问题是计算电功率。加在负载上的电压与流过负载的电流,决定负载上的电功率为
                  P = VI                                                                                (1)
       公式(1)表达的是物理规律。如果负载是电阻,(1)式是电能转化为热能的功率;如果负载是电动机,(1)式是电动机做功的功率。如果负载是一台电动火车,(1)式表明的是火车运行的功率。
       物理公式(1)把电压与电流两个量紧密联系在一起,电压与电流二量是强相关的。
       第二个常见的问题是表达电阻上的电压与电流的关系
                  I=V/R                                                                                  (2)
       公式(2)是著名的欧姆定律。电阻把加在其上的电压与电流二量紧密的联系在一起。电压与电流二量在电阻上强相关,相关系数是+1.
       人们研究量值,在涉及不同的量时,通常是研究他们的关系。存在关系的量之间,通常是相关的。
-
(四)误差之间的关系
       误差合成问题,研究的是误差之间的关系。各个分项误差,构成总误差。
       函数的全微分,等于函数对各个自变量的偏微分之和。有量的函数关系,就必定有函数的微分关系。微分用于误差分析,函数对各个自变量的偏微分,就是各项误差对总误差的贡献。量值间的函数关系,导致误差的叠加关系,因此,误差间必定是相关的。测得值的平均值与真值的差,是系统误差。系统误差是常量,系统误差之间的关系:相关系数是+1或-1。测得值对平均值的差是随机误差。随机误差可正可负,有对称性及有界性;各个随机误差的作用,有抵消性。当测量次数足够多时,且当随机误差间不相关时,随机误差的总作用为零。
       “方和根法”的前提条件是交叉项之和为零,仅对随机误差有可能成立;而对系统误差是不成立的。测量仪器通常是以系统误差为主的,因此,用“方和根法”处理仪器的误差问题,通常是不当的。  
-
       1980年以来,不确定度理论(包括80后的部分误差理论书籍),推行“方和根法”,其理论根据就是“不相关”。用“不相关”来说明二量之和的平方等于二量之平方的和;也就是交叉项之和为零。其实,这是一种假设,这种假设通常是不成立的。
       “假设不相关”的理论基础与验证方法,是统计理论中的相关系数公式。这个公式,放在测量计量学中,本质仅仅是针对于残差(测得值减平均值)的公式。该公式对系统误差的灵敏度为零。因此,它不能判别有系统误差存在情况下的相关性。
       测量仪器通常以系统误差为主。系统误差间的强相关,交叉项消不掉,这就导致“方和根法”通常是不成立的。
       不确定度理论的庞大系统:1被测量与误差的各种各样的、难以求知的分布规律;2 相关性的分析、验证以及不负责任的大量的“不相关假设”;3 否定系统误差的客观存在,把误差都转化为随机误差;4 把仪器的误差范围转化为方差再转化为范围的往返穷折腾;5 分析计算自由度……这一切,都是服务于“方和根法”的应用。这个体系的根本要害,是“假设不相关”能否成立。
       原来,现在用的相关系数公式是针对残差的公式;对误差问题,用不上。一招失手,全盘皆空。相关系数公式选用不当,成了不确定度论的滑铁卢。
-
       本文是个开头。后文重点分析交叉项的问题。希望网友都来关注一下。因为这涉及对不确定度理论的评价,特别是涉及不确定度评定的合理性。
-




补充内容 (2015-10-16 11:51):
"随机误差的总作用为零”一句,修改为:对交叉项来说,随机误差的总作用为零。
作者: 蔡鑫    时间: 2016-8-18 18:59
这样的结果是必然的(实际的“真值”情况只会是其中一种,或一种都不是----可能每个测得值样本对应的“真值”是不一样的),但看不出此结果如何就能表现那“相关系数”“不具有一般性”?  是指“仅由两个序号关联的测得值序列得不到确定的相关系数”吗?----这正是史先生的结论啊:一般情况下,仅由两个序号关联的测得值序列是得不到“测量误差合成”所需要的那个相关系数的!【本人赞同】
作者: 流氓插件    时间: 2016-8-18 19:31
你具体算算就知道了,分子变了,相应的,分母中的“标准差”不跟着变吗?.... 理论极限是“+1”或“-1”,除非计算误差的影响。


不能按【在当前假设的真值情况下已经为1了,如果...】的思路推论,所谓的“当前值为1”,其实或为"0.999",若真值再小点,算出的值便可能是"0.99978"了,如此而已。
作者: gxf    时间: 2016-8-18 19:41
  残差是以测得值为中心计算出来的,此话不假,因此表述了被测量测得值误差范围(区间)的半宽度。但不确定度不是以测得值为中心的区间半宽度,而是以被测量真值最佳估计值为中心的被测量真值存在区间的半宽度。概念上的不同,在判定各自分量间的相关性,以及计算的相关系数大相径庭,不能混淆不清。
  同一个计算公式中的变量与自变量以及自变量之间必然是相关的,无关也就不会同时出现在同一个计算公式中。计算公式I=V/R中,I与V成正比,V增加 I 必增加,V减小 I 必减小,因此史老师的统计计算结果为rc=0.99≈1实属必然,说I与V不相关一点道理都没有,这是典型的“强相关”,“一辱俱辱,一荣俱荣”。
  不确定度评定的测量模型I=V/R中,I是输出量,V是输入量,输入量与输出量之间从不讨论相关不相关,所谓相关性是指两个输入量之间的关系,只能讨论V与R间是否相关,说I与V相关就是概念混乱的笑谈。根据JJF1059.1的4.4.4.1条a)款不确定度分量相关性估计的原则,V和R是用“不同的测量设备”且各自“独立测量的不同量的”测得值,两个不确定度分量属于典型的不相关,此时说V与R相关也就是笑话了。
作者: 一条龙    时间: 2016-8-18 19:42
  ssln 说的很好,“不确定度评定的是测量不确定度分量间的相关性,不是测量列的相关性”,“是测量各分量随机性因素间的相关性”,不是量值之间存在着的物理计算关系,因此“假设不相关当然是合理的”,史先生计算出的相差系数rc=0.99≈1,是物理公式I=V/R中V和I 的相关系数,没有关系的数个变量也就不会写在同一个公式中了。I=V/R中V与I成正比,V增加 I 必增加,V减小 I 必减小,因此统计计算结果必为rc=0.99≈1。不确定度分量的相关性是完成电功率测量时,测量 V 时引入的不确定度分量与测量 I 时引入的不确定度分量的相关性,不是V与 I 的物理关系相关性。
作者: chaojiwantong    时间: 2016-8-18 19:42
求相关系数,按数学知识及相关公式(与不确定度无关),是要用残差来求的,怎么可能用误差来求,错误使用公式只能得到错误的结果。像(二)中的:“设本次测量数据来自对标准电压4.950V、标准电流19.400毫安的测量”,你把电压和电流再设小点,然后误差就会变大点,然后你算出的相关系数不是得大于1。
作者: darny    时间: 2016-8-18 20:12
  一个计算结果是不是“假账真算”关键是“算什么”,一组对某个对象是“真账”的数据,针对另一个对象来说很可能是毫无意义的“假账”。如果同为某个输出量的两个输入量已经判定为不相关,我们还能够说计算得到的所谓“相关系数”是“真”的吗?只有事先判定两个输入量是相关的(不一定是强相关),在相关的前提条件下再按规定的计算方法计算相关系数,这个相关系数才是“真账真算”得到的“真”的相关系数。所以JJF1059.1明确规定了必须首先判定两个输入量是否相关,再决定是否按公式计算相关系数或协方差,而不是像误差合成那样反其道而行之,先计算相关系数再判定两个输入量是否相关,同一个函数式中的变量与自变量既然在同一个函数式中,误差的相关是必然的,不确定度分量的相关则未必,一定要牢牢把握住不确定度与误差是本质上完全不同的概念,不能动不动又混淆在一起,不确定度分量的合成与误差分量的合成也不是同一项工作,不确定度分量的相关性与误差分量的相关性同样不能划等号。
作者: ck99945    时间: 2016-8-18 20:29
11年写的关于相关性的小文,仅作参考
[attach]183[/attach][attach]184[/attach][attach]185[/attach][attach]186[/attach][attach]187[/attach][attach]188[/attach][attach]189[/attach][attach]190[/attach]
作者: 2支棒棒糖    时间: 2016-8-18 20:57
  JJF1059.1已经说的很清楚,计算相关系数的前提条件是判定两个输入量的测量不确定度分量相关,在判定相关的前提条件下用4.4.4.2条的公式计算相关系数,或用4.4.4.3条建议的方法降相关的不确定度分量置换成不相关的不确定度分量。不确定度的相关性必须事先判定,而不是先计算相关系数再判定是否相关。当判定不相关后就没必要计算相关系数了,否则计算得到的也只是“假账真算”的相关系数,毫无价值。
作者: qq53039    时间: 2016-8-18 21:18
如何能算出大于1(指绝对值大于1)的“相关系数”?....您不妨随便设定两个真值后代入那个“rc”计算式算算看?
作者: wangyoo2003    时间: 2016-8-18 21:30
测量一个负载的电压、电流毫无疑问是强相关的,电压、电流测量列计算出的相关系数一定会接近1,存在函数关系的量的测量列间肯定是相关的

问题是不确定度评定的是测量不确定度分量间的相关性,不是测量列的相关性,这是需要厘清的问题,是测量各分量随机性因素间的相关性,不存在置得考虑的相关性是正常的,假设不相关当然是合理的,史先生计算出的残差的相差系数证明了这个问题
作者: spiegesq    时间: 2016-8-18 21:37
对,没注意史的计算是除的误差的平方和,以为还是标准差,这样是不会大于1,但不同真值,史的相关系数结果肯定会不一样,而且会差别很大,这样的方法有可行性吗?。可以计算来说明史,我就算一下大家看看,附件中有EXCEL的。可以得出在真值取数列的平均值时,结果的绝对值最小,接近但不同于(一)中的计算结果【因为(一)是除的4,(二)是除的5】;而在真值偏离数列的平均值越多时,结果的绝对值越大,接近1。所以该计算方法不具有一般性,不可用。
原例

电压
5.007

4.994

5.005

4.99

4.999

真值
4.950

4.950

4.950

4.950

4.950

误差
0.057

0.044

0.055

0.040

0.049

误差平方
0.003249

0.001936

0.003025

0.0016

0.002401

σ  (V)
0.049419

电流
19.663

19.639

19.64

19.685

19.675

真值
19.400

19.400

19.400

19.400

19.400

误差
0.263

0.239

0.24

0.285

0.275

误差平方
0.0692

0.0571

0.0576

0.0812

0.0756

σ  (I)
0.261036

同序号相乘
0.0150

0.0105

0.0132

0.0114

0.0135

求和除5
0.0127

史的相关系数
0.984

我们随便改下真值5和19.6:
电压
5.007

4.994

5.005

4.99

4.999

真值
5.000

5.000

5.000

5.000

5.000

误差
0.007

-0.006

0.005

-0.010

-0.001

误差平方
0.000049

0.000036

0.000025

0.0001

0.000001

σ  (V)
0.006496

电流
19.663

19.639

19.64

19.685

19.675

真值
19.600

19.400

19.400

19.400

19.400

误差
0.063

0.239

0.24

0.285

0.275

误差平方
0.0040

0.0571

0.0576

0.0812

0.0756

σ  (I)
0.234734

同序号相乘
0.0004

-0.0014

0.0012

-0.0029

-0.0003

求和除5
-0.0006

史的相关系数
-0.393

4.99和19.62
电压
5.007

4.994

5.005

4.99

4.999

真值
4.990

4.990

4.990

4.990

4.990

误差
0.017

0.004

0.015

0.000

0.009

误差平方
0.000289

0.000016

0.000225

0

0.000081

σ  (V)
0.011054

电流
19.663

19.639

19.64

19.685

19.675

真值
19.620

19.400

19.400

19.400

19.400

误差
0.043

0.239

0.24

0.285

0.275

误差平方
0.0018

0.0571

0.0576

0.0812

0.0756

σ  (I)
0.233795

同序号相乘
0.0007

0.0010

0.0036

0.0000

0.0025

求和除5
0.0016

史的相关系数
0.619


作者: 57830716    时间: 2016-8-18 21:44
不确定度是以测得值为中心的区间半宽度,合成过程与测量误差无关。而残差也是以测得值为中心计算出来的,所以(一)的思路是正确的。
作者: redfree    时间: 2016-8-18 22:08
史先生在计算中偷换了概念,它的案例(二)中的测量误差中包含的系统误差,并不是应当是相关性评定的对象,而是我们的测量结果的一部分。案例(一)中的残差,是随机误差,所以相关性很弱,由随机误差导致的不确定度才是平时合成的对象。
作者: c99945    时间: 2016-8-18 22:11

“计算得到的相关系数也是“假账真算”的相关系数,毫无价值”

      个人认为,相关系数通过计算得到相对更严谨,工作中为省事,弱相关或不相关,相关系数当作0,强相关时可以当作1。。               测量所得数列不是“假账”,至少该数列的相关性是和计算结果一样的,只是该数列受限于测量次数,不能完全代表整个变量,但至少在当前测量情况下可以用。就如同A类评定的不确定度,10次结果的标准差,不能完全代表整个变量的标准差,你再测10次结果可能会不一样,但我们还是采用了当次的标准差。
作者: cy4080    时间: 2016-8-18 22:28
当然要求误差的相关系数,可以先对误差求残差再代入公式,结果就一样了。电压测量(单位:伏)原题数据,着眼点测量误差(以真值为参考)
       序号                    V21            V22             V23              V24              V25  
                                5.007           4.994          5.005           4.990           4.999
       电压标准值(真值)=4.950
       误差                 w(V)21          w(V)22         w(V)23        w(V)24         w(V)25
                                0.057            0.044           0.055           0.040           0.049

误差的平均值    0.049

误差的残差          0.008         -0.005,      0.006          -0.009            0
这就和(一)一样了。
作者: 快乐.每一天    时间: 2016-8-18 22:40
  我认为19楼疑似点到了本质。史老师案例(二)中的计算使用了“误差”,因为I和V是同一公式中的两个量,受第三个量P或R的制约而“相关”着,一个发生了增量(误差),另一个也随之产生与之对应的增量,呈强正相关状态。所以rc=0.99≈1也就是必然的,这是两个量在物理公式中的相关性。案例(一)中的计算使用了“残差”,是剔除了系统误差的随机误差,反映的是两个量各自测量方法对其影响,而非物理公式中的固定计算关系,两个量假设判定为相关,这才真的是两个不确定度分量的相关系数。
  但我仍然要强调一点,计算相关系数的前提条件是两个不确定度分量被判定为相关。I和V是用不同测量设备各自独立完成测量的,应判定为不相关,因此计算出的相关系数尽管只有rb≈-0.37,与1相比已经很弱,也不能算是I和V之间的相关系数。已判定两个不确定度分量不相关,计算它们间的相关系数毫无价值。
作者: lkamxmk    时间: 2016-8-18 22:48
  相关与否是同一个输出量的两个输入量之间的关系问题,输出量好比是家族,不同家族的成员之间谈不上讨论相关不相关。
  电功率测量的测量模型P=VI,输出量是P,“家族的成员”(输入量)有两个,分别是电压V和电流I,V和I分别使用电压表和电流表不同的测量设备独立测得,V与I不相关。
  史老师用I=V/R来说明I与V强相关存在着严重概念混淆。I=V/R是电流I的测量模型,不是电功率P的测量模型,其输出量是I,不是P。I “家族”的“成员”(输入量)分别是V和R,V和R各自使用不同的测量设备独立测量,V和R不相关。虽然两个测量模型使用了相同符号V和I,但I在I=V/R中是输出量,在P=VI中是输入量,测量I时的V也不是测量P时的V,不能用测量模型I=V/R中I和V的物理领域数学关系去解释另一个测量模型P=VI中I和V的测量领域不确定度相关性。
作者: tgboler    时间: 2016-8-18 22:49
按史先生(二)中的计算方法,误差乘积和再除标准差之积,在当前假设的真值情况下已经为1了,如果真值再小点,误差大点不就大于1了,所以我的回复是说明吏先生(二)是错误的。。
作者: 3266364gxf    时间: 2016-8-18 23:14
史先生的思路非常清晰。 除了“不确定度‘’当死”的观念,对“不确定度”应用的健康发展实有大益!

崔先生的论述偏重于“理论”,除了深奥一些,与史先生的相应认识或是一致的?——“不确定度”分量合成时需要的“相关系数”,应该是考虑相应“误差”分量之间相关性的那个“系数”;传统分类表述的“‘系统’误差”与“‘随机’误差”在此“相关系数”的取值上是有所区分的;此“相关系数”的“确切值”是极难获得的,基于“残差”计算出的那个“相关系数”需要满足一个根本性假定【“测得值”序列的“均值”等于“真值”!---即,
“测得值”序列的“样本”非常充分,没有“传统表述中称谓的‘系统误差’成分”!....这对于任何实际情况,都只会是一个‘美好’的愿望。】才等于它【此“相关系数”】。




欢迎光临 耐特信计量检测服务平台_计量管理软件 (http://weblims.cn/) Powered by Discuz! X3.2