as.integer(8952) = 8951?

as.integer(8952) = 8951?

我无意中发现了 R base 中 as.integerdet 函数的一个奇怪错误。有谁知道这里发生了什么以及如何预防?

我正在计算以下 3×3 矩阵的行列式:

mat <- matrix(c(15, 6, 116, 10, 13, 16, 14, 23, 56), ncol = 3)

看起来像这样:

     [,1] [,2] [,3]
[1,]   15   10   14
[2,]    6   13   23
[3,]  116   16   56

有两点很容易看出:所有条目都是整数,并且六组三条目中的每一组都包含至少一个偶数。因此行列式必须是偶数。

通过输入 det(mat) 来询问 R 这个行列式的实际值 returns 看起来像偶数的东西:8952。但是你瞧:在 R 的内心深处,它实际上是一个非整数或奇数,因为在输入 as.integer(det(mat)) 时我们得到 8951.

这是怎么回事? 8951显然是错误的。此外,不太明显的是,用笔和纸可以看出值 8952 是正确的。

所以我的问题是:

  1. 这是怎么回事?

  2. 当被要求计算整数矩阵的行列式时,如何强制 R 给我 正确的 整数值?

根本原因:is.integer 截断而不是舍入和浮点数学记录的中间值来解释第二个结果,结合 print 部分显示的默认数字级别控制台REPL解释det(mat)的初始结果:

print( det(mat), digits =16)
[1] 8951.999999999993

理论上的答案很可能是 8952,但 R 不是符号数学引擎。

您可以使用 Rmpfr 包(如@BenBolker 所建议的那样)来提高精度级别:

 library(Rmpfr)
 mat <- mpfr(mat, 64)
 as.integer( det(mat) )
[1] 8952

as.integer 截断而不是四舍五入。参见 ?as.integer。 R 可以在不损失精度的情况下处理整数的加法或乘法,但一旦发生除法,就可能会出现浮点错误。 (实际上出现问题是因为 det 的默认设置是将 determinantlog=TRUE 一起使用,然后对复杂结果的模数取幂。)从帮助页面的值部分:

Non-integral numeric values are truncated towards zero (i.e., as.integer(x) equals trunc(x) there), and imaginary parts of complex numbers are discarded (with a warning).