OpenCV 双矩阵除以标量产生不正确的结果
OpenCV double matrix division by scalar produces incorrect result
我很好奇是否有人能够在用标量 (double) 划分矩阵(具有双精度值)时得到正确的结果。当我试图追踪 MATLAB 中的算法与在 C++ 中重现的算法之间某些不一致的根源时,我注意到 OpenCV 没有给出正确的(好吧,"exact")结果。这是我遇到的问题的一个最小示例:
cv::Mat some_matrix(1, 1, CV_64FC1, cv::Scalar::all(95));
cv::Mat some_matrix_div = some_matrix / 235.0;
printf(
"Expected: %.53g\n"
"OpenCV : %.53g\n",
some_matrix.at<double>(0,0) / 235.0,
some_matrix_div.at<double>(0,0) );
运行后我看到了
Expected: 0.40425531914893614304773450385255273431539535522460938
OpenCV : 0.404255319148936198558885735110379755496978759765625
第一个是值应该是什么(如果您在 C++ 或 MATLAB 中执行 95/235 的双精度除法,您将得到什么),第二个是 OpenCV 在使用除法运算符时产生的值。我尝试在 OpenCV 源代码中追踪问题,但矩阵运算有点复杂,我现在没有太多时间来研究它,所以我想知道是否有其他人遇到过这个问题并且知道解决方法?
编辑
我会添加一些说明。
首先,我知道双精度不是精确的数字表示。 "exact"(为什么用引号引起来)我的意思是完全执行双除法(例如打印 95.0/235.0 的结果)与 OpenCV 将矩阵除以标量时所做的不完全相同,尽管矩阵中的值确实存储为双精度,并且标量也确实被视为双精度。人们会期望这两个结果应该是相同的;也就是说,如果我将一个双精度数除以另一个双精度数,结果应该与 OpenCV 双精度矩阵除以一个双精度标量相同。
我也已经尝试在代码中将所有数字常量显式转换为双精度数,但没有成功。
虽然在这种情况下差异相对较小 (e^-16),但我不确定随着时间的推移,这可能会导致越来越大的错误。这是一个问题。另一个更像是一个小烦恼,误解了为什么 OpenCV 没有做人们直觉上期望的事情。最后它可能不会引起任何问题,但如果可以避免奇怪的行为,我显然更喜欢那样,特别是因为它使得计算不符合 MATLAB 结果的预期结果时不清楚,因为计算奇怪或因为实际的算法实现问题(这是我假设的)。
希望这更清楚。
浮点数学本质上是不精确的。在 x86 平台上,可以使用 FPU(80 位扩展精度)或 SSE/AVX 向量单元(64 位双精度)计算双精度数。在何处完成此计算取决于编译器的选择和传递给编译器的各种选项。更糟糕的是,如果编译器用完了 80 位寄存器,它 "spills" 将结果作为 64 位结果存入内存。事实证明,即使对于标量,向量单元对于大多数浮点运算也更快,因此在允许的情况下,编译器通常会首选它。
如果软件明确编写为使用 SSE 或 AVX 以获得最大速度,那么它肯定会使用 64 位版本。 OpenCV 可能就是这种情况。 OpenCV 甚至可能通过先计算倒数 (1.0/235.0) 来近似计算,然后将结果乘以每个像素,因为这样会快得多。
一些尝试:
some_matrix.at<double>(0,0) * (1.0 / 235.0)
同时尝试更改您的编译器标志以包含 -mfpmath=sse -msse2
以确保您的编译器知道您有一个 SSE 单元,并将其用于双精度。
阅读此处了解这些影响的详细说明:https://gcc.gnu.org/wiki/x87note
正如@Borgleader 在评论中提到的,问题是在计算库中使用 -fast-math 编译器选项进行库编译,而不是我的应用程序。在这种情况下,它不是 OpenCV,而是我发行版中的另一个库,但正是这种差异导致了差异。通过在没有标志的情况下重建该库以获得一致的结果,问题得到解决。
我很好奇是否有人能够在用标量 (double) 划分矩阵(具有双精度值)时得到正确的结果。当我试图追踪 MATLAB 中的算法与在 C++ 中重现的算法之间某些不一致的根源时,我注意到 OpenCV 没有给出正确的(好吧,"exact")结果。这是我遇到的问题的一个最小示例:
cv::Mat some_matrix(1, 1, CV_64FC1, cv::Scalar::all(95));
cv::Mat some_matrix_div = some_matrix / 235.0;
printf(
"Expected: %.53g\n"
"OpenCV : %.53g\n",
some_matrix.at<double>(0,0) / 235.0,
some_matrix_div.at<double>(0,0) );
运行后我看到了
Expected: 0.40425531914893614304773450385255273431539535522460938
OpenCV : 0.404255319148936198558885735110379755496978759765625
第一个是值应该是什么(如果您在 C++ 或 MATLAB 中执行 95/235 的双精度除法,您将得到什么),第二个是 OpenCV 在使用除法运算符时产生的值。我尝试在 OpenCV 源代码中追踪问题,但矩阵运算有点复杂,我现在没有太多时间来研究它,所以我想知道是否有其他人遇到过这个问题并且知道解决方法?
编辑
我会添加一些说明。
首先,我知道双精度不是精确的数字表示。 "exact"(为什么用引号引起来)我的意思是完全执行双除法(例如打印 95.0/235.0 的结果)与 OpenCV 将矩阵除以标量时所做的不完全相同,尽管矩阵中的值确实存储为双精度,并且标量也确实被视为双精度。人们会期望这两个结果应该是相同的;也就是说,如果我将一个双精度数除以另一个双精度数,结果应该与 OpenCV 双精度矩阵除以一个双精度标量相同。
我也已经尝试在代码中将所有数字常量显式转换为双精度数,但没有成功。
虽然在这种情况下差异相对较小 (e^-16),但我不确定随着时间的推移,这可能会导致越来越大的错误。这是一个问题。另一个更像是一个小烦恼,误解了为什么 OpenCV 没有做人们直觉上期望的事情。最后它可能不会引起任何问题,但如果可以避免奇怪的行为,我显然更喜欢那样,特别是因为它使得计算不符合 MATLAB 结果的预期结果时不清楚,因为计算奇怪或因为实际的算法实现问题(这是我假设的)。
希望这更清楚。
浮点数学本质上是不精确的。在 x86 平台上,可以使用 FPU(80 位扩展精度)或 SSE/AVX 向量单元(64 位双精度)计算双精度数。在何处完成此计算取决于编译器的选择和传递给编译器的各种选项。更糟糕的是,如果编译器用完了 80 位寄存器,它 "spills" 将结果作为 64 位结果存入内存。事实证明,即使对于标量,向量单元对于大多数浮点运算也更快,因此在允许的情况下,编译器通常会首选它。
如果软件明确编写为使用 SSE 或 AVX 以获得最大速度,那么它肯定会使用 64 位版本。 OpenCV 可能就是这种情况。 OpenCV 甚至可能通过先计算倒数 (1.0/235.0) 来近似计算,然后将结果乘以每个像素,因为这样会快得多。
一些尝试:
some_matrix.at<double>(0,0) * (1.0 / 235.0)
同时尝试更改您的编译器标志以包含 -mfpmath=sse -msse2
以确保您的编译器知道您有一个 SSE 单元,并将其用于双精度。
阅读此处了解这些影响的详细说明:https://gcc.gnu.org/wiki/x87note
正如@Borgleader 在评论中提到的,问题是在计算库中使用 -fast-math 编译器选项进行库编译,而不是我的应用程序。在这种情况下,它不是 OpenCV,而是我发行版中的另一个库,但正是这种差异导致了差异。通过在没有标志的情况下重建该库以获得一致的结果,问题得到解决。