R 矩阵到犰狳的转换真的很慢

Conversion of R matrices to armadillo is really slow

观察

对于中型矩阵,将矩阵从 R 传递到 C++ 的开销对于 arma::mat 类型比 NumericMatrix 类型要慢得多。就像花费大约 250 倍的时间一样。这是一个最小的例子

#include <RcppArmadillo.h>
// [[Rcpp::depends(RcppArmadillo)]]
using namespace Rcpp;
using namespace arma;

// [[Rcpp::export]]
double test_nm( NumericMatrix X ) {
  return 0.0 ;
}

// [[Rcpp::export]]
double test_arma( mat X ) {
  return 0.0 ;
}

// [[Rcpp::export]]
double test_nm_conv( NumericMatrix X ) {
  mat X_arma = as<mat>( X ) ; 
  return 0.0 ;
}

然后,在 R 中:

XX <- matrix( runif( 10000 ), 2000, 50 )
microbenchmark( test_nm( XX ), test_arma( XX ), ( XX ) )

Unit: microseconds
               expr      min       lq      mean   median       uq      max neval
        test_nm(XX)    5.541   16.154   16.0781   17.577   18.876   48.024   100
      test_arma(XX) 1280.946 1337.706 1404.0824 1361.237 1389.476 3385.868   100
   test_nm_conv(XX) 1277.417 1338.835 1393.4888 1358.128 1386.101 4355.533   100

因此,仅将矩阵作为 arma::mat 类型传递比 NumericMatrix 慢 250 倍左右。太疯狂了!所以...

出现的问题

  1. 这是怎么回事?为什么 mat 所以 NumericMatrix 慢很多?
  2. 请问有什么好的方法可以解决这个问题吗?我遇到了一个问题,我需要在一个被多次调用的函数中使用 arma::mat 来处理一些相当简单的矩阵代数。我目前一直在使用 arma 类型,我的代码比我预期的 慢(这就是我最终编造出上面这些愚蠢示例的方式)。 250 倍的速度损失如此之大,以至于我将重写大部分代码以在整个过程中使用 NumericMatrix 类型。事实上,我可能最终会为 NumericMatrix 编写自己的矩阵乘法函数并完全放弃 arma 类型。但是在我这样做之前,有没有更好的解决方案?

(虽然我猜另一种阅读方式并不是说 arma::mat 从 R 类型转换很慢,而是 NumericMatrix 类型非常高效!)

我相信这会创建一个新的 Armadillo 矩阵,然后复制您的数字矩阵的内容。

要将 NumericMatrix 转换为类型 arma::mat,您应该使用以下内容:

// [[Rcpp::export]]
double test_const_arma( const mat& X ) { 
  return 0.0 ;
}

我机器上的速度比较:

microbenchmark( test_const_arma( XX ), test_nm( XX ), test_arma( XX ), test_nm_conv( XX ))
## Unit: microseconds
##                 expr    min     lq     mean  median      uq     max neval
##  test_const_arma(XX)  1.852  2.381  3.69014  2.7885  4.3490  11.994   100
##          test_nm(XX)  1.925  2.455  3.47679  2.8535  3.5195  21.222   100
##        test_arma(XX) 68.593 71.212 83.63055 73.4555 98.8070 278.981   100
##     test_nm_conv(XX) 68.700 70.983 80.55983 73.1705 82.2665 183.484   100