R 矩阵到犰狳的转换真的很慢
Conversion of R matrices to armadillo is really slow
观察
对于中型矩阵,将矩阵从 R 传递到 C++ 的开销对于 arma::mat
类型比 NumericMatrix
类型要慢得多。就像花费大约 250 倍的时间一样。这是一个最小的例子
#include <RcppArmadillo.h>
// [[Rcpp::depends(RcppArmadillo)]]
using namespace Rcpp;
using namespace arma;
// [[Rcpp::export]]
double test_nm( NumericMatrix X ) {
return 0.0 ;
}
// [[Rcpp::export]]
double test_arma( mat X ) {
return 0.0 ;
}
// [[Rcpp::export]]
double test_nm_conv( NumericMatrix X ) {
mat X_arma = as<mat>( X ) ;
return 0.0 ;
}
然后,在 R 中:
XX <- matrix( runif( 10000 ), 2000, 50 )
microbenchmark( test_nm( XX ), test_arma( XX ), ( XX ) )
Unit: microseconds
expr min lq mean median uq max neval
test_nm(XX) 5.541 16.154 16.0781 17.577 18.876 48.024 100
test_arma(XX) 1280.946 1337.706 1404.0824 1361.237 1389.476 3385.868 100
test_nm_conv(XX) 1277.417 1338.835 1393.4888 1358.128 1386.101 4355.533 100
因此,仅将矩阵作为 arma::mat
类型传递比 NumericMatrix
慢 250 倍左右。太疯狂了!所以...
出现的问题
- 这是怎么回事?为什么
mat
所以 比 NumericMatrix
慢很多?
- 请问有什么好的方法可以解决这个问题吗?我遇到了一个问题,我需要在一个被多次调用的函数中使用
arma::mat
来处理一些相当简单的矩阵代数。我目前一直在使用 arma
类型,我的代码比我预期的 多 慢(这就是我最终编造出上面这些愚蠢示例的方式)。 250 倍的速度损失如此之大,以至于我将重写大部分代码以在整个过程中使用 NumericMatrix
类型。事实上,我可能最终会为 NumericMatrix
编写自己的矩阵乘法函数并完全放弃 arma
类型。但是在我这样做之前,有没有更好的解决方案?
(虽然我猜另一种阅读方式并不是说 arma::mat
从 R 类型转换很慢,而是 NumericMatrix
类型非常高效!)
我相信这会创建一个新的 Armadillo 矩阵,然后复制您的数字矩阵的内容。
要将 NumericMatrix 转换为类型 arma::mat,您应该使用以下内容:
// [[Rcpp::export]]
double test_const_arma( const mat& X ) {
return 0.0 ;
}
我机器上的速度比较:
microbenchmark( test_const_arma( XX ), test_nm( XX ), test_arma( XX ), test_nm_conv( XX ))
## Unit: microseconds
## expr min lq mean median uq max neval
## test_const_arma(XX) 1.852 2.381 3.69014 2.7885 4.3490 11.994 100
## test_nm(XX) 1.925 2.455 3.47679 2.8535 3.5195 21.222 100
## test_arma(XX) 68.593 71.212 83.63055 73.4555 98.8070 278.981 100
## test_nm_conv(XX) 68.700 70.983 80.55983 73.1705 82.2665 183.484 100
观察
对于中型矩阵,将矩阵从 R 传递到 C++ 的开销对于 arma::mat
类型比 NumericMatrix
类型要慢得多。就像花费大约 250 倍的时间一样。这是一个最小的例子
#include <RcppArmadillo.h>
// [[Rcpp::depends(RcppArmadillo)]]
using namespace Rcpp;
using namespace arma;
// [[Rcpp::export]]
double test_nm( NumericMatrix X ) {
return 0.0 ;
}
// [[Rcpp::export]]
double test_arma( mat X ) {
return 0.0 ;
}
// [[Rcpp::export]]
double test_nm_conv( NumericMatrix X ) {
mat X_arma = as<mat>( X ) ;
return 0.0 ;
}
然后,在 R 中:
XX <- matrix( runif( 10000 ), 2000, 50 )
microbenchmark( test_nm( XX ), test_arma( XX ), ( XX ) )
Unit: microseconds
expr min lq mean median uq max neval
test_nm(XX) 5.541 16.154 16.0781 17.577 18.876 48.024 100
test_arma(XX) 1280.946 1337.706 1404.0824 1361.237 1389.476 3385.868 100
test_nm_conv(XX) 1277.417 1338.835 1393.4888 1358.128 1386.101 4355.533 100
因此,仅将矩阵作为 arma::mat
类型传递比 NumericMatrix
慢 250 倍左右。太疯狂了!所以...
出现的问题
- 这是怎么回事?为什么
mat
所以 比NumericMatrix
慢很多? - 请问有什么好的方法可以解决这个问题吗?我遇到了一个问题,我需要在一个被多次调用的函数中使用
arma::mat
来处理一些相当简单的矩阵代数。我目前一直在使用arma
类型,我的代码比我预期的 多 慢(这就是我最终编造出上面这些愚蠢示例的方式)。 250 倍的速度损失如此之大,以至于我将重写大部分代码以在整个过程中使用NumericMatrix
类型。事实上,我可能最终会为NumericMatrix
编写自己的矩阵乘法函数并完全放弃arma
类型。但是在我这样做之前,有没有更好的解决方案?
(虽然我猜另一种阅读方式并不是说 arma::mat
从 R 类型转换很慢,而是 NumericMatrix
类型非常高效!)
我相信这会创建一个新的 Armadillo 矩阵,然后复制您的数字矩阵的内容。
要将 NumericMatrix 转换为类型 arma::mat,您应该使用以下内容:
// [[Rcpp::export]]
double test_const_arma( const mat& X ) {
return 0.0 ;
}
我机器上的速度比较:
microbenchmark( test_const_arma( XX ), test_nm( XX ), test_arma( XX ), test_nm_conv( XX ))
## Unit: microseconds
## expr min lq mean median uq max neval
## test_const_arma(XX) 1.852 2.381 3.69014 2.7885 4.3490 11.994 100
## test_nm(XX) 1.925 2.455 3.47679 2.8535 3.5195 21.222 100
## test_arma(XX) 68.593 71.212 83.63055 73.4555 98.8070 278.981 100
## test_nm_conv(XX) 68.700 70.983 80.55983 73.1705 82.2665 183.484 100