为什么这个 Rcpp 代码比字节编译的 R 慢？

Question

正如问题标题所说，我想知道为什么字节编译的 R 代码（使用 compiler::cmpfun）比以下数学函数的等效 Rcpp 代码更快：

func1 <- function(alpha, tau, rho, phi) {
     abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

因为这是一个简单的数值运算，我原以为 Rcpp（funcCpp 和 funcCpp2）比字节编译的 R（func1c 和 func2c)，特别是因为 R 将有更多的开销来存储 (1+alpha)**tau 或需要重新计算它。事实上，两次计算这个指数似乎比 R 中的内存分配更快（func1c vs func2c），这似乎特别违反直觉，因为 n 很大。我的另一个猜测是，也许 compiler::cmpfun 正在施展魔法，但我想知道情况是否确实如此。

真的，我想知道的两件事是：

为什么 funcCpp 和 funcCpp2 比 func1c 和 func2c 慢？（Rcpp 比编译的 R 函数慢）
为什么 funcCpp 比 func2 慢？（Rcpp 代码比纯 R 慢）

FWIW，这是我的 C++ 和 R 版本数据

user% g++ --version
Configured with: --prefix=/Library/Developer/CommandLineTools/usr --with-gxx-include-dir=/usr/include/c++/4.2.1
Apple LLVM version 7.0.0 (clang-700.0.72)
Target: x86_64-apple-darwin14.3.0
Thread model: posix

user% R --version
R version 3.2.2 (2015-08-14) -- "Fire Safety"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-apple-darwin14.5.0 (64-bit)

这里是 R 和 Rcpp 代码：

library(Rcpp)
library(rbenchmark)

func1 <- function(alpha, tau, rho, phi) {
    abs((1 + alpha)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

func2 <- function(alpha, tau, rho, phi) {
    pval <- (alpha + 1)^(tau)
    abs( pval * phi - rho * (1- pval)/(1 - (1 + alpha)))
}

func1c <- compiler::cmpfun(func1)
func2c <- compiler::cmpfun(func2)

func3c <- Rcpp::cppFunction('
    double funcCpp(double alpha, int tau, double rho, double phi) {
        double pow_val = std::exp(tau * std::log(alpha + 1.0));
        double pAg = rho/alpha;
        return std::abs(pow_val * (phi -  pAg) + pAg);
    }')

func4c <- Rcpp::cppFunction('
    double funcCpp2(double alpha, int tau, double rho, double phi) {
        double pow_val = pow(alpha + 1.0, tau) ;
        double pAg = rho/alpha;
        return std::abs(pow_val * (phi -  pAg) + pAg);
    }')

res <- benchmark(
           func1(0.01, 200, 100, 1000000),
           func1c(0.01, 200, 100, 1000000),
           func2(0.01, 200, 100, 1000000),
           func2c(0.01, 200, 100, 1000000),
           func3c(0.01, 200, 100, 1000000),
           func4c(0.01, 200, 100, 1000000),
           funcCpp(0.01, 200, 100, 1000000),
           funcCpp2(0.01, 200, 100, 1000000),
           replications = 100000,
           order='relative',
           columns=c("test", "replications", "elapsed", "relative"))

这是 rbenchmark 的输出：

                             test replications elapsed relative
   func1c(0.01, 200, 100, 1e+06)       100000   0.349    1.000
   func2c(0.01, 200, 100, 1e+06)       100000   0.372    1.066
 funcCpp2(0.01, 200, 100, 1e+06)       100000   0.483    1.384
   func4c(0.01, 200, 100, 1e+06)       100000   0.509    1.458
    func2(0.01, 200, 100, 1e+06)       100000   0.510    1.461
  funcCpp(0.01, 200, 100, 1e+06)       100000   0.524    1.501
   func3c(0.01, 200, 100, 1e+06)       100000   0.546    1.564
    func1(0.01, 200, 100, 1e+06)       100000   0.549    1.573K

Answer 1

这本质上是一个不适定的问题。当您放置

func1 <- function(alpha, tau, rho, phi) {
     abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

甚至不指定参数是什么（即标量？向量？大？小？内存开销）那么在最好的情况下，您可能会直接从解析的表达式中获得一小组（基本的，高效的）函数调用.

自从我们有了字节编译器（Luke Tierney 在随后的 R 版本中对其进行了改进）以来，我们就知道它可以很好地处理代数表达式。

现在，编译后的 C/C++ 代码也能做到这一点——但调用编译后的男女同校会有开销，你在这里看到的是 "rtivial enough" 问题，开销确实没有真正得到摊销。

所以你最终几乎是平局。据我所知，这并不奇怪。

为什么这个 Rcpp 代码比字节编译的 R 慢？

Why is this Rcpp code slower than byte compiled R?

c++

performance

numerical

r

rcpp