R 函数和 Rcpp 中的环境

Environments in R functions and Rcpp

我遇到一个奇怪的问题,我编写的函数在 运行s 之后更改了我的输入值。

这是我的 R 代码:

library(entropy)
y = c(4, 2, 3, 0, 2, 4, 0, 0, 2, 1, 1)
y=rbind(y,2*(y%%2),y%%3)
y
#4    2    3    0    2    4    0    0    2     1     1
#0    0    2    0    0    0    0    0    0     2     2
#1    2    0    0    2    1    0    0    2     1     1
freqs.shrink(y)

freqs.shrinkC<-function(y,lambda.freqs,verbose=TRUE) {
  if (missing(lambda.freqs)) {
    lambda.freqs = getlambdashrinkC(y)
  }
  if (verbose==TRUE) {
    cat(paste("Specified shrinkage intensity lambda.freq (frequencies):",
              round(lambda.freqs, 4)), "\n")
  }
  ismatrix<-attributes(y)$dim
  out<-freqsshrinkC(y,lambda.freqs)
  attr(out,"lambda.freq")=lambda.freqs
  attr(out,"dim")=ismatrix
  return(out)
}

freqs.shrinkC(y)
y
    #0.05280131 0.0374932 0.04514725 0.0221851 0.0374932 0.05280131 0.0221851 0.0221851 0.0374932 0.02983915 0.02983915
  #0.02218510 0.0221851 0.03749320 0.0221851 0.0221851 0.02218510 0.0221851 0.0221851 0.0221851 0.03749320 0.03749320
  #0.02983915 0.0374932 0.02218510 0.0221851 0.0374932 0.02983915 0.0221851 0.0221851 0.0374932 0.02983915 0.02983915

没有理由在 运行ning freqs.shrinkC 之后更改 y 的值,因为我相信该函数在其自己的环境中运行。

这是我的 C++ 代码:

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
NumericVector freqsshrinkC(NumericVector y,double lambda) {
  int m=y.length();
  double n=0;
  for (int i=0;i<m;i++) {
    n+=y(i);
  }
  y=y/n;

NumericVector add(m,lambda/m);
   y=y*(1-lambda);

  y+=add;
  return y;
}

// [[Rcpp::export]]
double getlambdashrinkC(NumericVector y) {
  double n=0;
  int m=y.length();
  double lambda;
  for (int i=0;i<m;i++) {
    n+=y[i];
  }
  NumericVector u=y/n;


  NumericVector temp(m,1.0);
  NumericVector varu=u*(temp-u)/(n-1);

  double msp=0;
  for (int i=0;i<m;i++) {
    msp+=pow(u[i]-(1.0/m),2);
  }
  if (msp==0) {
    lambda=1;
  } else {
    lambda=0;
    for (int i=0;i<m;i++) {
    lambda+=varu[i];
    }
    lambda=lambda/msp;
  }
  if (lambda>1) {
    lambda=1;
  }
  if (lambda<0) {
    lambda=0;
  }
  return lambda;
}

我是 C++ 和 Rcpp 的新手,所以如果我的代码不够优雅,我深表歉意。如果有人好奇,我正在使用 Rcpp 重写熵包作为练习。当我 运行 我的函数时,我对为什么 y 改变值感到困惑,所以我们感谢您的帮助。

此致,

卡尔

这很可能与您的 freqsshrinkC 函数直接对其 y 参数进行(修改)操作有关。由于 Rcpp::Vector 是代理对象,因此 影响您传入的原始对象。尝试使用 Rcpp::clone 对您传入的向量进行深度复制,如下:

// [[Rcpp::export]]
NumericVector freqsshrinkC2(NumericVector y_, double lambda) {
  Rcpp::NumericVector y = Rcpp::clone(y_);
  int m = y.length();
  double n = 0;
  for (int i = 0; i < m; i++) {
    n += y(i);
  }
  y = y/n;

  NumericVector add(m,lambda/m);
  y = y*(1-lambda);

  y += add;
  return y;
}

/*** R

y1 <- c(4, 2, 3, 0, 2, 4, 0, 0, 2, 1, 1)
y1 <- rbind(y1, 2*(y1%%2), y1%%3)
x1 <- freqsshrinkC(y1, 1.5)

y2 <- c(4, 2, 3, 0, 2, 4, 0, 0, 2, 1, 1)
y2 <- rbind(y2, 2*(y2%%2), y2%%3)
x2 <- freqsshrinkC2(y2, 1.5)


all.equal(y1, x1)
R> all.equal(y1, x1)
#[1] TRUE       # y1 was modified

all.equal(y2, x2)
R> all.equal(y2, x2)
#[1] "Mean relative difference: 1.01039"  # y2 was not

*/

其中 freqsshrinkC 是您问题中的版本,freqsshrinkC2 在(现已重命名为 y_)输入向量上使用 Rcpp::clone