将 big.matrix 中的所有非零数字更改为 1

Change all nonzero numbers in big.matrix to 1

如何在使用 class big.matrix 的对象时将所有非零值更改为 1?如果我转换为普通矩阵,对象大小超过 2gb(10^7 列,100 行),所以这是不可行的。

谢谢!

您可以使用 Rcpp 来执行此操作(将此代码放入 .cpp 文件中并使用 Rcpp::sourceCpp 获取它):

// [[Rcpp::depends(BH, bigmemory)]]
#include <bigmemory/MatrixAccessor.hpp>
#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
void to_one(SEXP bm_addr) {

  XPtr<BigMatrix> xptr(bm_addr);
  MatrixAccessor<double> macc(*xptr);

  for (size_t j = 0; j < macc.ncol(); j++)
    for (size_t i = 0; i < macc.nrow(); i++)
      if (macc[j][i] != 0) macc[j][i] = 1;
}

/*** R
library(bigmemory)
r <- 100
c <- 10000
bm <- matrix(sample(0:4, r * c, replace = TRUE), r, c)
bm <- as.big.matrix(bm, type = "double")
bm[, 1]
to_one(bm@address)
bm[, 1]
*/