return NumericVector Rcpp 意外行为中的 NA 值

return NA value in NumericVector Rcpp unexpected behavior

我正在编写一个 cpp 函数来用下一个非 na 值替换任何 NA 值。关于替换,代码可以正常工作,但是我想 return 为那些没有后来的非 NA 值的那些返回 NA 值。

例如:

fill_backward(c(1, NA, 2)) --> 1, 2, 2

fill_backward(c(1, NA, 2, NA)) --> 1, 2, 2, 不适用

#include <Rcpp.h>
using namespace Rcpp;
//' given NA values fill them with the next non-na value
//' @param x A numeric vector of values
//' @details
//' Works very well in context of dplyr to carry out last-observation-carried-foward
//' for different individuals. It will NOT replace leading NA's
//' @examples /dontrun {
//' fill_forward(c(1.0, NA, 2))
//' fill_forward(c(NA, 1, NA, 2))
//' library(dplyr)
//' df <- data_frame(id = c(1, 1, 2, 2), obs = c(1.2, 4.8, 2.5, NA))
//' df %>% group_by(id) %>% mutate(obs_locf = fill_forward(obs))
//' }
//' @export
// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
  int n = x.size();
  NumericVector out = no_init(n);
  for (int i = 0; i < n; ++i) {
    if (R_IsNA(x[i])) {
      for (int j = i+1; j < n; ++j) {
       if(R_IsNA(x[j])) {
         continue;
       } else {
         out[i] = x[j];
         break;
       } 
       //if never gets to another actual value
       out[i] = NumericVector::get_na();
      }
    } else { //not NA
      out[i] = x[i];
    }
  }
  return out;
}

当前 fill_backward(c(NA, 1.0, NA, 2, NA, NA)) returns:

[1] 1.000000e+00 1.000000e+00 2.000000e+00 [4] 2.000000e+00 2.156480e-314 -1.060998e-314

而不是1 1 2 2 NA NA

return返回 NA 值是 out[i] = NumericVector::get_na();

我也尝试了 out[i] = REAL_NA 和 out[i] = x[i]`,但似乎没有任何效果。

最后,我对 fill_forward 实现使用了相同类型的实现,可以看出 here 其中领先的 NA 应该 return 与 NA - 而且它正确地 returns NA 值所以我完全不知所措。

编辑:已修复,感谢@Roland 的建议

您可以使用 NA 值初始化 out

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
  int n = x.size();
  NumericVector out = NumericVector(n, NumericVector::get_na());
  for (int i = 0; i < n; ++i) {
    if (R_IsNA(x[i])) {
      for (int j = i+1; j < n; ++j) {
       if(R_IsNA(x[j])) {
         continue;
       } else {
         out[i] = x[j];
         break;
       } 
             }
    } else { //not NA
      out[i] = x[i];
    }
  }
  return out;
}

正在测试:

fill_backward(c(NA, 1.0, NA, 2, NA, NA))
[1]  1  1  2  2 NA NA

我应该提一下,由于您使用了 continue.

,您的行 out[i] = NumericVector::get_na(); 从未达到

zoo 软件包已经做到了这一点,而且做得又好又快:

R> suppressMessages(library(zoo))
R> zoo::na.locf(vec, fromLast=TRUE, na.rm=FALSE)
[1]  1  1  2  2 NA NA
R> 

RcppXts package allows you access zoo and xts code in your C++ code should you so desire including na.locf functionality via this access point