R:如果 x=条件,则用 x-1 和 x+3 替换 x 和接下来的 2 个值

R: If x=condition, replace x and next 2 values by mean of x-1 and x+3

我有这样的输入:

input=c(8,-200,4,0,9,5,-900,10,8,8)

并且我想执行以下操作:

如果输入<(-100) 用替换值前后的值替换输入和接下来的两个值

所以结果应该是这样的:

result=c(8,8.5,8.5,8.5,9,5,6.5,6.5,6.5,8)

df=data.frame(input, result)

我尝试了以下方法,只有在我的 df 中只有一个案例时才有效:

ind <- which(df$input<(-100))
df$input[ind:ind+2] <- sapply(ind, function(i) with(df, mean(c(input[i-1], input[i+3]))))

不止一种情况我收到错误信息:

Warning messages:
1: In ind:ind : numerical expression has 2 elements: only the first used
2: In ind:ind : numerical expression has 2 elements: only the first used
3: In df$input[ind:ind + 2] <- sapply(ind, function(i) with(df, mean(c(input[i -  :
  number of items to replace is not a multiple of replacement length

我可能还会遇到值 x+3 是要替换的另一个值的情况:

input2=c(1,1,2,-100,7,0,-200,4,5,6)

在这种情况下,我想再次跳过该值并取下一个 x+3 值(此处:2 和 6 的平均值)以便:

result2=c(1,1,2,4,4,4,4,4,4,6)

如有任何帮助,我们将不胜感激。 谢谢!

这是一个解决方案:

myfun <- function(input){

  # Replace values by NA
  ind <- which(input < -100)
  ind <- unique(c(ind, ind+1, ind+2))
  ind <- ind[ind<=length(input)]
  input[ind] <- NA

  # Replace NA by mean
  input[ind] <- rowMeans(cbind(na.locf(input, fromLast = T, na.rm = F),
                               na.locf(input, fromLast = F, na.rm = F)), 
                         na.rm = T)[ind]

  input
}

myfun(c(8,8.5,8.5,8.5,9,5,6.5,6.5,6.5,8))
# [1] 8.0 8.5 8.5 8.5 9.0 5.0 6.5 6.5 6.5 8.0
myfun(c(1,1,2,-200,7,0,-200,4,5,6))
# [1] 1 1 2 4 4 4 4 4 4 6