如何获取最后一个非零元素的位置

Question

我有一个表示事件是否发生的二进制变量：

event <- c(0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0)

我需要获取一个变量来指示上次事件发生的时间。预期输出为：

last_event <- c(0, 0, 0, 0, 5, 5, 5, 5, 5, 5, 5, 5, 13, 13, 13, 13)

如何使用 base R、tidyverse 或任何其他方式获得它？

Answer 1

每当您需要用值填充重复项时，请考虑 run-length encoding。

在这种情况下，您可以确定运行的长度，然后将 count == 0 的索引重复相应的次数：

lengths = rle(event == 0)$lengths
nonzeros = which(event != 0)
runs = c(0, rep(nonzeros, each = 2))
result = rep(runs, lengths)

或者，替换 RLE 中的运行，然后取反：

rle = rle(event == 0)
nonzeros = which(event != 0)
rle$values = c(0, rep(nonzeros, each = 2))
result = inverse.rle(rle)

Answer 2

利用你有一个二元向量这一事实，下面给出了你想要的输出：

cummax(seq_along(event) * event)

Answer 3

你也可以这样做-

> zero.locf <- function(x) {
  v <- x!=0
  c(0, x[v])[cumsum(v)+1]
}

> zero.locf(1:length(event)*event)

[1]  0  0  0  0  5  5  5  5  5  5  5  5 13 13 13 13

Answer 4

另一种选择是找到 event == 1 所在的索引并根据 length 重复它。

rep(c(0, which(event == 1)), tapply(event, cumsum(event == 1), length))
#[1]  0  0  0  0  5  5  5  5  5  5  5  5 13 13 13 13

如何获取最后一个非零元素的位置

How to obtain a position of last non-zero element

r

tidyverse

base