根据 R 中连续几天的序列分配 ID

Question

我有一个包含重复测量的数据集，我想用它来分配 ID。重复测量来自连续几天的序列。然而，序列本身可能是不平衡的（例如，有些人的天数较多，而另一些人的天数较少，有些人从第一天开始，而其他一些人可能从第 2 天或第 3 天开始）。我的问题是如何在同一序列块内创建和分配相同的 ID。这是一个玩具数据集：

days <- data.frame(
           day = c(1L,2L,3L,4L,5L,6L,8L,9L,10L,
                   2L,3L,4L,5L,6L,7L,9L,10L,
                   1L,2L,4L,5L,6L,8L,9L,10L,
                   1L,2L,3L,4L,5L,6L,7L,8L,9L,10L)
  )

这是我期望的最终结果：

Answer 1

获取相邻元素之间的diff误差，如果小于0，则求和

days$id <- cumsum(c(TRUE, diff(days$day)  < 0))

根据 R 中连续几天的序列分配 ID

Assign ID based on a sequence of consecutive days in R

r

data-manipulation

dataframe