R：按行顺序分组

Question

我有一个来自 IMDB 的数据框，看起来像这样。不幸的是，它没有分组，但我希望我可以将它分组。

数据如下所示：

V1                  V2              starts_with
NM: Aarons          Alex            NM
DB: 15 May 1890     Philadelphia    DB
NM: Aarons          Leroy           NM
NM: Aarons          Shawn           NM
DB: 26 March 1989   Jamaica         DB

我想要添加一个新列。基于 NM 和 DB 组合的序列。每有一个新的"NM"就会有一个新的数字：

V1                  V2              starts_with     group
NM: Aarons          Alex            NM              1
DB: 15 May 1890     Philadelphia    DB              1
NM: Aarons          Leroy           NM              2
NM: Aarons          Shawn           NM              3
DB: 26 March 1989   Jamaica         DB              3

我当然搜索了 SO 并看到了这个 generate sequence within group in R 但那个例子已经分组了。不幸的是，我的数据没有分组。

Answer 1

您可以使用 cumsum:

df$group = cumsum(df$starts_with == "NM")

R：按行顺序分组

R: Group by Sequence of Rows

r

sequence