R:按行顺序分组

R: Group by Sequence of Rows

我有一个来自 IMDB 的数据框,看起来像这样。不幸的是,它没有分组,但我希望我可以将它分组。

数据如下所示:

V1                  V2              starts_with
NM: Aarons          Alex            NM
DB: 15 May 1890     Philadelphia    DB
NM: Aarons          Leroy           NM
NM: Aarons          Shawn           NM
DB: 26 March 1989   Jamaica         DB

我想要添加一个新列。基于 NM 和 DB 组合的序列。每有一个新的"NM"就会有一个新的数字:

V1                  V2              starts_with     group
NM: Aarons          Alex            NM              1
DB: 15 May 1890     Philadelphia    DB              1
NM: Aarons          Leroy           NM              2
NM: Aarons          Shawn           NM              3
DB: 26 March 1989   Jamaica         DB              3

我当然搜索了 SO 并看到了这个 generate sequence within group in R 但那个例子已经分组了。不幸的是,我的数据没有分组。

您可以使用 cumsum:

df$group = cumsum(df$starts_with == "NM")