R:按行顺序分组
R: Group by Sequence of Rows
我有一个来自 IMDB 的数据框,看起来像这样。不幸的是,它没有分组,但我希望我可以将它分组。
数据如下所示:
V1 V2 starts_with
NM: Aarons Alex NM
DB: 15 May 1890 Philadelphia DB
NM: Aarons Leroy NM
NM: Aarons Shawn NM
DB: 26 March 1989 Jamaica DB
我想要添加一个新列。基于 NM 和 DB 组合的序列。每有一个新的"NM"就会有一个新的数字:
V1 V2 starts_with group
NM: Aarons Alex NM 1
DB: 15 May 1890 Philadelphia DB 1
NM: Aarons Leroy NM 2
NM: Aarons Shawn NM 3
DB: 26 March 1989 Jamaica DB 3
我当然搜索了 SO 并看到了这个 generate sequence within group in R 但那个例子已经分组了。不幸的是,我的数据没有分组。
您可以使用 cumsum
:
df$group = cumsum(df$starts_with == "NM")
我有一个来自 IMDB 的数据框,看起来像这样。不幸的是,它没有分组,但我希望我可以将它分组。
数据如下所示:
V1 V2 starts_with
NM: Aarons Alex NM
DB: 15 May 1890 Philadelphia DB
NM: Aarons Leroy NM
NM: Aarons Shawn NM
DB: 26 March 1989 Jamaica DB
我想要添加一个新列。基于 NM 和 DB 组合的序列。每有一个新的"NM"就会有一个新的数字:
V1 V2 starts_with group
NM: Aarons Alex NM 1
DB: 15 May 1890 Philadelphia DB 1
NM: Aarons Leroy NM 2
NM: Aarons Shawn NM 3
DB: 26 March 1989 Jamaica DB 3
我当然搜索了 SO 并看到了这个 generate sequence within group in R 但那个例子已经分组了。不幸的是,我的数据没有分组。
您可以使用 cumsum
:
df$group = cumsum(df$starts_with == "NM")