按指定数量重复 df 列中的值,并将整数计数连接到重复值
Repeating the value in a df column by a specified amount, and concatenating integer count to repeated values
我想使用 R 从 template_df
创建一个 expanded_df
,其中每一行重复 template_df
的单独列中指定的次数,并且整数计数连接到 expanded_df
中的 ID 列,指定此行在 expanded_df
.
中重复的次数
我希望每个 ID 的计数从 600 开始 class。
例如,template_df
:
Initial_ID Count
a 2
b 3
c 1
d 4
expanded_df
:
Expanded_ID
a-600
a-601
b-600
b-601
b-602
c-600
d-600
d-601
d-602
d-603
有人有什么想法吗?谢谢!
我们可以用uncount
展开行,然后得到rowid
('Initial_ID'到paste
加上599
library(dplyr)
library(tidyr)
library(data.table)
library(stringr)
template_df %>%
uncount(Count) %>%
transmute(Expanded_ID = str_c(Initial_ID, 599 + rowid(Initial_ID), sep = '-'))
-输出
Expanded_ID
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603
或将 base R
与 rep
和 paste
一起使用
data.frame(Expanded_ID = with(template_df, paste0(rep(Initial_ID, Count), "-",
599 + sequence(Count))))
-输出
Expanded_ID
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603
数据
template_df <- structure(list(Initial_ID = c("a", "b", "c", "d"), Count = c(2L,
3L, 1L, 4L)), class = "data.frame", row.names = c(NA, -4L))
另一种 dplyr
解决方案:
library(dplyr)
template_df %>%
group_by(Initial_ID) %>%
slice(rep(1:n(), each = Count)) %>%
mutate(row = 600 + row_number()-1) %>%
ungroup() %>%
transmute(Expanded_ID = paste(Initial_ID,row, sep = "-"))
Expanded_ID
<chr>
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603
我想使用 R 从 template_df
创建一个 expanded_df
,其中每一行重复 template_df
的单独列中指定的次数,并且整数计数连接到 expanded_df
中的 ID 列,指定此行在 expanded_df
.
我希望每个 ID 的计数从 600 开始 class。
例如,template_df
:
Initial_ID Count
a 2
b 3
c 1
d 4
expanded_df
:
Expanded_ID
a-600
a-601
b-600
b-601
b-602
c-600
d-600
d-601
d-602
d-603
有人有什么想法吗?谢谢!
我们可以用uncount
展开行,然后得到rowid
('Initial_ID'到paste
加上599
library(dplyr)
library(tidyr)
library(data.table)
library(stringr)
template_df %>%
uncount(Count) %>%
transmute(Expanded_ID = str_c(Initial_ID, 599 + rowid(Initial_ID), sep = '-'))
-输出
Expanded_ID
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603
或将 base R
与 rep
和 paste
data.frame(Expanded_ID = with(template_df, paste0(rep(Initial_ID, Count), "-",
599 + sequence(Count))))
-输出
Expanded_ID
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603
数据
template_df <- structure(list(Initial_ID = c("a", "b", "c", "d"), Count = c(2L,
3L, 1L, 4L)), class = "data.frame", row.names = c(NA, -4L))
另一种 dplyr
解决方案:
library(dplyr)
template_df %>%
group_by(Initial_ID) %>%
slice(rep(1:n(), each = Count)) %>%
mutate(row = 600 + row_number()-1) %>%
ungroup() %>%
transmute(Expanded_ID = paste(Initial_ID,row, sep = "-"))
Expanded_ID
<chr>
1 a-600
2 a-601
3 b-600
4 b-601
5 b-602
6 c-600
7 d-600
8 d-601
9 d-602
10 d-603