R:获取rowSum等于一个值的列名
R: get the column names where rowSum is equal to a value
我有一个包含多列的数据框,其中 rowSums
是 1
或 0.9
。
如果一列是 0.5
,则另一列必须是 0.5
。如果一列是 0.3
,那么其他两列必须具有相同的值。
df <- data.frame(A = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5), B = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5),
C = c(1, 1, 0.3, 0, 1, 0.3, 0))
我最后需要的是另一列 (result
),其中列名的值 > 0。
> df
A B C result
1 0.0 0.0 1.0 C
2 0.0 0.0 1.0 C
3 0.3 0.3 0.3 A-B-C
4 0.5 0.5 0.0 A-B
5 0.0 0.0 1.0 C
6 0.3 0.3 0.3 A-B-C
7 0.5 0.5 0.0 A-B
谢谢!
library(tidyverse)
df %>%
mutate(id = row_number()) %>%
pivot_longer(-id, names_to = "cd", values_to = "vals") %>%
filter(vals > 0) %>%
group_by(id) %>%
summarise(new_val = paste(cd, collapse = "-")) %>%
ungroup() %>%
cbind(df, .)
你可以这样做:
df$result <- apply(df, 1, function(x) paste(names(df)[x > 0], collapse = "-"))
df
A B C result
1 0.0 0.0 1.0 C
2 0.0 0.0 1.0 C
3 0.3 0.3 0.3 A-B-C
4 0.5 0.5 0.0 A-B
5 0.0 0.0 1.0 C
6 0.3 0.3 0.3 A-B-C
7 0.5 0.5 0.0 A-B
我有一个包含多列的数据框,其中 rowSums
是 1
或 0.9
。
如果一列是 0.5
,则另一列必须是 0.5
。如果一列是 0.3
,那么其他两列必须具有相同的值。
df <- data.frame(A = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5), B = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5),
C = c(1, 1, 0.3, 0, 1, 0.3, 0))
我最后需要的是另一列 (result
),其中列名的值 > 0。
> df
A B C result
1 0.0 0.0 1.0 C
2 0.0 0.0 1.0 C
3 0.3 0.3 0.3 A-B-C
4 0.5 0.5 0.0 A-B
5 0.0 0.0 1.0 C
6 0.3 0.3 0.3 A-B-C
7 0.5 0.5 0.0 A-B
谢谢!
library(tidyverse)
df %>%
mutate(id = row_number()) %>%
pivot_longer(-id, names_to = "cd", values_to = "vals") %>%
filter(vals > 0) %>%
group_by(id) %>%
summarise(new_val = paste(cd, collapse = "-")) %>%
ungroup() %>%
cbind(df, .)
你可以这样做:
df$result <- apply(df, 1, function(x) paste(names(df)[x > 0], collapse = "-"))
df
A B C result
1 0.0 0.0 1.0 C
2 0.0 0.0 1.0 C
3 0.3 0.3 0.3 A-B-C
4 0.5 0.5 0.0 A-B
5 0.0 0.0 1.0 C
6 0.3 0.3 0.3 A-B-C
7 0.5 0.5 0.0 A-B