根据 r 中的多个条件创建新列
Create new colum based on multiple conditions in r
我有一个数据框,我想在其中根据数据框中的其他现有列(“th”和“br”)创建一个新列(“path”)。如果“th”中的值为“NA”,我想根据列“ce”和“br”创建新列。
可以使用以下代码创建可重现的数据样本:
df <- structure(list(
th = c(3, 1, NA, 2, 2, 0, 3, 3, 0, 2, 3, 2, 1, NA, 3, 4, 3, 3, 1, 3),
br = c(1, 2, 4, 1, 2, 2, 1, 2, 2, 5, 4, 1, 1, 2, 1, 5, 2, 1, 1, 1),
ce = c(2, 3, 2, 0, 1, 0, 2, 1, 1, 1, 1, 0, 0, 1, 2, 0, 0, 1, 1, 2)),
row.names = c(NA, 20L), class = "data.frame")
我已经用 if 和 else 语句尝试了以下代码:
df <- df %>% if(!is.na(th)) {
mutate(path = case_when(
(th %in% c(0:2) & br %in% c(0:3) ~ "Low"),
(th %in% c(3:5) & br %in% c(0:3) ~ "Intermediate"),
(th %in% c(3:5) & br %in% c(4:6) ~ "High")))
} else {
mutate(path = case_when(
(ce %in% c(0:1) & br %in% c(0:3) ~ "Low"),
(ce %in% c(1:3) & br %in% c(3) ~ "Intermediate"),
(ce %in% c(2:3) & br %in% c(4:6) ~ "High")))
}
这会导致错误“if (.) !is.na(th) else { 中出错:
条件的长度 > 1"
代码有什么问题?有任何关于如何改进代码或替代解决方案的建议吗?
试试这个:
df %>%
mutate(path = ifelse(!is.na(th),
case_when(
(th %in% c(0:2) & br %in% c(0:3) ~ "Low"),
(th %in% c(3:5) & br %in% c(0:3) ~ "Intermediate"),
(th %in% c(3:5) & br %in% c(4:6) ~ "High")),
case_when(
(ce %in% c(0:1) & br %in% c(0:3) ~ "Low"),
(ce %in% c(1:3) & br %in% c(3) ~ "Intermediate"),
(ce %in% c(2:3) & br %in% c(4:6) ~ "High"))))
我有一个数据框,我想在其中根据数据框中的其他现有列(“th”和“br”)创建一个新列(“path”)。如果“th”中的值为“NA”,我想根据列“ce”和“br”创建新列。
可以使用以下代码创建可重现的数据样本:
df <- structure(list(
th = c(3, 1, NA, 2, 2, 0, 3, 3, 0, 2, 3, 2, 1, NA, 3, 4, 3, 3, 1, 3),
br = c(1, 2, 4, 1, 2, 2, 1, 2, 2, 5, 4, 1, 1, 2, 1, 5, 2, 1, 1, 1),
ce = c(2, 3, 2, 0, 1, 0, 2, 1, 1, 1, 1, 0, 0, 1, 2, 0, 0, 1, 1, 2)),
row.names = c(NA, 20L), class = "data.frame")
我已经用 if 和 else 语句尝试了以下代码:
df <- df %>% if(!is.na(th)) {
mutate(path = case_when(
(th %in% c(0:2) & br %in% c(0:3) ~ "Low"),
(th %in% c(3:5) & br %in% c(0:3) ~ "Intermediate"),
(th %in% c(3:5) & br %in% c(4:6) ~ "High")))
} else {
mutate(path = case_when(
(ce %in% c(0:1) & br %in% c(0:3) ~ "Low"),
(ce %in% c(1:3) & br %in% c(3) ~ "Intermediate"),
(ce %in% c(2:3) & br %in% c(4:6) ~ "High")))
}
这会导致错误“if (.) !is.na(th) else { 中出错: 条件的长度 > 1"
代码有什么问题?有任何关于如何改进代码或替代解决方案的建议吗?
试试这个:
df %>%
mutate(path = ifelse(!is.na(th),
case_when(
(th %in% c(0:2) & br %in% c(0:3) ~ "Low"),
(th %in% c(3:5) & br %in% c(0:3) ~ "Intermediate"),
(th %in% c(3:5) & br %in% c(4:6) ~ "High")),
case_when(
(ce %in% c(0:1) & br %in% c(0:3) ~ "Low"),
(ce %in% c(1:3) & br %in% c(3) ~ "Intermediate"),
(ce %in% c(2:3) & br %in% c(4:6) ~ "High"))))