R:case_when 使用 dplyr mutate 产生意外的 "NA"
R: case_when producing unexpected "NA" with dplyr mutate
我有以下用户定义函数
vareas1 <- function(a, b, c) {
case_when(a == 1 ~ "top",
b == 1 ~ "left",
c == 1 ~ "right",
near(a, 1/3) && near(b, 1/3) && near(c, 1/3) ~ "centre"
)
}
test2 <- vareas1(1/3, 1/3, 1/3)
正确计算为
[1] "centre
.
但是,当通过 dplyr 的 mutate 应用它时,它有时会产生 NA。示例如下:
test1 <- data.frame("a" = c(1, 0, 0, 1/3),
"b" = c(0, 1, 0, 1/3),
"c" = c(0, 0, 1, 1/3)) %>% mutate(area1 = vareas1(a, b, c))
这导致:
a b c area1
1 1.0000000 0.0000000 0.0000000 top
2 0.0000000 1.0000000 0.0000000 left
3 0.0000000 0.0000000 1.0000000 right
4 0.3333333 0.3333333 0.3333333 <NA>
第 [4] 行中的 NA 而不是结果 "centre" 出乎意料,我不明白它从何而来。
我认为可能是因为a、b、c列的class,我修改了函数
vareas1_int <- function(a, b, c) {
case_when(a == as.integer(1 * 10e6) ~ "top",
b == as.integer(1 * 10e6) ~ "left",
c == as.integer(1 * 10e6) ~ "right",
near(a, as.integer(1/3 * 10e+6) &&
near(b, as.integer(1/3 * 10e+6)) &&
near(c, as.integer(1/3 * 10e+6))) ~ "centre"
)
}
并将 a、b、c 更改为适合的整数:
test1 <- test1 %>%
mutate(a_mil = as.integer(a * 10e+6),
b_mil = as.integer(b * 10e+6),
c_mil = as.integer(c * 10e+6))
但结果是一样的:
a b c area1 a_mil b_mil c_mil area_int
1 1.0000000 0.0000000 0.0000000 top 10000000 0 0 top
2 0.0000000 1.0000000 0.0000000 left 0 10000000 0 left
3 0.0000000 0.0000000 1.0000000 right 0 0 10000000 right
4 0.3333333 0.3333333 0.3333333 <NA> 3333333 3333333 3333333 <NA>
感谢您的帮助!
(这个类似的 没有涵盖我的问题。)
您需要 &
而不是 &&
才能使您的函数使用向量。
library(tidyverse)
vareas1 <- function(a, b, c) {
case_when(a == 1 ~ "top",
b == 1 ~ "left",
c == 1 ~ "right",
near(a, 1/3) & near(b, 1/3) & near(c, 1/3) ~ "centre"
)
}
data.frame("a" = c(1, 0, 0, 1/3),
"b" = c(0, 1, 0, 1/3),
"c" = c(0, 0, 1, 1/3)) %>% mutate(area1 = vareas1(a, b, c))
我有以下用户定义函数
vareas1 <- function(a, b, c) {
case_when(a == 1 ~ "top",
b == 1 ~ "left",
c == 1 ~ "right",
near(a, 1/3) && near(b, 1/3) && near(c, 1/3) ~ "centre"
)
}
test2 <- vareas1(1/3, 1/3, 1/3)
正确计算为
[1] "centre
.
但是,当通过 dplyr 的 mutate 应用它时,它有时会产生 NA。示例如下:
test1 <- data.frame("a" = c(1, 0, 0, 1/3),
"b" = c(0, 1, 0, 1/3),
"c" = c(0, 0, 1, 1/3)) %>% mutate(area1 = vareas1(a, b, c))
这导致:
a b c area1
1 1.0000000 0.0000000 0.0000000 top
2 0.0000000 1.0000000 0.0000000 left
3 0.0000000 0.0000000 1.0000000 right
4 0.3333333 0.3333333 0.3333333 <NA>
第 [4] 行中的 NA 而不是结果 "centre" 出乎意料,我不明白它从何而来。
我认为可能是因为a、b、c列的class,我修改了函数
vareas1_int <- function(a, b, c) {
case_when(a == as.integer(1 * 10e6) ~ "top",
b == as.integer(1 * 10e6) ~ "left",
c == as.integer(1 * 10e6) ~ "right",
near(a, as.integer(1/3 * 10e+6) &&
near(b, as.integer(1/3 * 10e+6)) &&
near(c, as.integer(1/3 * 10e+6))) ~ "centre"
)
}
并将 a、b、c 更改为适合的整数:
test1 <- test1 %>%
mutate(a_mil = as.integer(a * 10e+6),
b_mil = as.integer(b * 10e+6),
c_mil = as.integer(c * 10e+6))
但结果是一样的:
a b c area1 a_mil b_mil c_mil area_int
1 1.0000000 0.0000000 0.0000000 top 10000000 0 0 top
2 0.0000000 1.0000000 0.0000000 left 0 10000000 0 left
3 0.0000000 0.0000000 1.0000000 right 0 0 10000000 right
4 0.3333333 0.3333333 0.3333333 <NA> 3333333 3333333 3333333 <NA>
感谢您的帮助!
(这个类似的
您需要 &
而不是 &&
才能使您的函数使用向量。
library(tidyverse)
vareas1 <- function(a, b, c) {
case_when(a == 1 ~ "top",
b == 1 ~ "left",
c == 1 ~ "right",
near(a, 1/3) & near(b, 1/3) & near(c, 1/3) ~ "centre"
)
}
data.frame("a" = c(1, 0, 0, 1/3),
"b" = c(0, 1, 0, 1/3),
"c" = c(0, 0, 1, 1/3)) %>% mutate(area1 = vareas1(a, b, c))