在 dplyr::case_when() 内循环时函数中断

Function breaks when looped within dplyr::case_when()

我有一个函数可以提取一系列值(在字符串中)的最小值或最小值,在个别情况下似乎可以正常工作。

但是,当我尝试在 case_when() 中使用它时,它的行为并不像预期的那样。

可重现的例子

library(dplyr)
library(tibble)
library(stringr)


val_from_range <- function(.str, .fun = "min"){
  str_extract_all(.str, "\d*\.?\d+") |> 
    unlist() |> 
    as.numeric() |> 
    (\(x) if (.fun == "min") x |> min() 
     else if (.fun == "max") x |> max())()
  
}

tibble(x = c("5-6", "4", "6-9", "5", "NA")) |> 
  mutate(min = case_when(str_detect(x, "-") ~ val_from_range(x, "min"))) |> 
  mutate(max = case_when(str_detect(x, "-") ~ val_from_range(x, "max")))

# A tibble: 5 x 3
  x       min   max
  <chr> <dbl> <dbl>
1 5-6       4     9
2 4        NA    NA
3 6-9       4     9
4 5        NA    NA
5 NA       NA    NA

不过,我想要:

# A tibble: 5 x 3
  x       min   max
  <chr> <dbl> <dbl>
1 5-6       5     6
2 4        NA    NA
3 6-9       6     9
4 5        NA    NA
5 NA       NA    NA

函数在个别情况下按预期执行

> val_from_range("5-6", "min")
[1] 5
> val_from_range("5-6", "max")
[1] 6
> val_from_range("5-6-8-10", "max")
[1] 10

如有任何帮助,我们将不胜感激。提前致谢。

需要进行一些更改。该函数一次仅适用于一个值。如果您传入多个值,它会忽略第二个值。

val_from_range("5-6", "min")
#[1] 5

val_from_range(c("5-6", "8-10"), "min")
#[1] 5

要一一通过它们,您可以借助 rowwise。其次,case_when 仍然对不满足条件的值执行函数,因此 returns 对 "NA" 值发出警告。我们可以在这里使用 if/else 来避免这种情况。

library(dplyr)
library(stringr)

tibble(x = c("5-6", "4", "6-9", "5", "NA")) %>%
  rowwise() %>%
  mutate(min = if(str_detect(x, "-")) val_from_range(x, "min") else NA,
         max = if(str_detect(x, "-")) val_from_range(x, "max") else NA) %>%
  ungroup

#   x       min   max
#  <chr> <dbl> <dbl>
#1 5-6       5     6
#2 4        NA    NA
#3 6-9       6     9
#4 5        NA    NA
#5 NA       NA    NA