R:将 data.frame 中的字符转换为数字,列 类 未知

R: Convert characters to numeric in data.frame with unknown column classes

在此 SO here 中对如何将字符转换为数字进行了很好的讨论。 也许我错过了 post 中的某些内容,但是如果不知道哪些列是 "convertable"(如果有的话),该怎么办? 是否可以检查可转换性? 此外,我通常会抑制因子转换(更喜欢字符)——所以字符应该是字符(而不是因子)。

df <- data.frame(a=as.character(c(NA, 1/3)), b=letters[1:2], c=c('1|2', '4|2'), d=as.character(3:4), stringsAsFactors = F)

然后应用...一些函数f ...得到:

str(f(df))
'data.frame':   2 obs. of  4 variables:
 $ a: num  NA 0.333
 $ b: chr  "a" "b"
 $ c: chr  "1|2" "4|2"
 $ d: int  3 4

对于任何事先不知道的data.frame如何实现这个?

你可以这样做(虽然不是很优雅)。

fun1 <- function(i) {
  if (!all(is.na(as.numeric(df[, i])))){
    as.numeric(df[, i])
  } else {
    df[, i]
  }
}

df1 <- "names<-"(cbind.data.frame(lapply(seq_along(df), fun1),
                                  stringsAsFactors=FALSE), names(df))

> str(df1)
'data.frame':   2 obs. of  4 variables:
 $ a: num  NA 0.333
 $ b: chr  "a" "b"
 $ c: chr  "1|2" "4|2"
 $ d: num  3 4

或者更一般地说:

convertiblesToNumeric <- function(x){
  x2 <- cbind.data.frame(lapply(seq_along(x), function(i) {
    if (!all(is.na(as.numeric(x[, i])))){
      as.numeric(x[, i])
      } else {
        x[, i]
        }
    }), stringsAsFactors=FALSE)
  names(x2) <- names(x)
  return(x2)
}

df1 <- convertiblesToNumeric(df)
> str(df1)
'data.frame':   2 obs. of  4 variables:
 $ a: num  NA 0.333
 $ b: chr  "a" "b"
 $ c: chr  "1|2" "4|2"
 $ d: num  3 4