使用 sapply 将列转换为 posixct 并在 R 中保留日期时间格式
Convert columns to posixct using sapply and keeping datetime format in R
我想使用 sapply
(或类似的东西)将 R data.frame 中的某些列转换为 POSIXct,但保持列的日期时间格式。当我目前这样做时,它会将格式转换为数字。我怎样才能做到这一点?下面是一个例子。
#sample dataframe
df <- data.frame(
var1=c(5, 2),
char1=c('he', 'she'),
timestamp1=c('2019-01-01 20:30:08', '2019-01-02 08:27:34'),
timestamp2=c('2019-01-01 12:24:54', '2019-01-02 10:57:47'),
stringsAsFactors = F
)
#Convert only columns with 'timestamp' in name to POSIXct
df[grep('timestamp', names(df))] <- sapply(df[grep('timestamp', names(df))], function(x) as.POSIXct(x, format='%Y-%m-%d %H:%M:%S'))
df
var1 char1 timestamp1 timestamp2
1 5 he 1546392608 1546363494
2 2 she 1546435654 1546444667
注意:我可以使用 as.posixlt
而不是 as.posixct
并且它有效,但我想要 POSIXct 格式的数据。我还尝试先转换为 POSIXlt,然后再转换为 POSIXct,但这也最终将列转换为数字。
使用 lapply
而不是 sapply
。 sapply
中的 "s" 用于简化,它将结果转换为矩阵,但 sapply 无法创建 POSIXct 值的矩阵,因此它被转换为简单的数字矩阵。但是如果你把它放在一个列表中,你就不会丢失 class.
df[grep('timestamp', names(df))] <- lapply(df[grep('timestamp', names(df))], function(x) as.POSIXct(x, format='%Y-%m-%d %H:%M:%S'))
您也可以使用 dplyr
轻松完成此操作
library(dplyr)
df %>% mutate_at(vars(contains("timestamp")), as.POSIXct)
我想使用 sapply
(或类似的东西)将 R data.frame 中的某些列转换为 POSIXct,但保持列的日期时间格式。当我目前这样做时,它会将格式转换为数字。我怎样才能做到这一点?下面是一个例子。
#sample dataframe
df <- data.frame(
var1=c(5, 2),
char1=c('he', 'she'),
timestamp1=c('2019-01-01 20:30:08', '2019-01-02 08:27:34'),
timestamp2=c('2019-01-01 12:24:54', '2019-01-02 10:57:47'),
stringsAsFactors = F
)
#Convert only columns with 'timestamp' in name to POSIXct
df[grep('timestamp', names(df))] <- sapply(df[grep('timestamp', names(df))], function(x) as.POSIXct(x, format='%Y-%m-%d %H:%M:%S'))
df
var1 char1 timestamp1 timestamp2
1 5 he 1546392608 1546363494
2 2 she 1546435654 1546444667
注意:我可以使用 as.posixlt
而不是 as.posixct
并且它有效,但我想要 POSIXct 格式的数据。我还尝试先转换为 POSIXlt,然后再转换为 POSIXct,但这也最终将列转换为数字。
使用 lapply
而不是 sapply
。 sapply
中的 "s" 用于简化,它将结果转换为矩阵,但 sapply 无法创建 POSIXct 值的矩阵,因此它被转换为简单的数字矩阵。但是如果你把它放在一个列表中,你就不会丢失 class.
df[grep('timestamp', names(df))] <- lapply(df[grep('timestamp', names(df))], function(x) as.POSIXct(x, format='%Y-%m-%d %H:%M:%S'))
您也可以使用 dplyr
library(dplyr)
df %>% mutate_at(vars(contains("timestamp")), as.POSIXct)