将 data.table 字符串列转换为 POSIXct; round.POSIXt() returns POSIXlt?

Convert data.table string column to POSIXct; round.POSIXt() returns a POSIXlt?

我有一个日期时间列作为字符存储在 data.table 中。当我转换为 POSIXct 然后尝试四舍五入为仅日期时,我得到了奇怪的结果。

library(data.table)
library(lubridate)

# suppose I have these dates, in a data.table
date_chr <- c("2014-04-09 8:37 AM", "2014-09-16 6:04 PM", 
              "2014-09-30 3:26 PM", "2014-11-13 12:47 PM",
              "2014-11-05 12:25 PM")
dat <- data.table(date_chr)

# I convert to POSIXct...
dat[, my_date := ymd_hm(date_chr)]

# ...and I want to round to date only, but this doesn't work
dat[, date_only := round(my_date, 'days')] # why does this return a list?
dat[, date_only := trunc(my_date, 'days')] # this too

class(dat$date_only)list,我收到此警告消息

# Warning message:
#   In `[.data.table`(dat, , `:=`(date_only, round(my_date, "days"))) :
#   Supplied 9 items to be assigned to 5 items of column 'date_only' (4 unused)

与此同时,这工作正常!

dat_df <- data.frame(date_chr, stringsAsFactors = F)
dat_df$my_date <- ymd_hm(dat_df$date_chr)
dat_df$date_only <- round(dat_df$my_date, 'days')

class(dat_df$date_only)POSIXlt, POSIXt,根据需要。

我的问题是,为什么会这样?在使用 data.table 时如何避免这个问题?有变通办法,比如在转换前截断 date_chr 的时间部分,但似乎 round.POSIXt() 应该可以工作。

感谢任何想法。

@SymbolixAU 的评论已经很好地回答了。
解决你关于数据的问题。frame/data。关于那个问题的框架差异。
主要区别在于 POSIXltPOSIXct 占用更多内存,而 data.table 确实关心内存。

object.size(Sys.time())
#312 bytes
object.size(as.POSIXlt(Sys.time()))
#2144 bytes

需要知道的重要一点是,您仍然可以在 data.table j 参数中使用 POSIXlt 数据类型(及其方法),只需确保将其转换为 POSIXct 分配给列时。

如果出于某种原因您想将 POSIXlt 存储在 data.table 中...data.table 不支持与 data.frame 相同的 POSIXlt 类型。您可以将 POSIXlt 存储在 data.table 中,但只需将其包装到列表中,就像任何其他非原子数据类型一样。

和类似

data.table(as.Date(date_chr))