R 随机森林处理 Posixct 值

R Random Forest handling Posixct Values

我正在使用 randomForest 包进行监督学习。 运行 很好,但我对 POSIXct 值有疑问。我的 45 个特征中有三个是日期或带时间的日期。根据 varImPlot,它们都被认为是重要的特征。我试图找出 randomForest 如何使用 POSIXct 格式进行预测,但我找不到任何东西。 谁能提供一些见解?

日期时间通常转换为数字特征(开始日期为 1970-01-01)。所以你可能看到的是时间指数的影响。更好的方法是为日、月、年(除了时间索引)创建单独的特征,然后检查 varImp

> as.numeric(as.Date("1970-01-03"))
[1] 2
> as.numeric(as.Date("2010-12-29"))
[1] 14972