如何在创建 Athena 时对日期时间列进行分区 table

How to partition a datetime column when creating Athena table

我在 S3 中有一些具有以下 csv 格式的日志文件(括号中的示例数据):

userid (15678),
datetime (2017-09-14T00:21:10),
tag1 (some random text),
tag2 (some random text)

我想加载到 Athena tables 并根据日期时间以 day/month/year 格式对数据进行分区。有没有办法在 table 创建时拆分日期时间,或者我是否需要 运行 在分隔列然后导入之前做一些工作?

Athena 仅支持 Hive 的外部表。在外部表中对数据进行分区,您的数据必须在不同的文件夹中。

有两种方法可以做到这一点。两者都被提及 here.