如何使用 athena 分析多个 s3 清单?

How can I analyze multiple s3 inventories using athena?

我想使用 athena 分析多个 s3 清单。

我有多个存储桶的多个 s3 清单。

我想将所有库存加载到一个 table。

你能给点意见吗?

如果您的文件具有相同的架构,我建议使用 table 分区功能。您可以创建分区 table,然后将每个存储桶添加为分区。

https://docs.aws.amazon.com/athena/latest/ug/partitions.html

您也可以使用 Glue Crawler:

https://docs.aws.amazon.com/athena/latest/ug/glue-best-practices.html#schema-crawlers-data-sources