如何使用 athena 分析多个 s3 清单?
How can I analyze multiple s3 inventories using athena?
我想使用 athena 分析多个 s3 清单。
我有多个存储桶的多个 s3 清单。
我想将所有库存加载到一个 table。
你能给点意见吗?
如果您的文件具有相同的架构,我建议使用 table 分区功能。您可以创建分区 table,然后将每个存储桶添加为分区。
https://docs.aws.amazon.com/athena/latest/ug/partitions.html
您也可以使用 Glue Crawler:
https://docs.aws.amazon.com/athena/latest/ug/glue-best-practices.html#schema-crawlers-data-sources
我想使用 athena 分析多个 s3 清单。
我有多个存储桶的多个 s3 清单。
我想将所有库存加载到一个 table。
你能给点意见吗?
如果您的文件具有相同的架构,我建议使用 table 分区功能。您可以创建分区 table,然后将每个存储桶添加为分区。
https://docs.aws.amazon.com/athena/latest/ug/partitions.html
您也可以使用 Glue Crawler:
https://docs.aws.amazon.com/athena/latest/ug/glue-best-practices.html#schema-crawlers-data-sources