AWS Athena Return GLUE Crawler 输入来自 S3 的 csv 创建的表中的零记录

AWS Athena Return Zero Records from Tables Created by GLUE Crawler input csv from S3

我已经阅读了AWS Athena Returning Zero Records from Tables Created from GLUE Crawler input csv from S3

问题下的答案

和问题https://aws.amazon.com/de/premiumsupport/knowledge-center/athena-empty-results/

按照建议

  1. 我已经将 S3 中的文件夹路径而不是文件名提供给 Glue 爬虫。
  2. 我已经删除并重新创建了抓取工具

但这并没有帮助

我的情况:

来自 s3 存储中 csv 的示例数据:

Cloud Watch 日志显示胶水 table 已成功创建:

模式结构如下:

sizekey 333 匹配csv数据大小:

但是当我 运行 Athena 查询时,我得到了结果:

只返回列,不返回记录。扫描数据:0 KB

有人知道胶水爬虫为什么不能转换数据吗?

谢谢!

查看生成的 table 名称后,您似乎在传递给 Glue 爬虫的文件夹路径中有多个具有不同架构的文件。如果您想在 Athena 中查询这些 table,那么您必须将这些具有不同架构的 CSV 文件放在不同的文件夹中。

虽然您将文件夹路径传递给 Glue 爬虫,但它会创建 tables,其中包含 Athena tables.You 的完整文件路径 tables.You 可以通过 运行 show create table <table-name> 进行验证。