无法将 AWS Athena 与 JSON + Snappy 一起使用

Unable to use AWS Athena with JSON + Snappy

在查看 AWS Athena 的 supported compression documentation 时,我发现支持 Snappy。但是,当我尝试对 JSON 数据格式使用 Snappy 压缩时,我遇到了很多错误。

我已经尝试在 Athena 中使用两个可用的 SerDes 创建 tables:

'org.apache.hive.hcatalog.data.JsonSerDe'
'org.openx.data.jsonserde.JsonSerDe'

我试过未压缩 JSON 和使用 GZIP 压缩。两者都很好。

我尝试使用大量 TBLPROPERTIES 和 SERDEPROPERTIES 创建 table,但 none 有所帮助。

'Zero Records Returned' 来自我的查询是任何尝试查询 SNAPPY 压缩 JSON.

的最终结果

有没有人看到这个问题并克服它?

对于CSVTSVJSON中的数据,Athena根据文件扩展名确定压缩类型。如果没有文件扩展名,Athena 会将数据视为未压缩的纯文本。如果您的数据是压缩的,请确保文件名包含压缩扩展名 .json.snappy