无法将 AWS Athena 与 JSON + Snappy 一起使用
Unable to use AWS Athena with JSON + Snappy
在查看 AWS Athena 的 supported compression documentation 时,我发现支持 Snappy。但是,当我尝试对 JSON 数据格式使用 Snappy 压缩时,我遇到了很多错误。
我已经尝试在 Athena 中使用两个可用的 SerDes 创建 tables:
'org.apache.hive.hcatalog.data.JsonSerDe'
'org.openx.data.jsonserde.JsonSerDe'
我试过未压缩 JSON 和使用 GZIP 压缩。两者都很好。
我尝试使用大量 TBLPROPERTIES 和 SERDEPROPERTIES 创建 table,但 none 有所帮助。
'Zero Records Returned' 来自我的查询是任何尝试查询 SNAPPY 压缩 JSON.
的最终结果
有没有人看到这个问题并克服它?
对于CSV
、TSV
和JSON
中的数据,Athena根据文件扩展名确定压缩类型。如果没有文件扩展名,Athena 会将数据视为未压缩的纯文本。如果您的数据是压缩的,请确保文件名包含压缩扩展名 .json.snappy
在查看 AWS Athena 的 supported compression documentation 时,我发现支持 Snappy。但是,当我尝试对 JSON 数据格式使用 Snappy 压缩时,我遇到了很多错误。
我已经尝试在 Athena 中使用两个可用的 SerDes 创建 tables:
'org.apache.hive.hcatalog.data.JsonSerDe'
'org.openx.data.jsonserde.JsonSerDe'
我试过未压缩 JSON 和使用 GZIP 压缩。两者都很好。
我尝试使用大量 TBLPROPERTIES 和 SERDEPROPERTIES 创建 table,但 none 有所帮助。
'Zero Records Returned' 来自我的查询是任何尝试查询 SNAPPY 压缩 JSON.
的最终结果有没有人看到这个问题并克服它?
对于CSV
、TSV
和JSON
中的数据,Athena根据文件扩展名确定压缩类型。如果没有文件扩展名,Athena 会将数据视为未压缩的纯文本。如果您的数据是压缩的,请确保文件名包含压缩扩展名 .json.snappy