Athena gzip 压缩查询结果具有混合压缩解压缩

Athena gzip compression query result has hybrid compressed-decompressed

我正在使用具有 gzip 压缩 csv 文件的 s3 存储桶设置 AWS Athena。

然后这样查询

SELECT * FROM "sample_db"."sample_table2" limit 100;

第 1 次和第 2 次的结果不同。

似乎混合了压缩/解压结果。

有什么方法可以在 Athena 上获得仅解压后的结果吗?

文件内容如下:

"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,

s3只有一个文件test-sample.gz

查询次数 1

查询取 2

原因是错误的格式查询、csv 分区和损坏的数据。

它正在直接在目录中进行 s3 gz 上传。