Athena gzip 压缩查询结果具有混合压缩解压缩
Athena gzip compression query result has hybrid compressed-decompressed
我正在使用具有 gzip 压缩 csv 文件的 s3 存储桶设置 AWS Athena。
然后这样查询
SELECT * FROM "sample_db"."sample_table2" limit 100;
第 1 次和第 2 次的结果不同。
似乎混合了压缩/解压结果。
有什么方法可以在 Athena 上获得仅解压后的结果吗?
文件内容如下:
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
s3只有一个文件test-sample.gz
查询次数 1
查询取 2
原因是错误的格式查询、csv 分区和损坏的数据。
它正在直接在目录中进行 s3 gz 上传。
我正在使用具有 gzip 压缩 csv 文件的 s3 存储桶设置 AWS Athena。
然后这样查询
SELECT * FROM "sample_db"."sample_table2" limit 100;
第 1 次和第 2 次的结果不同。
似乎混合了压缩/解压结果。
有什么方法可以在 Athena 上获得仅解压后的结果吗?
文件内容如下:
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
"title","user_info.client_user_id","user_info.player_id"
"test : csv take 4",,
s3只有一个文件test-sample.gz
查询次数 1
查询取 2
原因是错误的格式查询、csv 分区和损坏的数据。
它正在直接在目录中进行 s3 gz 上传。