从 S3 解压缩文件并将其写回 S3 的 AWS Glue 作业

AWS Glue job to unzip a file from S3 and write it back to S3

我是 AWS Glue 的新手,我想使用 AWS Glue 解压缩 S3 存储桶中的一个大文件,然后将内容写回 S3。

我在尝试 google 这个要求时找不到任何东西。

我的问题是:

  1. 如何将 zip 文件作为数据源添加到 AWS Glue?
  2. 如何将其写回相同的 S3 位置?

我正在使用 AWS Glue Studio。任何帮助将不胜感激。

I couldn't find anything while trying to google this requirement.

您找不到任何关于此的信息,因为这不是 Glue 所做的。 Glue 可以原生读取 gzip(不是 zip)个文件。如果你有 zip,那么你必须自己在 S3 中转换所有文件。胶水不行。

要转换文件,您可以下载、重新打包并以 gzip 格式或 Glue 支持的任何其他格式重新上传。