将压缩文件与 Datafusion 一起使用

Using compressed files with Datafusion

有没有办法将压缩文件与云数据融合一起使用。我使用 Google 存储作为源并将 gzip 文件放在首选位置。

在 wrangler 转换中,我没有看到预览。当我尝试使用 select 数据 select 文件时,压缩文件未突出显示。当我处理未压缩的文件时,这些步骤工作正常。

我应该在争论之前使用一些转换吗?有没有办法可以直接读取压缩文件并预览数据。在数据准备中,转换根据扩展名识别文件,但是在数据融合中,似乎没有这样的选项。

我使用的是基本版的数据融合环境,企业版有帮助吗?

Wrangler 希望文件未压缩,但尚不支持读取压缩文件。我已经打开了相同 https://issues.cask.co/browse/CDAP-16140

的增强请求

谢谢, 斯里

尽管 wrangler 不允许我们 select 压缩文件并以交互方式对文件执行转换,但是我们可以手动输入 wrangler 指令。当我们在 运行 时间向源提供压缩文件时,管道将按预期工作。