如何使用 Azure DataFactory 解压缩 rar 文件

How to uncompress rar files using Azure DataFactory

我们有一个新客户,在着陆项目时,我们给了他们一个 blob 存储空间,让他们留下文件,以便我们以后可以自动化和处理信息。

我们的想法是使用 Azure Datafactory,但我们找不到处理 .rar 文件的方法,甚至 .zip,因为它是来自 windows 的文件,给我们带来了麻烦。而且由于是客户提供.rar格式,我们想绝对确保在要求他们更改之前没有办法处理,或者仅仅为了转换文件而部署数据块或类似服务。

有什么方法可以从 blob 存储中获取 .rar 文件,解压缩,然后处理它?

我一直在查看 和相关官方文档之类的帖子,我们最接近的是使用 ZipDeflate,但它似乎不能满足我们的要求。

提前致谢!

数据工厂压缩仅支持的类型是 GZip、Deflate、BZip2 和 ZipDeflate。

对于Unsupported file types and compression formats,数据工厂为我们提供了一些解决方法:

您可以使用 Azure 数据工厂的可扩展性功能来转换不受支持的文件。两个选项包括 Azure Functions 和使用 Azure Batch 的自定义任务。

您可以看到一个使用 Azure 函数的示例 extract the contents of a tar file. For more information, see Azure Functions activity

您还可以使用自定义 dotnet activity 构建此功能。更多信息可用 here.

接下来,您可能需要了解如何使用 Azure 函数提取 rar 文件的内容。

您可以使用逻辑应用 您可以使用 webhook activity 调用 runbook

两者都比使用自定义 activity

简单