如何使用 Azure DataFactory 解压缩 rar 文件
How to uncompress rar files using Azure DataFactory
我们有一个新客户,在着陆项目时,我们给了他们一个 blob 存储空间,让他们留下文件,以便我们以后可以自动化和处理信息。
我们的想法是使用 Azure Datafactory,但我们找不到处理 .rar 文件的方法,甚至 .zip,因为它是来自 windows 的文件,给我们带来了麻烦。而且由于是客户提供.rar格式,我们想绝对确保在要求他们更改之前没有办法处理,或者仅仅为了转换文件而部署数据块或类似服务。
有什么方法可以从 blob 存储中获取 .rar 文件,解压缩,然后处理它?
我一直在查看 和相关官方文档之类的帖子,我们最接近的是使用 ZipDeflate,但它似乎不能满足我们的要求。
提前致谢!
数据工厂压缩仅支持的类型是 GZip、Deflate、BZip2 和 ZipDeflate。
对于Unsupported file types and compression formats,数据工厂为我们提供了一些解决方法:
您可以使用 Azure 数据工厂的可扩展性功能来转换不受支持的文件。两个选项包括 Azure Functions 和使用 Azure Batch 的自定义任务。
您可以看到一个使用 Azure 函数的示例 extract the contents of a tar file. For more information, see Azure Functions activity。
您还可以使用自定义 dotnet activity 构建此功能。更多信息可用 here.
接下来,您可能需要了解如何使用 Azure 函数提取 rar 文件的内容。
您可以使用逻辑应用
您可以使用 webhook activity 调用 runbook
两者都比使用自定义 activity
简单
我们有一个新客户,在着陆项目时,我们给了他们一个 blob 存储空间,让他们留下文件,以便我们以后可以自动化和处理信息。
我们的想法是使用 Azure Datafactory,但我们找不到处理 .rar 文件的方法,甚至 .zip,因为它是来自 windows 的文件,给我们带来了麻烦。而且由于是客户提供.rar格式,我们想绝对确保在要求他们更改之前没有办法处理,或者仅仅为了转换文件而部署数据块或类似服务。
有什么方法可以从 blob 存储中获取 .rar 文件,解压缩,然后处理它?
我一直在查看
提前致谢!
数据工厂压缩仅支持的类型是 GZip、Deflate、BZip2 和 ZipDeflate。
对于Unsupported file types and compression formats,数据工厂为我们提供了一些解决方法:
您可以使用 Azure 数据工厂的可扩展性功能来转换不受支持的文件。两个选项包括 Azure Functions 和使用 Azure Batch 的自定义任务。
您可以看到一个使用 Azure 函数的示例 extract the contents of a tar file. For more information, see Azure Functions activity。
您还可以使用自定义 dotnet activity 构建此功能。更多信息可用 here.
接下来,您可能需要了解如何使用 Azure 函数提取 rar 文件的内容。
您可以使用逻辑应用 您可以使用 webhook activity 调用 runbook
两者都比使用自定义 activity
简单