Azure 数据工厂解压
Azure Data Factory Decompress
我有一个问题。我的 FTP 位置有一些 .zip 文件,我想解压缩并将它们复制到 ADLS。在文档中对此有明确的解释:
"Read .zip file from FTP server, decompress it to get the files inside, and land those files into Azure Data Lake Store. You define an input FTP dataset with the compression type JSON property as ZipDeflate."
我试过这个,在我的 ADLS 上我得到了压缩文件。我尝试放置文件属性,定义定界符和内容,并且仍然在数据湖存储中获取压缩文件。
我认为这是我定义输出数据集的方式。如果输入数据集是来自 FTP.
的 .zip 文件,是否有一些规则如何定义输出数据集
您很可能也将输出数据集的压缩定义为 ZipDeflate,这就是您在 ADLS 上获取压缩文件的原因。尝试更改输出数据集(与在 ADLS 中配置路径的位置相同),使其不使用压缩。您应该在您的副本 activity 中配置输入数据集 ftp,压缩和输出数据集,您在其中配置湖的大部分内容,不压缩。
通过这种方式,您告诉数据工厂获取压缩文件,并将其解压缩保存在 ADLS 上。
希望对您有所帮助!
我有一个问题。我的 FTP 位置有一些 .zip 文件,我想解压缩并将它们复制到 ADLS。在文档中对此有明确的解释:
"Read .zip file from FTP server, decompress it to get the files inside, and land those files into Azure Data Lake Store. You define an input FTP dataset with the compression type JSON property as ZipDeflate."
我试过这个,在我的 ADLS 上我得到了压缩文件。我尝试放置文件属性,定义定界符和内容,并且仍然在数据湖存储中获取压缩文件。 我认为这是我定义输出数据集的方式。如果输入数据集是来自 FTP.
的 .zip 文件,是否有一些规则如何定义输出数据集您很可能也将输出数据集的压缩定义为 ZipDeflate,这就是您在 ADLS 上获取压缩文件的原因。尝试更改输出数据集(与在 ADLS 中配置路径的位置相同),使其不使用压缩。您应该在您的副本 activity 中配置输入数据集 ftp,压缩和输出数据集,您在其中配置湖的大部分内容,不压缩。
通过这种方式,您告诉数据工厂获取压缩文件,并将其解压缩保存在 ADLS 上。
希望对您有所帮助!