如何使用 Azure Datafactory 将 CSV 转换为 ORC 格式

How to convert CSV to ORC format using Azure Datafactory

我正在使用 azure datafactory 将逗号分隔的分区数据文件复制到 ADLS 中。

要求是将逗号分隔的文件复制为带有 SNAPPY 压缩的 ORC 格式。

是否可以使用 ADF 实现此目的?如果是,那么你能帮帮我吗?

不幸的是,数据工厂可以从 ZLIB 和 SNAPPY 读取,但只能 写入 ZLIB,这是 orc 文件的默认设置格式。

更多信息在这里:https://docs.microsoft.com/en-us/azure/data-factory/supported-file-formats-and-compression-codecs#orc-format

希望对您有所帮助!!