在 Azure 数据工厂中,是否可以在不使用数据流的情况下控制大量输出文件的文件名?
In Azure data factory, is it possible to control the filenames of numerous output files without using a data flow?
例如,我可能会在数据工厂中使用副本 activity 将 1000 万条记录的客户 table 复制到 Azure 数据湖中,并在中使用 'dynamic range' 的分区选项源选项。我的理解是,这将导致数据工厂将数据拆分为湖中的多个文件。
使用这种方法,我如何为湖中的输出文件强制命名约定?例如所以每个文件名都以 'cust_' 开头,这意味着文件将被称为 cust_1、cust_2、cust_3、cust_4 等
我的理解是'dynamic range'的分区选项是用来将一个文件分割成多个文件,然后进行异步复制。这是一个提高复制速度的多线程操作。是Copy activity performance optimization features。我想这不是你想要的文件分割。
Select 'None' 在源设置。
我们可以在接收器设置中设置'File extension'、'Max rows per file'和'File name prefix'。
在我这边,ADF会自动拆分成多个文件,每个文件包含50行记录。
例如,我可能会在数据工厂中使用副本 activity 将 1000 万条记录的客户 table 复制到 Azure 数据湖中,并在中使用 'dynamic range' 的分区选项源选项。我的理解是,这将导致数据工厂将数据拆分为湖中的多个文件。
使用这种方法,我如何为湖中的输出文件强制命名约定?例如所以每个文件名都以 'cust_' 开头,这意味着文件将被称为 cust_1、cust_2、cust_3、cust_4 等
我的理解是'dynamic range'的分区选项是用来将一个文件分割成多个文件,然后进行异步复制。这是一个提高复制速度的多线程操作。是Copy activity performance optimization features。我想这不是你想要的文件分割。
Select 'None' 在源设置。
我们可以在接收器设置中设置'File extension'、'Max rows per file'和'File name prefix'。
在我这边,ADF会自动拆分成多个文件,每个文件包含50行记录。