读取 adf 管道中的特定文件名

Question

我有要求说，blob 存储有多个名称为 file_1.csv、file_2.csv、file_3.csv、file_4.csv、file_5.csv、[= 的文件20=],file_7.csv。从这些我必须只读取从 5 到 7 的文件名。

我们如何在 ADF/Synapse 管道中实现这一目标。

Answer 1

我已经在我的实验室重现了，请看下面的重现步骤。

ADF:

（在源数据集中参数化源文件名，在数据集参数中传递'*'即可获取所有文件。）

获取元数据输出：

将获取元数据输出子项传递给 ForEach activity.

@activity('Get Metadata1').output.childItems

@and(greater(int(substring(item().name,4,1)),4),lessOrEquals(int(substring(item().name,4,1)),7))

来源：

接收器：

输出：

Answer 2

您始终可以按照@NiharikaMoola-MT 的建议进行操作。但由于您已经知道文件的范围 (5-7)，我建议

@concat('file',item(),'.csv')

Answer 3

我使用过滤器 activity 和 endsWith 函数采取了稍微不同的方法：

过滤器表达式为：

@or(or(endsWith(item().name, '_5.csv'),endsWith(item().name, '_6.csv')),endsWith(item().name, '_7.csv'))

方法略有不同，结果相似，这取决于您的需要。

read specific files names in adf pipeline