ADF - 如何将具有多个 Sheet 的 Excel Sheet 复制到单独的 .csv 文件中

ADF - How to copy an Excel Sheet with Multiple Sheets into separate .csv files

我目前有一个 Excel 文件,其中包含多个作品sheet(超过 11 个)。此 Excel 文件当前位于远程文件服务器中。我正在尝试使用 Azure Data FactoryV2 复制 Excel 文件并将每个作品 sheet 拆分为 ADLS Gen2 文件夹中自己的 .csv 文件。这样做的原因是因为并非每个选项卡都具有相同的架构,我以后只想 select 有效的。

我目前有一个 ADF 数据集正确指向 Excel 数据集,并使用 @dataset.SheetName 为 sheet 名称创建了一个参数。我不确定下一步该去哪里。创建新管道后,我尝试在 ForEach activity 中嵌套一个 Copy Activity,但是,它要求输入 SheetName 值。

我如何构建此管道以获取 Excel 文件中存在的作品 sheet 的名称,然后为每个 sheet 迭代一个副本 activity ?我不能假设我会知道 sheet 个名字或会有多少个 sheet。如果可能,我宁愿避免为 Excel 文件创建多个数据集。

如有任何见解,我们将不胜感激。

在 ADF 中获取 Excel sheet 名称列表尚不支持,您可以投票 here

  1. 因此您可以使用 azure funcion 获取 sheet 个名称。
import pandas

xl = pandas.ExcelFile('data.xlsx')

# see all sheet names
print(xl.sheet_names )

  1. 然后在ADF中使用一个Array类型的变量来获取并遍历这个数组。