Azure 数据流 - 可以根据 non-header 行的值设置列名吗

Azure Data Flows - can column names be set based on a non-header row's values

如果我有一个输入文本文件但不导入架构,因为 header 行不在第一行中,是否有可能以某种方式从文件中的某处检测架构其他比 header 行,即没有 header 行但可以用作 header 文件下方的行的文件:

<No Header Row>
123 01/01/2020 NULL
345 01/01/2021 01/01/2022
456 01/01/2019 NULL
AccNo StartDate EndDate
678 01/01/2021 01/02/2022

在进一步转换以匹配输出模式后,可以转换为并沉入此模式:

AccNo StartDate EndDate DateofDeath
123 01/01/2020 NULL NULL
345 01/01/2021 01/01/2022 NULL
456 01/01/2019 NULL NULL
678 01/01/2021 01/02/2022 NULL

我无法定义输入模式,因为它需要灵活以允许更改,并且多个文件(具有不同的列)将使用相同的过程。我会知道输出模式。

您可以利用复制 activity 源设置中可用的 skipLineCount 属性。

  1. Select firstRowAsHeader 属性 在数据集连接设置中

  2. 复制activity源设置,设置skipLineCount = 4这将跳过前4行

  3. 在映射部分导入模式。

可以使用上面的方法,但是你不会得到前4条记录。

你也可以参考这个article