Azure 数据流 - 可以根据 non-header 行的值设置列名吗
Azure Data Flows - can column names be set based on a non-header row's values
如果我有一个输入文本文件但不导入架构,因为 header 行不在第一行中,是否有可能以某种方式从文件中的某处检测架构其他比 header 行,即没有 header 行但可以用作 header 文件下方的行的文件:
<No
Header
Row>
123
01/01/2020
NULL
345
01/01/2021
01/01/2022
456
01/01/2019
NULL
AccNo
StartDate
EndDate
678
01/01/2021
01/02/2022
在进一步转换以匹配输出模式后,可以转换为并沉入此模式:
AccNo
StartDate
EndDate
DateofDeath
123
01/01/2020
NULL
NULL
345
01/01/2021
01/01/2022
NULL
456
01/01/2019
NULL
NULL
678
01/01/2021
01/02/2022
NULL
我无法定义输入模式,因为它需要灵活以允许更改,并且多个文件(具有不同的列)将使用相同的过程。我会知道输出模式。
您可以利用复制 activity 源设置中可用的 skipLineCount
属性。
Select firstRowAsHeader
属性 在数据集连接设置中
复制activity源设置,设置skipLineCount = 4
这将跳过前4行
在映射部分导入模式。
可以使用上面的方法,但是你不会得到前4条记录。
你也可以参考这个article
如果我有一个输入文本文件但不导入架构,因为 header 行不在第一行中,是否有可能以某种方式从文件中的某处检测架构其他比 header 行,即没有 header 行但可以用作 header 文件下方的行的文件:
<No | Header | Row> |
---|---|---|
123 | 01/01/2020 | NULL |
345 | 01/01/2021 | 01/01/2022 |
456 | 01/01/2019 | NULL |
AccNo | StartDate | EndDate |
678 | 01/01/2021 | 01/02/2022 |
在进一步转换以匹配输出模式后,可以转换为并沉入此模式:
AccNo | StartDate | EndDate | DateofDeath |
---|---|---|---|
123 | 01/01/2020 | NULL | NULL |
345 | 01/01/2021 | 01/01/2022 | NULL |
456 | 01/01/2019 | NULL | NULL |
678 | 01/01/2021 | 01/02/2022 | NULL |
我无法定义输入模式,因为它需要灵活以允许更改,并且多个文件(具有不同的列)将使用相同的过程。我会知道输出模式。
您可以利用复制 activity 源设置中可用的 skipLineCount
属性。
Select
firstRowAsHeader
属性 在数据集连接设置中复制activity源设置,设置
skipLineCount = 4
这将跳过前4行在映射部分导入模式。
可以使用上面的方法,但是你不会得到前4条记录。
你也可以参考这个article