Azure 数据工厂:架构更改

Azure Data Factory: Schema Change

我有一个格式如下的 blob。第一行给出 header 详细信息,接下来的 2 行作为数据记录,最后一行作为尾部记录,其中包含数据记录计数。在记录文件时,我想将我的架构定义为单个字段,一旦我删除了尾部记录,我想将其转换为带有“|”的正确架构格式作为分隔符。你能告诉我如何实现这个吗?

DeptID|DeptNAme
1|A
2|B
2

提前致谢 库马尔

更新:

  1. 在前面step4提到SurrogateKey1activity后,我们可以用Selectactivity到select列DeptID|DeptNAme.

  2. 然后我们可以使用DerivedColumn1activity、表达式split({DeptID|DeptNAme},'|')[1]split({DeptID|DeptNAme},'|')[2]手动生成新列。

  3. 数据预览如下:


@Kumar G 我们可以在 ADF 中使用 data-flow 来实现。
例如,我创建了一个简单的测试。

  1. 我在 Azure Data Lake Gen2 中创建了一个 bolb,如下所示:

  2. 我创建了这个 blob 的数据源,select Pipe (|) 作为列分隔符 和 First row as header 架构如下:

  3. 我在ADF中创建了一个映射数据流,源数据预览如下:

  4. SurrogateKey1 中,键入 Row_No 作为键列,1 作为起始值。 数据预览如下:

  5. Conditional split1中,用Row_No < 3排除最后一行。

  6. Select1,不是selectRow_No列, 数据预览如下:

就这些了!