在天蓝色数据流中使用先前的非空值自动填充列中的空行?

Autofill empty rows in a column with previous nonEmpty value in azure dataflow?

类似的事情在 Excel 中是可能的,那么在 Azure 数据流中可以做到吗?

示例:

Type Comment Value
A value2 1
A value5
B value8
A value2
A value5 2
B value8
C value2 3
A value5
B value8 4

决赛:

Type Comment Value
A value2 1
A value5 1
B value8 1
A value2 1
A value5 2
B value8 2
C value2 3
A value5 3
B value8 4

使用数据流在 ADF 中向下填充:https://docs.microsoft.com/en-us/azure/data-factory/data-flow-script#fill-down

您可以在数据流 windows 转换中实现这一点。 Over 需要分区键,windows 设置和 Windows使用表达式last()获取上一行Not NULL值当NULL时填写当前值

如果您没有分区键或排序键,我们可以在数据流中生成它并将结果连接到 windows 转换。

预先开发的代码片段也可用 here。此代码创建一个

  1. Derived column 转换为“dummy=1”
  2. Surrogate key 起始值从 1 开始的转换。
  3. Windows transformation 填写值。

Note: Source should be added in the dataflow before adding this code snippet.

  1. 添加来源

  1. 在源代码后添加文档中的代码片段。

  1. 此代码创建派生列、surrogateKey、windows 转换。

  1. 编辑Windows设置中的Windows列以添加需要填写的列。

    coalesce(Value, last(Value, true()))

  1. 它用以前的非 NULL 值填充 NULL 值

  1. sink 中,删除映射中不需要的列以获得所需的输出。