是否有根据 Azure 映射数据流中的连续性对中断序列进行分组的规定

Is there a provision to group a breaking sequence based on its continuity in Azure Mapping dataflow

我想使用 Azure ADF 映射数据流根据连续性对中断序列进行分组。

以下是 blob 文件示例:

如上所示,有一个主键列和一个包含中断序列的列,我想创建第三列(预期输出)来对序列进行分组。

因为 1,2,3 是第一个序列,它的值为 1,而 9,10,11,12 是下一个序列,其值为 2,依此类推。

使用Windows 转换将当前行与预览行进行比较。然后,如果存在间隙,即使用第二个 Window 转换来增加计数器,即当前序列 - 先前序列 > 1.

如果您将名为 source1 的源添加到新数据流,您可以使用脚本按钮粘贴此代码以显示后面的脚本。添加一个 new-line 并在最后输入 copy/paste:

source1 derive(dummy = 1) ~> CreateDummyValue
CreateDummyValue window(over(dummy),
asc(year, true),
startRowOffset: -1L,
endRowOffset: 0L,
year2 = first(year)) ~> AddPreviousValue
AddPreviousValue window(over(dummy),
asc(year, true),
column1 = sum(iif(abs(year-year2)<=1,0,1))) ~> CompareAndBucket

我使用的是电影数据中我自己的列名,因此请将列名替换为您的数据列。对你来说,movie 应该替换为 Sequences,Expected Output 是我的“Column1”。