Pentaho Data Integration 中的订单步骤指标

Order step metrics in Pentaho Data Integration

我正在 Kettle 中进行相当长的转换,我在流程的中间放置了一些步骤。 所以现在我的步数指标都乱七八糟,很难阅读。 有什么办法可以让我再次按顺序(按照流动方向)排序吗?

如果您在 "Step metrics" 选项卡中单击 #,它将按顺序对步骤进行排序。 "Metrics" 选项卡中的可视化也将进行排序。

步骤按插入顺序存储。步骤指标网格允许通过单击 header 列以不同的顺序显示步骤,但由于可以对转换图进行网格划分,因此通常无法按数据流的顺序对步骤进行排序。无论如何,通过分析跃点只能对图表中的一条路径进行排序。

您可以做的是更改每个步骤的名称并在其前面添加一个数字。然后按名称排序。

无聊,我知道,但这就是我们所拥有的...

不幸的是,分配步数不是一个选项。也许它因版本而异,但在 8.3 中,步骤指标 # 列分配似乎在某种程度上基于流程中步骤的顺序(当然,当流程分支时会分解),而不是添加步骤时。它确实敲响了警钟,它是基于在过去的版本中添加该步骤的时间。

同样遗憾的是,按步骤名称排序区分大小写 - 因此以“a”开头的步骤排在以“Z”开头的步骤之后。也许有一种方法可以将这种行为转化为命名策略,实际上利用它来获得一些好处,但我还没有找到。

所以我倾向于同意@recacon - 为步骤名称使用数字前缀,然后按步骤名称对执行指标进行排序似乎是最佳选择。我还没有做太多这方面的工作,因为没有团队标准就不太可能维护它。

在我做过的几次中,我使用了一个三位数的数字前缀,其中值在流程开始时最低,并随着路径的深入而增加。为了在以后添加步骤时减少对 re-sequencing 的需求,我开始从一个步骤到下一个步骤递增 10,然后在稍后拆分啤酒花时使用一个数字。

我还会为流程中的分支增加 100 的数字,或者如果有用于特定目的的重要逻辑部分。