如何使用 Pentaho 验证一个 csv 数据与另一个 csv 文件的比较?

How to validate one csv data compare with another csv file using Pentaho?

我有两个 csv 文件。 在一个文件中,我有 10 行,在另一个数据列表中。 我想要做的是,检查第一个 csv 文件的数据并将其与另一个 csv 文件进行比较。 那么我该如何实现呢? 任何帮助都会很棒。

您要查找的步骤名为 Stream Lookup 步骤。`

阅读您的 CSV 和参考文件,并将两个流放入 Stream Lookup 中并按如下方式设置: a) Lookup step = 读取引用的步骤 b) 键/字段 = CSV 的字段名称,其中包含能够识别参考文件中的行的任何字段。 c) Keys / Lookup field = 参考文件中的字段名称。 d) Field to retrieve = 对return 的引用中的字段名称(可以是标识符或你需要的任何其他字段) e) 要检索的字段/类型 = 不要忘记!

这样,您将从参考文件中添加一列到 CSV 文件的 10 行中。然后,您可以通过测试新列的值是否不为空来过滤掉查找未找到的行。

由于在 PDI 中,上述所有设置都由下拉列表引导,您应该需要 2 分钟。