文本文件输入忽略制表符行

Text File Input ignore line of tabs

我在 Pentaho 有一份工作,其中有一个文本文件输入步骤,从一个制表符分隔的文本文件中读取。有时,当给出此文件时,他们的行中没有数据,但该行充满了制表符,因为他们在 excel 中复制了空行。下面是 Notepad++ 中 'empty' 行的屏幕截图。

有没有办法忽略这样的行?我尝试添加一个过滤器条目 Filter string = tabs number, Filter position = 0, Stop on filter = Y,正匹配 = Y。这个过滤器似乎没有任何效果。

当作业运行时,它将所有这些都视为 NULL 记录,这是有道理的,但这会导致下一个作业 Table 输出失败。如果没有办法通过文本文件输入来解决这个问题,是否有其他工作可以轻松清理坏记录?

您可以使用Filter Rows检查一个或多个字段值。

您的转换如下所示:文本输入 -> 过滤行 -> Table 输出。

当我进行更多调试时,我发现“过滤器”选项卡确实具有实现我所寻找的功能的逻辑。而不是过滤器字符串 = 选项卡数、过滤器位置 = 0、过滤器停止 = Y、正匹配 = Y 它需要正匹配 = N。此更改后它开始正常工作。