Kettle 过滤输入 csv 的方法
Kettle ways to filter input csv
我是 kettle 的新手,我正在试验它提供的工具。我尝试使用 "Csv file input tool" 制作一个 csv 文件作为输入,并使用 "Text file output" 工具制作一个 csv 输出文件,我过滤了第一个文件中不需要的一些字段。我想更进一步,所以我将以我的 csv 为例:
Id|Col1 |Col2
1 | test1 | 1
2 | test1 | 1
3 | test2 | 1
3 | test2 | 2
我想以某种方式过滤我的 csv,以便在输出时获取 col1 的值,而在 col2 中获取多个值。在我的示例中,它只会是 "test2"。
我无法找到这个解决方案可能是因为我不熟悉这个工具..你们能给我一个提示并指导我找到解决方案吗?我可以走哪些路?
我想我找到了适合我问题的解决方案。
我添加了一个 "Group By tool",在其中我将 Col1 用于 groupBy,将 "count distinct" 作为 Col2 的函数。然后使用 "Filter rows count" 工具我得到不同的行 > 1 :) !
我是 kettle 的新手,我正在试验它提供的工具。我尝试使用 "Csv file input tool" 制作一个 csv 文件作为输入,并使用 "Text file output" 工具制作一个 csv 输出文件,我过滤了第一个文件中不需要的一些字段。我想更进一步,所以我将以我的 csv 为例:
Id|Col1 |Col2
1 | test1 | 1
2 | test1 | 1
3 | test2 | 1
3 | test2 | 2
我想以某种方式过滤我的 csv,以便在输出时获取 col1 的值,而在 col2 中获取多个值。在我的示例中,它只会是 "test2"。 我无法找到这个解决方案可能是因为我不熟悉这个工具..你们能给我一个提示并指导我找到解决方案吗?我可以走哪些路?
我想我找到了适合我问题的解决方案。 我添加了一个 "Group By tool",在其中我将 Col1 用于 groupBy,将 "count distinct" 作为 Col2 的函数。然后使用 "Filter rows count" 工具我得到不同的行 > 1 :) !