如何拆分逗号分隔的文本文件而不是一行,而是多行文件?

How do I split comma separrated text file not for one line, but for a several line files?

我是 nifi 的新手,我正在学习 SplitText 处理器。

情况是这样的。我有逗号分隔的 txt 文件,如下所示:

KeyWord, SomeInformation   <---1st line is schema.

KeyWord1, "information"

KeyWord2, "information"

KeyWord1, "another information"

KeyWord2, "another information"

 

and so on.

所以问题是如何根据关键字将这个文件拆分成几个文件?所以 KeyWord1 的每一行都转到一个文件,KeyWord2 的每一行都转到另一个文件等等?

使用PartitionRecord并添加一个名为keyword的user-defined 属性(名称是任意的,但将是添加到每个传出流文件的属性的名称)值 /KeyWord。它将创建 FlowFiles,其中一个包含 Keyword 字段为 KeyWord1 的所有行,另一个为 KeyWord2,依此类推。