如何拆分逗号分隔的文本文件而不是一行,而是多行文件?
How do I split comma separrated text file not for one line, but for a several line files?
我是 nifi 的新手,我正在学习 SplitText 处理器。
情况是这样的。我有逗号分隔的 txt 文件,如下所示:
KeyWord, SomeInformation <---1st line is schema.
KeyWord1, "information"
KeyWord2, "information"
KeyWord1, "another information"
KeyWord2, "another information"
and so on.
所以问题是如何根据关键字将这个文件拆分成几个文件?所以 KeyWord1 的每一行都转到一个文件,KeyWord2 的每一行都转到另一个文件等等?
使用PartitionRecord并添加一个名为keyword
的user-defined 属性(名称是任意的,但将是添加到每个传出流文件的属性的名称)值 /KeyWord
。它将创建 FlowFiles,其中一个包含 Keyword
字段为 KeyWord1
的所有行,另一个为 KeyWord2
,依此类推。
我是 nifi 的新手,我正在学习 SplitText 处理器。
情况是这样的。我有逗号分隔的 txt 文件,如下所示:
KeyWord, SomeInformation <---1st line is schema.
KeyWord1, "information"
KeyWord2, "information"
KeyWord1, "another information"
KeyWord2, "another information"
and so on.
所以问题是如何根据关键字将这个文件拆分成几个文件?所以 KeyWord1 的每一行都转到一个文件,KeyWord2 的每一行都转到另一个文件等等?
使用PartitionRecord并添加一个名为keyword
的user-defined 属性(名称是任意的,但将是添加到每个传出流文件的属性的名称)值 /KeyWord
。它将创建 FlowFiles,其中一个包含 Keyword
字段为 KeyWord1
的所有行,另一个为 KeyWord2
,依此类推。