Talend:如何读取 .txt/.csv 文件的前两行,并从以 "Generated:" 开头的行中获取日期

Talend: how to read the 2 first lines of a .txt/.csv file, and get the date from the line beginning with "Generated:"

我使用 tFileInputDelimited 组件以通常的方式从 .csv 文件读取数据,我读取并输出到我的本地 PostgreSQL 数据库。

但我的问题是我需要从文件的前两行获取日期。 前 2 行不是列分隔...而只是 2 行 header.

我需要知道要使用什么组件以及如何将它们设置为:

示例header,前两行:

Report Title:this_is_the_title
Generated: Nov-27-2020, 14:03:01 CET

是否可以使用 Talend 做到这一点,哪些组件最好? 我还不知道所有的组件,并尝试使用 tFileInputDelimited,但它似乎无法使用它。

==== 编辑 ==== 我正在尝试使用 tFileInputRegex 来实现,这可能有效...

将此模式用于输入文件:

tFileInputDelimited中,指定“@”作为字段分隔符(将整行设置为1条记录)并将限制设置为2以仅读取前2行:

tFilterRow中,点击高级模式,添加此代码以仅保留“生成”行:

tJavaRow 中添加此代码以提取日期:

output_row.line = input_row.line.substring("Generated:".length() + 1);