Talend:如何读取 .txt/.csv 文件的前两行,并从以 "Generated:" 开头的行中获取日期
Talend: how to read the 2 first lines of a .txt/.csv file, and get the date from the line beginning with "Generated:"
我使用 tFileInputDelimited 组件以通常的方式从 .csv 文件读取数据,我读取并输出到我的本地 PostgreSQL 数据库。
但我的问题是我需要从文件的前两行获取日期。
前 2 行不是列分隔...而只是 2 行 header.
我需要知道要使用什么组件以及如何将它们设置为:
- 阅读前两行
- 获取以“Generated:”开头的行:
- 获取“:”之后的日期
示例header,前两行:
Report Title:this_is_the_title
Generated: Nov-27-2020, 14:03:01 CET
是否可以使用 Talend 做到这一点,哪些组件最好?
我还不知道所有的组件,并尝试使用 tFileInputDelimited,但它似乎无法使用它。
==== 编辑 ====
我正在尝试使用 tFileInputRegex 来实现,这可能有效...
将此模式用于输入文件:
在tFileInputDelimited
中,指定“@”作为字段分隔符(将整行设置为1条记录)并将限制设置为2以仅读取前2行:
在tFilterRow
中,点击高级模式,添加此代码以仅保留“生成”行:
在 tJavaRow
中添加此代码以提取日期:
output_row.line = input_row.line.substring("Generated:".length() + 1);
我使用 tFileInputDelimited 组件以通常的方式从 .csv 文件读取数据,我读取并输出到我的本地 PostgreSQL 数据库。
但我的问题是我需要从文件的前两行获取日期。 前 2 行不是列分隔...而只是 2 行 header.
我需要知道要使用什么组件以及如何将它们设置为:
- 阅读前两行
- 获取以“Generated:”开头的行:
- 获取“:”之后的日期
示例header,前两行:
Report Title:this_is_the_title
Generated: Nov-27-2020, 14:03:01 CET
是否可以使用 Talend 做到这一点,哪些组件最好? 我还不知道所有的组件,并尝试使用 tFileInputDelimited,但它似乎无法使用它。
==== 编辑 ==== 我正在尝试使用 tFileInputRegex 来实现,这可能有效...
将此模式用于输入文件:
在tFileInputDelimited
中,指定“@”作为字段分隔符(将整行设置为1条记录)并将限制设置为2以仅读取前2行:
在tFilterRow
中,点击高级模式,添加此代码以仅保留“生成”行:
在 tJavaRow
中添加此代码以提取日期:
output_row.line = input_row.line.substring("Generated:".length() + 1);