使用 Talend 从字符串中提取日期

Extract date from a string using Talend

我每天都会收到 CSV 文件,其中包含 header "AD PERFORMANCE REPORT (Jan 24, 2016)"。 我想从中提取日期并使用 Talend 将其用作日期列。 我怎样才能做到这一点?

要将特定列的格式更改为其他格式,您可以使用 "tExtractRegexFields" 和您的正则表达式来获取您的日期。

tFileInputDelimited --> tExtractRegexFields --> tMap --> tFileOutputDelimited

在使用 'tExtractRegexFields' 组件获取字符串中的日期后,您可以在输出架构中指定日期类型,如下所示:

您的日期模式(2016 年 1 月 24 日)是“MMM d, yyyy

link 对于 Talend 上的 tExtractRegexField 是 here

link 用于测试正则表达式的好网站是 here

link Jav 中的日期模式是 here

我在 tExtractRegexFields 中使用了以下正则表达式

"\(([^)]*)\)"