用于导入多个 gzip 文件解压缩和创建计算字段的 Talend 工作流程

Talend workflow for importing multiple gzip file un-archiving and creating calculated field

我想 1) 从一个路径读取多个 gzip 文件,2) 解压缩和 3) 创建一个计算字段。到目前为止,我已经成功地完成了 1 和 2。对于 3,我认为 tMap 可以满足需要,但不知道为什么我无法将未归档组件与 tMap 连接。

编辑1: 不知道为什么 tdelemited 和 tMap 会显示错误信息?

下面是我收到的消息 2017 年 4 月 4 日 09:36 开始工作 Migration_1。

[statistics] connecting to socket on port 3336
[statistics] connected
[statistics] disconnected
Job Migration_1 ended at 09:36 04/04/2017. [exit code=0]

Edit2:我尝试了所有建议的步骤,但它没有给我所需的输出,令我惊讶的是,日志中没有错误消息来调试任何东西。

2017 年 4 月 4 日 12:36 开始工作 Migration_1。

[statistics] connecting to socket on port 3463
[statistics] connected
[statistics] disconnected
Job Migration_1 ended at 12:36 04/04/2017. [exit code=0]

tFileUnarchive 只会解压缩 zip 文件,但您仍然需要阅读这些 zip 中包含的文件。 tFileUnarchive 组件不提供读取部分

在tFileList-->tFileUnarchive 子作业之后,应该有一个文件读取子作业,例如:

tFileList--iterate-->tFileInput*-->tMap

tFileList 应设置为读取您提取 gzip 文件的存储库。