Talend 导入、转换原始文件并导出为 CSV

Talend import, transform a raw file and export to CSV

我的数据包含 600 万行。没有文件扩展名。想通过添加 "UPC" 列将其导出到 csv,这是 4 个字段的组合。 输入格式:

the raw file

需要 CSV 格式的输出

transformed raw file

UPC = SY + GE + VEND + ITEM

用 Excel 打开它,但由于它超过 600 万行,它被截断为 100 万行。 我对 talend 的模式有疑问,因为没有定界符。

首先手动创建一个元数据列(如果你导入文件,因为它是一个巨大的文件 talend 会被挂起)。因此,在元数据中创建列名(验证第一个快照)。完成后,将元数据拖动为 tFileInputDelimited 并确保提供分隔符 space(验证第二张快照)。在 tmap 中创建新端口并根据需要连接列 SY + GE + VEND + ITEM 并将其传递给 tFileOutputDelimited,您应该在其中提供分隔符 , 。如果您遇到任何问题,请告诉我。

谢谢