Pentaho DI(Kettle)中将 csv 转换为一对多关系的最佳实践是什么

What is the best practice in Pentaho DI(Kettle) for converting a csv into a One to Many Relationship

我是 Pentaho DI(以前称为 Kettle)的新手,我的任务是获取 CSV 数据并在 RDBMS 中填充处于 "One to Many" 关系中的表。

以下是 CSV 数据结构的示例:

OrderID,CustomerName, Date,Total Cost,LineItemNumber, LineItemDesc,LineItemQty,LineItemCost
101655,Mary Smith,2016-02-08,6.25,1|2|3|4,Lettuce|Tomatoes|Green Onions|Cucumbers,1|2|4|2,1.00|2.50|0.75|2.00

注意:多个值由竖线(|)分隔

我需要将其转换成下表:

我一直在研究几种实现此目的的方法,但不想因为我的经验不足而错过一些简单的东西。任何建议将不胜感激。

我想出了一个解决方案,但它看起来非常复杂。

尝试在 PDI 中使用拆分字段到行 STEP。将 Delimiter 作为 |(管道)并给出要拆分的 column/field。

查看 Pentaho wiki 了解更多信息。

希望这对您有所帮助:)