Pentaho DI (Kettle) 基于 csv 文件头的 select 流的最佳方式?

Pentaho DI (Kettle) best way to select flow based on csv file header?

我正在使用 Pentaho DI(水壶),但不确定执行以下操作的最佳方法是什么: 从下载的 csv 文件中,检查列是否存在,并根据该 select 正确的下一步。 有 3 个可能的选项。

谢谢, 艾萨克

您没有提到可能的选项,所以我将只向您提供一个草图,展示如何检查文件中是否存在列。

为此,您需要一个 CSV file input 步骤和 Metadata structure of stream 步骤来读取传入流的元数据。

对于包含名为 col1col2col3 的 3 列的示例 csv 文件,您会在单独的行中获取每一列,并将其名称作为 [=15= 中的值] 元数据 步骤中的列。

然后根据您的需要,您可以使用 Filter RowsSwitch / Case 等步骤进行进一步处理。