Pentaho DI (Kettle) 基于 csv 文件头的 select 流的最佳方式？

Pentaho DI (Kettle) best way to select flow based on csv file header?

我正在使用 Pentaho DI（水壶），但不确定执行以下操作的最佳方法是什么：从下载的 csv 文件中，检查列是否存在，并根据该 select 正确的下一步。有 3 个可能的选项。

谢谢，艾萨克

您没有提到可能的选项，所以我将只向您提供一个草图，展示如何检查文件中是否存在列。

为此，您需要一个 CSV file input 步骤和 Metadata structure of stream 步骤来读取传入流的元数据。

对于包含名为 col1、col2 和 col3 的 3 列的示例 csv 文件，您会在单独的行中获取每一列，并将其名称作为 [=15= 中的值] 元数据 步骤中的列。

然后根据您的需要，您可以使用 Filter Rows 或 Switch / Case 等步骤进行进一步处理。