Pentaho DI (Kettle) 基于 csv 文件头的 select 流的最佳方式?
Pentaho DI (Kettle) best way to select flow based on csv file header?
我正在使用 Pentaho DI(水壶),但不确定执行以下操作的最佳方法是什么:
从下载的 csv 文件中,检查列是否存在,并根据该 select 正确的下一步。
有 3 个可能的选项。
谢谢,
艾萨克
您没有提到可能的选项,所以我将只向您提供一个草图,展示如何检查文件中是否存在列。
为此,您需要一个 CSV file input
步骤和 Metadata structure of stream
步骤来读取传入流的元数据。
对于包含名为 col1
、col2
和 col3
的 3 列的示例 csv 文件,您会在单独的行中获取每一列,并将其名称作为 [=15= 中的值] 元数据 步骤中的列。
然后根据您的需要,您可以使用 Filter Rows
或 Switch / Case
等步骤进行进一步处理。
我正在使用 Pentaho DI(水壶),但不确定执行以下操作的最佳方法是什么: 从下载的 csv 文件中,检查列是否存在,并根据该 select 正确的下一步。 有 3 个可能的选项。
谢谢, 艾萨克
您没有提到可能的选项,所以我将只向您提供一个草图,展示如何检查文件中是否存在列。
为此,您需要一个 CSV file input
步骤和 Metadata structure of stream
步骤来读取传入流的元数据。
对于包含名为 col1
、col2
和 col3
的 3 列的示例 csv 文件,您会在单独的行中获取每一列,并将其名称作为 [=15= 中的值] 元数据 步骤中的列。
然后根据您的需要,您可以使用 Filter Rows
或 Switch / Case
等步骤进行进一步处理。