Pentaho - PDI:获取流字段

Pentaho - PDI: get fields of stream

这里有一个非常简单的问题:例如,如果我读取一个 .csv 文件,我如何在运行时知道该文件有哪些列? 我想将该 .csv 文件转换为 JSON,但我不知道如何动态设置 JSON 输出步骤的字段,以包括该文件的所有行。你能帮我扩展知识吗?

提前致谢

这绝对是元数据注入的一个很好的用例。该步骤具体称为ETL Metadata Injection。您可能需要使用脚本步骤动态获取字段(有 Java、JavaScript 和 Python 脚本步骤可用,如果您是企业客户,还可以使用 R ).我认为没有内置步骤可以在运行时动态发现字段。

有了字段后,您可以使用元数据注入步骤将字段名称注入 CSV 输入或文本文件输入步骤,以及 JSON 输出步骤。

ETL Metadata Injection步骤的官方帮助文档如下:https://help.pentaho.com/Documentation/8.1/Products/Data_Integration/Transformation_Step_Reference/ETL_Metadata_Injection