Pentaho PDI (Kettle/spoon) 文本文件的元数据注入

Pentaho PDI (Kettle/spoon) Meta Data Injection for text files

我对使用 Pentaho PDI 导入固定宽度文件很感兴趣。 我已经使用它的主要 GUI 工具在 Spoon 中以图形方式设置宽度。 但是如果字段数很大,比如几百个字段,就很容易出错,也很耗时。 在其他 ETL 工具中,我能够导入描述列属性(例如名称、大小等)的元文件

我看到 pentaho 有这个叫做元数据注入的东西,但是根本没有太多教程,只有几个,而且用例真的很复杂并且使用 Javascript 编写脚本或者他们以非常抽象的方式描述它。

所以希望熟悉的人可以解释我的固定宽度文件的特殊用例。

是的,您可以使用元数据注入步骤来应用动态属性,例如文件名、字段、长度数据类型等。

为此,

  1. 您需要使用文件输入步骤创建一个转换。
  2. 使用元数据注入步骤和位置创建另一个转换 您可以添加在步骤 1 中创建的转换。
  3. 在元数据注入步骤的注入元数据选项卡中,您可以从输入步骤添加长度。