Pentaho PDI (Kettle/spoon) 文本文件的元数据注入
Pentaho PDI (Kettle/spoon) Meta Data Injection for text files
我对使用 Pentaho PDI 导入固定宽度文件很感兴趣。
我已经使用它的主要 GUI 工具在 Spoon 中以图形方式设置宽度。
但是如果字段数很大,比如几百个字段,就很容易出错,也很耗时。
在其他 ETL 工具中,我能够导入描述列属性(例如名称、大小等)的元文件
我看到 pentaho 有这个叫做元数据注入的东西,但是根本没有太多教程,只有几个,而且用例真的很复杂并且使用 Javascript 编写脚本或者他们以非常抽象的方式描述它。
所以希望熟悉的人可以解释我的固定宽度文件的特殊用例。
是的,您可以使用元数据注入步骤来应用动态属性,例如文件名、字段、长度数据类型等。
为此,
- 您需要使用文件输入步骤创建一个转换。
- 使用元数据注入步骤和位置创建另一个转换
您可以添加在步骤 1 中创建的转换。
- 在元数据注入步骤的注入元数据选项卡中,您可以从输入步骤添加长度。
我对使用 Pentaho PDI 导入固定宽度文件很感兴趣。 我已经使用它的主要 GUI 工具在 Spoon 中以图形方式设置宽度。 但是如果字段数很大,比如几百个字段,就很容易出错,也很耗时。 在其他 ETL 工具中,我能够导入描述列属性(例如名称、大小等)的元文件
我看到 pentaho 有这个叫做元数据注入的东西,但是根本没有太多教程,只有几个,而且用例真的很复杂并且使用 Javascript 编写脚本或者他们以非常抽象的方式描述它。
所以希望熟悉的人可以解释我的固定宽度文件的特殊用例。
是的,您可以使用元数据注入步骤来应用动态属性,例如文件名、字段、长度数据类型等。
为此,
- 您需要使用文件输入步骤创建一个转换。
- 使用元数据注入步骤和位置创建另一个转换 您可以添加在步骤 1 中创建的转换。
- 在元数据注入步骤的注入元数据选项卡中,您可以从输入步骤添加长度。