Pentaho DI "variables" 和 "fields" 有什么区别?
What is difference between Pentaho DI "variables" and "fields"?
找不到太多关于此的信息。我可以看到字段在转换中每行可以有多个副本。但什么是变量?它们在转换产生的所有行中是否唯一?但是,顾名思义,变量是要变化的。
字段和变量到底有什么区别?
谁能赐教
谢谢
PDI 转换处理通过所有步骤的行流。这些行由多个字段组成,步骤可以对其进行操作、转换它们、过滤它们、排序等。
变量更像是配置帮助,在转换中具有单一值。请务必记住,它们可以 NOT 成为 set/changed 并在同一转换中使用,因为所有步骤都是并行执行的!
例子
在您的转换中,您有一个名为 "last_staging_run" 的 变量 ,其值为“2017/01/19 05:00:00”。这个已经从parent job传递给transformation了。
然后在 Table 输入中使用它:
SELECT id, product_id, 价格, 数量
从销售
其中 purchase_date > ${last_staging_run}
这将为您提供自上次暂存 运行 以来的新行,其中包含 字段 id、product_id、价格和编号。然后,您可以通过其他步骤查找产品名称或过滤价格为零的产品,然后再次将其存储在 table 中。
找不到太多关于此的信息。我可以看到字段在转换中每行可以有多个副本。但什么是变量?它们在转换产生的所有行中是否唯一?但是,顾名思义,变量是要变化的。
字段和变量到底有什么区别?
谁能赐教
谢谢
PDI 转换处理通过所有步骤的行流。这些行由多个字段组成,步骤可以对其进行操作、转换它们、过滤它们、排序等。
变量更像是配置帮助,在转换中具有单一值。请务必记住,它们可以 NOT 成为 set/changed 并在同一转换中使用,因为所有步骤都是并行执行的!
例子
在您的转换中,您有一个名为 "last_staging_run" 的 变量 ,其值为“2017/01/19 05:00:00”。这个已经从parent job传递给transformation了。
然后在 Table 输入中使用它: SELECT id, product_id, 价格, 数量 从销售 其中 purchase_date > ${last_staging_run}
这将为您提供自上次暂存 运行 以来的新行,其中包含 字段 id、product_id、价格和编号。然后,您可以通过其他步骤查找产品名称或过滤价格为零的产品,然后再次将其存储在 table 中。