Pentaho 数据集成:组合 Lookup/Update:并非所有行都已插入
Pentaho Data Integration : Combination Lookup/Update : Not all rows inserted
我的问题很简单,我想知道为什么我的所有行都没有插入到我的 PostgresDB。因为我需要插入所有行。该步骤(组合 L/U)成功并带有绿色勾号。如果不成功,该步骤上不应该有红色勾号吗?这是我转换的步骤指标:
您似乎在填写一个事实 table,而不是一个维度。 Table 输出步骤是正确的选择,因为您不需要再查找任何内容,您已经在前面的步骤中完成了。
关于您的数据和事实的说明 table:
根据问题,您有一些重复的行(组合查找更新中消失的行)。请仔细检查它们是否根据源数据应该存在以及它们是否符合您的想法"granularity"。
例如:
- 如果事实 table 每次销售包含一条记录,那么两行具有相同的时间、办公室等,甚至相同的金额就完全没问题了。不过,您的 table 确实包含很多,几乎是 10%。
- 如果事实 table 包含每个办公室每天的销售额等。那么应该 NOT 是具有相同键甚至相同数量的两行。可能是 ETL 中的某些连接操作创建了重复项。
我的问题很简单,我想知道为什么我的所有行都没有插入到我的 PostgresDB。因为我需要插入所有行。该步骤(组合 L/U)成功并带有绿色勾号。如果不成功,该步骤上不应该有红色勾号吗?这是我转换的步骤指标:
您似乎在填写一个事实 table,而不是一个维度。 Table 输出步骤是正确的选择,因为您不需要再查找任何内容,您已经在前面的步骤中完成了。
关于您的数据和事实的说明 table:
根据问题,您有一些重复的行(组合查找更新中消失的行)。请仔细检查它们是否根据源数据应该存在以及它们是否符合您的想法"granularity"。
例如:
- 如果事实 table 每次销售包含一条记录,那么两行具有相同的时间、办公室等,甚至相同的金额就完全没问题了。不过,您的 table 确实包含很多,几乎是 10%。
- 如果事实 table 包含每个办公室每天的销售额等。那么应该 NOT 是具有相同键甚至相同数量的两行。可能是 ETL 中的某些连接操作创建了重复项。