Kettle Pentaho按最新数据备份改造
Kettle Pentaho backup transformation by latest data
我需要使用 kettle/spoon 转换将一些数据从一个数据库同步到另一个数据库。逻辑是我需要 select 目标数据库中存在的最新日期数据。然后 select 来自上次日期的源数据库。我需要什么转换元素来做到这一点?
谢谢。
可以有多种解法:
如果您在源和目标 table 中都有时间戳列,那么您可以采取两个 table 输入步骤。在第一个中,仅 select 最大最后更新时间戳,将其用作下一个 table 输入中的变量,将其作为源数据的过滤器。你可以这样做:
如果你只是想在目标table中更新新数据并且你不太关心时间戳,我建议你使用insert/update步骤用于输出。它会将所有数据带到流中,如果找到匹配项,则不会插入任何内容。如果找不到匹配项,它将插入新行。如果它在目标 table 中发现对现有行的任何修改,它将相应地更新它。
我需要使用 kettle/spoon 转换将一些数据从一个数据库同步到另一个数据库。逻辑是我需要 select 目标数据库中存在的最新日期数据。然后 select 来自上次日期的源数据库。我需要什么转换元素来做到这一点?
谢谢。
可以有多种解法:
如果您在源和目标 table 中都有时间戳列,那么您可以采取两个 table 输入步骤。在第一个中,仅 select 最大最后更新时间戳,将其用作下一个 table 输入中的变量,将其作为源数据的过滤器。你可以这样做:
如果你只是想在目标table中更新新数据并且你不太关心时间戳,我建议你使用insert/update步骤用于输出。它会将所有数据带到流中,如果找到匹配项,则不会插入任何内容。如果找不到匹配项,它将插入新行。如果它在目标 table 中发现对现有行的任何修改,它将相应地更新它。