如果在 Pentaho 的数据库中不可用,如何实现添加?

How to implement an add if not available in the database in Pentaho?

我如何实施,或者我使用什么步骤来创建比较 table 和列表的转换。例如数据库 table name Schools 和一个包含大量学校名称列表的 excel 文件。

如果 excel 中的条目未在数据库中看到,则应将其添加到数据库 table。

我不太确定是否可以使用数据库查找步骤,它不会告诉查找是否失败。插入更新步骤似乎也不是解决方案,因为它需要一些 ID 值,但 excel 文件

中的学校列表中没有 ID

根据您提供的信息,使用 table 插入步骤进行简单连接即可完成您的任务。您可以使用 Merge rows 步骤来比较数据流(excel 和数据库)。合并行步骤使用键比较两个流并添加一个标志字段,将行标记为 new, identical, changed, deleted。在您的情况下,您希望使用 table 插入步骤插入所有标记为新的行。

请查看以下链接以获取更多参考。

Merge rows, Synchronize after merge

这对我有用,

excel file --> 
select values (to delete unnecessary fields) -->
database lookup (this will create a new field, and will set null if not found)     -->
filter rows (get the fields with null output from lookup) -->
table output (insert the filtered records)