KNIME 比较数据集

KNIME comparing datasets

您能否回答:- 因为我们使用 KNIME 来 运行 我们按照我们的要求。在我们的工作流中,我们比较 2 个数据库中的客户数据,一个 oracle 和一个 Hive,然后我们想要报告有多少数据匹配,有多少不匹配。所以现在我们想根据客户的位置对一些客户 ID 进行分组,以查看从哪个位置我们得到更多的不匹配。你能告诉我我应该使用哪些节点来获得这种类型的定制报告

不太清楚您想如何进行比较,但我认为您需要 Joiner node. After that you can use the GroupBy node to use the GroupBy node to compute the mismatches by location, but before that you should use for example a Rule Engine 节点来转换 Joiner 创建的缺失值到一个值(如果原始数据集在感兴趣的列中有缺失值,您应该在 Joiner 之前更改它们)并将所有其他值更改为不同的值。