MarkLogic - 人名模糊匹配

MarkLogic - Person name fuzzy match

我们正在使用 MarkLogic 版本 9.0-6.2

我们需要根据一些模糊逻辑来匹配人名(例如,Mike 和 Michael 相同)。每个人都有名字和姓氏。在 MarkLogic 中实现此目标的最佳方法是什么。智能掌握有帮助吗?

我们不必合并匹配的文档。如果找到匹配项,我们需要 return 一条消息。

我会考虑在具有名称同义词的自定义词库上使用 spell.doubleMetaphone for this, that gives pretty strong fuzziness already. It won't cause Mike (mk) and Michael (mkl, mxl) to match, but you can potentially combine it with thsr.lookup。这应该会给你带来非常强大的模糊感。

HTH!

是的,您可以为此使用 Smart Mastering。我会使用同义词词典作为名字,double metaphone 作为姓氏。 Smart Mastering 允许您只调用匹配函数并跳过合并。