匹配 excel 中的两列,拼写略有不同

matching two columns in excel with slight difference in the spelling

我正在研究来自不同来源的关于同一件事的大量 excel sheet。消息来源报告和记录信息的方式不同。因此,例如,一个人会将位置写为 "Khurais" 而另一个人会将其写为 "Khorais".

由于这两个文件都包含重要信息,所以我想将它们合并为一个excel sheet,这样我可以更轻松地处理它们。因此,如果您有任何您认为有益的建议或工具,请在此处分享。

P.s。 excel sheet中的单词是阿拉伯语单词的翻译。

您可以使用 Levenshtein 距离来确定两个词是否 "close" 彼此。基于此你可以匹配。

Double Metaphone 算法浮现在脑海中。它尝试将字符串转换为语音表示。例如,"Folly"和"Pholee"应该有相同的拼音代码。

如果您可以生成这些代码,您就可以根据它们而不是字符串来匹配您的记录。

这是一篇解释的文章以及示例 VBA 代码: https://bytes.com/topic/access/insights/965241-fuzzy-string-matching-double-metaphone-algorithm

希望对您有所启发:)

您可以使用 FuzzyLookup,这是一个允许您进行适当匹配的宏。它在过去对我来说非常有效,而且实际上有很好的记录。

您可以在此处找到它:https://www.mrexcel.com/forum/excel-questions/195635-fuzzy-matching-new-version-plus-explanation.html 包括有关如何使用它的示例。

希望对您有所帮助!

PS 显然你也可以在 VBA 中严格使用它(不使用工作表函数)