几个单词QString之间的距离Qt C++
distance between QStrings of several words Qt c++
我目前正在尝试比较两个包含多个单词的字符串。我知道可以使用 levenstein 算法获得两个字符串之间的距离。它运作良好。但是我怎样才能得到几个单词之间的距离呢?
我正在编写一个应用程序,该应用程序根据电影片名对 TMDB 进行研究,我得到了多个片名作为结果。我需要将标题结果与我的电影标题相关联。我想到了一个一个地比较单词并保持最好的结果,但我认为这不是最好的方法。
我需要它来考虑拼写错误(星 wars/star 病房)、数字(矩阵 1、矩阵 2 等...)、更多单词(矩阵 2 - Reloaded/Matrix 重新加载)。
感谢您的帮助。我正在使用 C++ Qt。
为了比较自然语言,最成功的模型之一是 "bag of words":http://en.wikipedia.org/wiki/Bag-of-words_model,它被广泛应用于许多垃圾邮件过滤工具中并取得了成功。
当然有 c++ 实现,一个著名的实现在 openCV 中,但如果我是你,我会尝试编写我自己的变体,包括 levenstein 算法。
我目前正在尝试比较两个包含多个单词的字符串。我知道可以使用 levenstein 算法获得两个字符串之间的距离。它运作良好。但是我怎样才能得到几个单词之间的距离呢?
我正在编写一个应用程序,该应用程序根据电影片名对 TMDB 进行研究,我得到了多个片名作为结果。我需要将标题结果与我的电影标题相关联。我想到了一个一个地比较单词并保持最好的结果,但我认为这不是最好的方法。
我需要它来考虑拼写错误(星 wars/star 病房)、数字(矩阵 1、矩阵 2 等...)、更多单词(矩阵 2 - Reloaded/Matrix 重新加载)。
感谢您的帮助。我正在使用 C++ Qt。
为了比较自然语言,最成功的模型之一是 "bag of words":http://en.wikipedia.org/wiki/Bag-of-words_model,它被广泛应用于许多垃圾邮件过滤工具中并取得了成功。 当然有 c++ 实现,一个著名的实现在 openCV 中,但如果我是你,我会尝试编写我自己的变体,包括 levenstein 算法。