为自然语言处理找到语义相似的词

Find semantically similar word for natural language processing

我正在 Java 从事自然语言处理项目。我有一个要求,我想识别属于相似语义组的词。 例如:如果找到 studyuniversitygraduateattend 等词,我希望将它们归类为与教育相关。 如果找到诸如 golferbatsmanathlete 之类的词,它应该将所有词都归类到像 sportsperson 这样的父项下。 有没有一种方法可以在不使用和培训方法的情况下完成这项任务。有没有像WordNet之类的可以直接使用的toll?任何指针将不胜感激! 谢谢干杯! :-)

是的,您可以使用 WordNet。例如,您可以在当前词的上位词(例如 study)中搜索您的类别词(例如 educationsport)。有JAWS, JWNL, and other libraries, see related question.

或者,您可以计算候选词和类别词之间的相似度 - 例如通过使用 ws4j or Semilar.