如何从一组词中自动识别上位词?

How to automatically identify hypernyms from a group of words?

我有几组词,比如 A组:苹果、梨、香蕉、水果、葡萄、西瓜; B组:猫、动物、狗、猪、猴、鸭; C组:意大利、澳大利亚、中国、希腊。

如何自动识别这 3 组的上位词(例如,A 组是水果,B 组是动物,C 组是国家)?非常感谢。

您可以使用 nltk 中内置的 WordNet。有关详细信息,请在此处查看此问题:Determining Hypernym or Hyponym using wordnet nltk

然而,重要的是要了解上位词的识别只会在训练数据允许的范围内发挥作用。除了使用标记数据进行训练之外,没有用于识别相似对象分组的神奇系统。