在 Python 中进行聚类的文档之间的语义相似性

Semantic similarity among documents to do clustering in Python

我有大约 1000 个文档(文本如段落)。我想找到文档之间的相似之处以对文档进行聚类。最后,我想做层次聚类。我想在 Python 中实施。如何进行。

您的问题过于宽泛,被认为与 Stack Overflow 无关。有关如何进行层次文档聚类的一些教程,请参阅 here