TF-IDF 分数计算示例

TF-IDF score calculation example

我想计算集群中已经存在很多句子的句子的 tf-idf 分数。我已经看到一些例子,其中只有两个句子作为例子。但我需要不止两句话。谁能帮帮我??

TF-IDF 是在两个文档或句子(两个词向量)上定义的。 您似乎想一对多地应用它?

对此没有理论上支持的方法。但是您可以使用 HAC 中常见的任何启发式方法,因为这似乎是您正在重新发明的东西。