Word2vec分类与聚类tensorflow

Word2vec classification and clustering tensorflow

我正在尝试使用相似性(可能是余弦)对一些句子进行聚类,然后可能使用分类器将文本放入预定义的 类。

我的想法是使用tensorflow生成词嵌入,然后对每个句子进行平均。接下来使用clustering/classification算法。

tensorflow是否提供即用型word2vec生成算法?

词袋模型会产生好的输出吗?

  • ,tensorflow不提供即用型word2vec,但它确实有a tutorial on word2vec.

  • 是的,一袋词可以产生出乎意料的好输出(但不是state-of-the-art),并且具有 惊人地快 的优势。本人数据量小(几万句),分类F1分数>0.90