训练 SVM 分类器(词嵌入与句子嵌入)

Training SVM classifier (word embeddings vs. sentence embeddings)

我想尝试不同的嵌入,如 Word2Vec、ELMo 和 BERT,但我有点困惑是使用单词嵌入还是句子嵌入,以及为什么。我正在使用嵌入作为 SVM 分类器的特征输入。

谢谢。

虽然这两种方法都可以证明对不同的数据集有效,但根据经验,我建议您在输入的是几个单词时使用词嵌入,而在输入较长(例如大段落)时使用句子嵌入.