SVM分类任务中word2vec特征的输入格式是什么?

What is the input format for word2vec features in SVM classification task?

我正在 scikit learn 中使用线性 SVM 执行二元分类任务。我使用标称特征和词向量。我使用预训练的 Google word2vec 获得了词向量,但是,我不确定 SVM 如何将词向量作为一个特征来处理。
似乎我需要 "split" 300 个独立特征(=300 个向量维度)中的每个向量,因为我无法将向量作为一个整体传递给 SVM。但这似乎不对,因为向量应该被视为一个特征。
在这种情况下,表示向量的正确方法是什么?

许多特征的向量

从 SVM 的角度来看,词向量的每个维度都是一个单独的数字特征 - 该向量中的每个维度代表一个代表不同事物的数字度量。

这同样适用于非 SVM 分类器。例如,如果你有一个神经网络,并且你的输入特征是长度为 300 的词向量和(为了一个粗略的例子)一点说明这个词是否大写,那么你会连接这些东西和将有 301 个数字作为您的输入;您会将该特征视为 300 个维度中的每个维度。