词向量列表的降维

Dimensionality reduction on list of word vectors

我有一组表示单词的向量,每个向量有 300 个特征,这意味着每个向量有 300 个浮点数。我的目标是减少维度,即减少到 50,这样我可以获得一些 space.

如何使用例如张量流?我找不到将向量列表作为输入并减少它的方法、实现等。

您可能想研究用于文本处理的卷积神经网络。 CNN 通常以输入向量的降维而著称。它们通常用于图像分类,但也用于文本和句子分类。您正在寻找的是输入向量的嵌入。引用:

Now that our words have been replaced by numbers, we could simply do one-hot encoding but that would result in an extremely wide input — there are thousands of unique words in the titles dataset. A better approach is to reduce the dimensionality of the input — this is done through an embedding layer (see full code here):

来自这里:

TowardsDataScience

另一个资源:

AnalyticsVidhya