词向量列表的降维
Dimensionality reduction on list of word vectors
我有一组表示单词的向量,每个向量有 300 个特征,这意味着每个向量有 300 个浮点数。我的目标是减少维度,即减少到 50,这样我可以获得一些 space.
如何使用例如张量流?我找不到将向量列表作为输入并减少它的方法、实现等。
您可能想研究用于文本处理的卷积神经网络。 CNN 通常以输入向量的降维而著称。它们通常用于图像分类,但也用于文本和句子分类。您正在寻找的是输入向量的嵌入。引用:
Now that our words have been replaced by numbers, we could simply do one-hot encoding but that would result in an extremely wide input — there are thousands of unique words in the titles dataset. A better approach is to reduce the dimensionality of the input — this is done through an embedding layer (see full code here):
来自这里:
另一个资源:
我有一组表示单词的向量,每个向量有 300 个特征,这意味着每个向量有 300 个浮点数。我的目标是减少维度,即减少到 50,这样我可以获得一些 space.
如何使用例如张量流?我找不到将向量列表作为输入并减少它的方法、实现等。
您可能想研究用于文本处理的卷积神经网络。 CNN 通常以输入向量的降维而著称。它们通常用于图像分类,但也用于文本和句子分类。您正在寻找的是输入向量的嵌入。引用:
Now that our words have been replaced by numbers, we could simply do one-hot encoding but that would result in an extremely wide input — there are thousands of unique words in the titles dataset. A better approach is to reduce the dimensionality of the input — this is done through an embedding layer (see full code here):
来自这里:
另一个资源: