如何获取手套向量的特征名称

How to get feature names for a glove vectors

Countvectorizer 有像这样的特征名称。

vectorizer = CountVectorizer(min_df=10,ngram_range=(1,4), max_features=15000)
vectorizer.fit(X_train['essay'].values) # fit has to happen only on train data

X_train_essay_bow = vectorizer.transform(X_train['essay'].values)
feature_names= vectorizer.get_feature_names()

手套向量的特征名称是什么?

如何获取这些特征名称?

with open('glove_vectors', 'rb') as f:
    model = pickle.load(f)
    glove_words =  set(model.keys())

我有如上所示的 300 维的手套矢量文件。

手套向量的 300 个维度的名称是什么?

Glove 功能没有名称。 countvectorizer 计算每个标记在每个句子中的出现次数。因此,这些功能具有易于理解的名称。特征“猫”是标记“猫”的每个句子中的计数。

对于 Glove Vectors,策略完全不同,没有等效的特征表示。手套向量是抽象词的嵌入 N-dimensional space.

令牌的 Glove 向量来自将令牌作为输入传递到经过训练的神经网络,并在中间激活 auto-encoding 层。

如果您曾经训练过深度神经网络,想象一下在其中选择一些隐藏层。该隐藏层中每个节点的 feature_name 是多少?这是一个毫无意义的问题,因为节点不是特征;它们的存在是为了将激活传递给下一层。 Glove向量特征也是如此;它们是网络中隐藏层的激活值。