使用 ** layers[0].get_weights()[0]** 的嵌入

The embeddings using ** layers[0].get_weights()[0]**

我用一个例子来研究嵌入网络,其中词汇量 = 200,训练样本包含大约 20 个不同的词。 词汇量为 200,这意味着单词数为 200。 但实际上我只处理 20 个单词(我的训练样本中的单词):假设单词 [0] 到单词 [19]。 因此,在嵌入之后,vector[0] 对应于 word[0] 等等。但是 vector[20].. vector[30] ……它们匹配什么? 我没有字[20] 或字[30] .

提前致谢。

what do they match?

没有。在您增加词汇量之前,那里的权重将保持在初始化时的值,这几乎可以肯定是随机的。如果您试图将它们视为单词,它们将没有英文定义。

它们可能对他们有一些意义,因为训练嵌入创建了一个 space 其中数字有意义,但这些随机嵌入不能可靠地翻译回英语。