Skip gram模型的输入是否有多个标签?

Does the input of Skip gram model have multiple labels?

假设源文本是:

The quick brown fox jumps over the lazy dog

而window大小为2,如下图:

所以我们有很多训练样本,训练样本的格式是(input, label)。

例如:

(the,quick), (the,brown), (quick,the), (quick,brown), (quick,fox).....

这是否意味着输入 (quick) 有三个输出 (the, brown, fox)?

3 对中的每一对 – (quick,the)(quick,brown)(quick,fox) – 本质上是一个单独的训练示例。

基本上每一对都独立地呈现给浅层神经网络,然后评估该网络的输出。

(这要么通过默认的负采样稀疏方法,其中检查了您所称的 'label' 的输出节点,加上 N 个其他随机选项,要么通过替代的分层 softmax,其中仅检查 'label' 字编码中涉及的节点。在任一模式下,为了提高效率,仅检查神经网络输出的一小部分。)

在某种程度上,那些少数检查的输出对于那个训练示例(一对)来说不是理想的,一些纠正性的推动被反向传播。然后下一个(inputlabel)被spearately处理。

只有通过所有这些对比示例的累积效应,在许多时期交错,最终的网络权重才会以不同的强度反映出有时 quick 应该比其他 brown 更多激活节点,其他时间 quick 应该在其他节点上激活 fox

所以是的,在某种意义上,quick 在 skip-gram 训练微型示例中与 3 种不同的理想输出相关联,仅来自您的一个文本。 (在一个好的语料库中,quick 有许多其他微妙变化的用法,它也会与其他潜在输出相关联,但次数不同。)