无法理解 tf.contrib。seq2seq.TrainingHelper
Trouble understanding tf.contrib.seq2seq.TrainingHelper
我使用 tf.contrib.seq2seq 在 tensorflow 中成功构建了一个 sequence to sequence 模型 类 在 1.1 版本中。
据了解,我使用 TrainingHelper 来训练我的模型。
但是这个助手是在解码器中提供 先前解码的 值用于训练还是仅提供基本事实?
如果没有,我如何将先前解码的值作为解码器的输入而不是地面真值?
TrainingHelper
在每一步都提供基本事实。如果你想使用解码器输出,你可以使用scheduled sampling [1]。计划采样在 ScheduledEmbeddingTrainingHelper
和 ScheduledOutputTrainingHelper
中实现,因此您可以使用两者之一(取决于您的特定应用程序)而不是 TrainingHelper
。另请参阅此处的线程:
。
我使用 tf.contrib.seq2seq 在 tensorflow 中成功构建了一个 sequence to sequence 模型 类 在 1.1 版本中。
据了解,我使用 TrainingHelper 来训练我的模型。
但是这个助手是在解码器中提供 先前解码的 值用于训练还是仅提供基本事实?
如果没有,我如何将先前解码的值作为解码器的输入而不是地面真值?
TrainingHelper
在每一步都提供基本事实。如果你想使用解码器输出,你可以使用scheduled sampling [1]。计划采样在 ScheduledEmbeddingTrainingHelper
和 ScheduledOutputTrainingHelper
中实现,因此您可以使用两者之一(取决于您的特定应用程序)而不是 TrainingHelper
。另请参阅此处的线程: