图解释深度学习

Graph interpretation deep learning

我正在尝试构建一个对句子进行分类的模型。我正在使用递归神经网络 (RNN) 模型 "GRUcell" 并且我有以下图表。我使用的损失函数是交叉熵。 你能解释一下为什么每次迭代后接近 0 的损失会变为 1 吗? 我找不到对此的任何解释,谢谢。 enter image description here

根据您提供的信息,它似乎在一批结束时下降,并在下一批开始时再次上升。这可能是由于学习率高,但随着时间的推移没有足够的衰减。 尝试调整参数,看看是否有帮助。

干杯