使用 Keras categorical_crossentropy loss 时,是否应该在最后一层使用 softmax?
When using Keras categorical_crossentropy loss, should you use softmax on the last layer?
我见过的大多数示例都在最后一层实现 softmax。但是我读到 Keras categorical_crossentropy
在最后一层之后自动应用 softmax,所以这样做是多余的并且会导致性能下降。谁是对的?
默认情况下,Keras categorical_crossentropy 不会将 softmax 应用于输出(请参阅 categorical_crossentropy implementation and the Tensorflow backend call)。但是,如果直接使用后端函数,则存在设置 from_logits=True
.
的选项
我见过的大多数示例都在最后一层实现 softmax。但是我读到 Keras categorical_crossentropy
在最后一层之后自动应用 softmax,所以这样做是多余的并且会导致性能下降。谁是对的?
默认情况下,Keras categorical_crossentropy 不会将 softmax 应用于输出(请参阅 categorical_crossentropy implementation and the Tensorflow backend call)。但是,如果直接使用后端函数,则存在设置 from_logits=True
.