训练''categorical input'到'categorical output'模型的损失函数和数据格式?

Loss function and data format for training a ''categorical input' to 'categorical output' model?

我正在尝试训练一个自动驾驶模型,将来自前置摄像头的输入转换为鸟瞰图像。

输入和输出都是形状为 (96, 144) 的分割掩码,其中每个像素的范围从 0 到 12(每个数字代表不同的class)。

现在我的问题是我应该如何预处理我的数据以及我应该为模型使用哪个损失函数(我正在尝试使用完全卷积网络)。

我尝试使用 keras 的 to_categorical 实用程序将输入和输出转换为形状 (96, 144, 13)所以每个通道都有 0 和 1 代表一个类别的特定掩码。我在最后一层使用了 binary_crossentropysigmoid 激活,模型似乎在学习并且损失开始减少。

但我仍然不确定这是不是正确的方法,或者是否有更好的方法。

应该是什么:

我找到了解决方案,在最后一层使用带有 softmax 激活的分类交叉熵。使用问题中指定的相同数据格式。