用于多标签分类的汉明损失中的梯度计算

Gradient calculation in Hamming loss for multi-label classification

我正在使用一些递归神经网络结构进行多标签 class化。我的问题是关于损失函数:我的输出将是 true/false (1/0) 值的向量,以指示每个标签的 class。许多资源说汉明损失是合适的 objective。但是Hamming loss在梯度计算上有一个问题: H = average (y_true XOR y_pred),异或无法推导出损失的梯度。那么训练多标签classification还有其他损失函数吗?我尝试了 MSE 和二元交叉熵与单个 sigmoid 输入。

H = average(y_true*(1-y_pred)+(1-y_true)*y_pred)

是汉明损失的连续逼近。