用于多标签分类的汉明损失中的梯度计算

Gradient calculation in Hamming loss for multi-label classification

machine-learning
neural-network
hamming-distance
gradient-descent
multilabel-classification

我正在使用一些递归神经网络结构进行多标签 class化。我的问题是关于损失函数：我的输出将是 true/false (1/0) 值的向量，以指示每个标签的 class。许多资源说汉明损失是合适的 objective。但是Hamming loss在梯度计算上有一个问题： H = average (y_true XOR y_pred)，异或无法推导出损失的梯度。那么训练多标签classification还有其他损失函数吗？我尝试了 MSE 和二元交叉熵与单个 sigmoid 输入。

H = average(y_true*(1-y_pred)+(1-y_true)*y_pred)

是汉明损失的连续逼近。

用于多标签分类的汉明损失中的梯度计算

Gradient calculation in Hamming loss for multi-label classification

machine-learning

neural-network

hamming-distance

gradient-descent

multilabel-classification