Keras 中自定义损失的输出
Output of custom loss in Keras
我知道在 Keras 中处理自定义损失函数有很多问题,但即使在谷歌搜索 3 小时后我也无法回答这个问题。
这是我的问题的一个非常简单的例子。我意识到这个例子毫无意义,但我提供它是为了简单起见,我显然需要实现一些更复杂的东西。
from keras.backend import binary_crossentropy
from keras.backend import mean
def custom_loss(y_true, y_pred):
zeros = tf.zeros_like(y_true)
index_of_zeros = tf.where(tf.equal(zeros, y_true))
ones = tf.ones_like(y_true)
index_of_ones = tf.where(tf.equal(ones, y_true))
zero = tf.gather(y_pred, index_of_zeros)
one = tf.gather(y_pred, index_of_ones)
loss_0 = binary_crossentropy(tf.zeros_like(zero), zero)
loss_1 = binary_crossentropy(tf.ones_like(one), one)
return mean(tf.concat([loss_0, loss_1], axis=0))
我不明白为什么在两个 class 数据集上使用上述损失函数训练网络不会产生与使用内置 binary-crossentropy
损失函数训练相同的结果。
谢谢!
EDIT:我编辑了代码片段以按照下面的评论包含平均值。但是我仍然有相同的行为。
我终于明白了。当形状为 "unknown" 时,tf.where
函数的行为非常不同。
要修复上面的代码片段,只需在函数声明后立即插入以下行:
y_pred = tf.reshape(y_pred, [-1])
y_true = tf.reshape(y_true, [-1])
我知道在 Keras 中处理自定义损失函数有很多问题,但即使在谷歌搜索 3 小时后我也无法回答这个问题。
这是我的问题的一个非常简单的例子。我意识到这个例子毫无意义,但我提供它是为了简单起见,我显然需要实现一些更复杂的东西。
from keras.backend import binary_crossentropy
from keras.backend import mean
def custom_loss(y_true, y_pred):
zeros = tf.zeros_like(y_true)
index_of_zeros = tf.where(tf.equal(zeros, y_true))
ones = tf.ones_like(y_true)
index_of_ones = tf.where(tf.equal(ones, y_true))
zero = tf.gather(y_pred, index_of_zeros)
one = tf.gather(y_pred, index_of_ones)
loss_0 = binary_crossentropy(tf.zeros_like(zero), zero)
loss_1 = binary_crossentropy(tf.ones_like(one), one)
return mean(tf.concat([loss_0, loss_1], axis=0))
我不明白为什么在两个 class 数据集上使用上述损失函数训练网络不会产生与使用内置 binary-crossentropy
损失函数训练相同的结果。
谢谢!
EDIT:我编辑了代码片段以按照下面的评论包含平均值。但是我仍然有相同的行为。
我终于明白了。当形状为 "unknown" 时,tf.where
函数的行为非常不同。
要修复上面的代码片段,只需在函数声明后立即插入以下行:
y_pred = tf.reshape(y_pred, [-1])
y_true = tf.reshape(y_true, [-1])