什么是简单的损失函数?

What is a loss function in simple words?

任何人都可以用简单的语言并可能用一些例子解释什么是机器learning/neural网络领域的损失函数吗?

这是我在学习 Tensorflow 教程时发现的: https://www.tensorflow.org/get_started/get_started

损失函数是你如何惩罚你的输出。

以下示例适用于监督设置,即当您知道正确的结果时。尽管即使在无监督设置中也可以应用损失函数。

假设您有一个始终预测 1 的模型。只是标量值 1。

您可以将许多损失函数应用于此模型。 L2是欧氏距离。

如果我传入某个值,比如 2,并且我希望我的模型学习 x**2 函数,那么结果应该是 4(因为 2*2 = 4)。如果我们应用 L2 损失,则其计算为 ||4 - 1||^2 = 9.

我们也可以自己编损失函数。我们可以说损失函数总是 10。所以无论我们的模型输出什么,损失都将是常数。

为什么我们关心损失函数?好吧,他们确定了模型在反向传播和神经网络的背景下的表现有多差。他们还确定要传播的最后一层的梯度,以便模型可以学习。

正如其他评论所建议的那样,我认为您应该从基础开始 material。这是一个很好的 link 从 http://neuralnetworksanddeeplearning.com/

开始

它描述了你的网络产生的结果与预期结果的差距——它表明你的模型在其预测上所犯的错误程度。

然后您可以接受该错误并 'backpropagate' 通过您的模型,调整其权重并使其在下一次更接近真相。

值得注意的是我们可以谈论不同类型的损失函数: 回归损失函数和分类损失函数。

回归损失函数描述了模型预测的值与标签的实际值之间的差异。

因此,当我们在单个时间点将预测与标签进行比较时,损失函数对标记数据有意义。

这种损失函数通常称为误差函数或误差公式。

我们用于回归模型的典型误差函数是 L1 和 L2、Huber 损失、Quantile 损失、log cosh 损失。

注意:L1 损失也称为平均绝对误差。 L2 损失也称为均方误差或二次损失。

Loss functions for classification 表示分类问题(识别特定观测值属于哪个类别的问题)中预测不准确所付出的代价。

举几个例子:对数损失、焦点损失、指数损失、铰链损失、相对熵损失等。

注意:虽然平方损失函数更常用于回归,但可以重写并用于分类。