如何计算选定子样本预测的训练损失

How to calculate training loss on selected subsample predictions

我正在针对视频序列训练深度学习多目标跟踪模型。视频帧在 1fps 处被提取和注释。为了利用更平滑的时间连贯性，我提取了每个 2 注释帧之间的中间 24 帧。现在，我在 25fps 处提取了所有帧，但地面实况标签仅在最初注释的 25 帧的间隔内可用。

我想通过在正向传递期间提供所有平滑的 25fps 帧来训练深度学习模型，但是在 backprops 期间，我想计算和优化损失仅适用于带注释的 1fps 帧。

关于我应该如何处理的任何提示？特别是当我的 mini-batch size 小于 25.

到目前为止，我正在做的一件有用的事情是为未注释的帧设置 -1 标签，并在计算损失时跳过它们。这可能不是最理想的但有效，有人有更好的主意吗？