如何计算选定子样本预测的训练损失

How to calculate training loss on selected subsample predictions

我正在针对视频序列训练深度学习多目标跟踪模型。 视频帧在 1fps 处被提取和注释。 为了利用更平滑的时间连贯性,我提取了每个 2 注释帧之间的中间 24 帧。现在,我在 25fps 处提取了所有帧,但地面实况标签仅在最初注释的 25 帧的间隔内可用。

我想通过在正向传递期间提供所有平滑的 25fps 帧来训练深度学习模型,但是在 backprops 期间,我想计算和优化损失仅适用于带注释的 1fps 帧。

关于我应该如何处理的任何提示?特别是当我的 mini-batch size 小于 25.

到目前为止,我正在做的一件有用的事情是为未注释的帧设置 -1 标签,并在计算损失时跳过它们。这可能不是最理想的但有效,有人有更好的主意吗?