在视频上使用带有 LSTM 的 TensorFlow 对象检测 API
Using TensorFlow Object Detection API with LSTM on a video
我正在尝试跟踪(通过检测)视频中的对象。问题是检测到的对象的标签在视频帧中发生了变化。我相信使用 RNN(例如 LSTM)可能有助于使标签更稳定,但我不知道如何使用我的对象检测器 (MobilenetV2+SSD) 的冻结模型作为 LSTM 层的输入并训练该层。
你可以试试这个 https://github.com/tensorflow/models/tree/master/research/lstm_object_detection。它的实现来自以下论文中提出的 Tensorflow 移动视频对象检测实现:
使用时间感知特征映射的移动视频对象检测(CVPR 2018)。
http://openaccess.thecvf.com/content_cvpr_2018/papers/Liu_Mobile_Video_Object_CVPR_2018_paper.pdf
帮你做指南。
我正在尝试跟踪(通过检测)视频中的对象。问题是检测到的对象的标签在视频帧中发生了变化。我相信使用 RNN(例如 LSTM)可能有助于使标签更稳定,但我不知道如何使用我的对象检测器 (MobilenetV2+SSD) 的冻结模型作为 LSTM 层的输入并训练该层。
你可以试试这个 https://github.com/tensorflow/models/tree/master/research/lstm_object_detection。它的实现来自以下论文中提出的 Tensorflow 移动视频对象检测实现: 使用时间感知特征映射的移动视频对象检测(CVPR 2018)。
http://openaccess.thecvf.com/content_cvpr_2018/papers/Liu_Mobile_Video_Object_CVPR_2018_paper.pdf
帮你做指南。