为视频中的每一帧保存边界框坐标

Saving bounding box coordinates for each frame in a video

我有一段来自摄像机的视频,有人在现场。我需要遍历该视频的每一帧并手动保存场景中检测到的人的边界框的坐标(遍历每一帧并在每个人周围绘制正方形)和头部中心的坐标 - 所以基本上是 top-leftbottom-righthead-center 坐标。边界框必须是正方形。

一个额外的程序将读取一个文件,其中包含正方形和头部中心的坐标以及帧编号,并将方框提取为图像。

对于任何有计算机视觉经验的人 - 是否有任何开源软件可以完成我的要求?如果不是,您会推荐使用什么技术来构建此工具?有起始代码吗?

我不知道有什么程序可以专门做到这一点,但我认为这是一个简单的问题,您可以立即自己编写代码。

因为你在计算机视觉领域,所以你必须习惯 OpenCV。您可以使用它从视频中提取帧并 select 框和头部中心。

以下是一些可以帮助您解决问题的链接:

Extract video frames

Detect mouse events