无神经网络的实时目标检测与跟踪方法
Methods for real time object detection and tracking without neural network
对于学士论文,我需要统计使用摄像机的人数,并且尽可能正确。对于这个问题,我将 Python 与 OpenCV 结合使用。我知道像 CNN 这样的神经网络是尝试这样做的最佳解决方案。现在的问题是,对于我的论文,我不应该使用神经网络。
我经常研究这个主题,但我一直在使用 Tensorflow 和 Keras(Yolo、Mobilenet)上的神经网络模型寻找对象检测和跟踪。
我发现的唯一 'old school' 方法是:使用人的平均宽度和高度进行背景减法,以及使用 HOG 和 SVM 的方法。
我可以使用其他算法吗? (比如 knn 或随机森林而不是 SVM)
另一个我仍然有但也找不到真正答案的问题是如何在视频而不是图像中使用它。您是否逐帧分割视频然后检测人?还是我还没有找到另一种方法?我觉得对每个帧进行对象识别和检测对于 运行 所在的机器来说是非常密集的。
是否也可以一帧检测多人?
我真的希望有人能帮助我解决这个问题,因为我已经在论文的这一部分停留了很长一段时间了。我要再进步一点!非常感谢!
第一种方法——HAAR级联为特征+AdaBoost为分类器。更快但最差 - LBP 而不是 HAAR。
HOG + 线性支持向量机。还有更多:CoHOG、DPM、...
ICF(积分通道特征)+森林。
这是最重要的。
编辑 1:
您还可以使用更多特征(颜色、对称特征)和缩减技术:PCA、PLS 等。例如,线性 SVM 速度非常快,但对噪声不稳健。一些研究人员使用减少特征向量大小并给出了更好的结果。好论文"Vehicle Detection using Partial Least Squares":https://anikem.github.io/papers/Kembhavi_VehicleDetection_PAMI2011.pdf
但是 DNN 显示出更好的结果。
对于学士论文,我需要统计使用摄像机的人数,并且尽可能正确。对于这个问题,我将 Python 与 OpenCV 结合使用。我知道像 CNN 这样的神经网络是尝试这样做的最佳解决方案。现在的问题是,对于我的论文,我不应该使用神经网络。
我经常研究这个主题,但我一直在使用 Tensorflow 和 Keras(Yolo、Mobilenet)上的神经网络模型寻找对象检测和跟踪。 我发现的唯一 'old school' 方法是:使用人的平均宽度和高度进行背景减法,以及使用 HOG 和 SVM 的方法。 我可以使用其他算法吗? (比如 knn 或随机森林而不是 SVM)
另一个我仍然有但也找不到真正答案的问题是如何在视频而不是图像中使用它。您是否逐帧分割视频然后检测人?还是我还没有找到另一种方法?我觉得对每个帧进行对象识别和检测对于 运行 所在的机器来说是非常密集的。
是否也可以一帧检测多人?
我真的希望有人能帮助我解决这个问题,因为我已经在论文的这一部分停留了很长一段时间了。我要再进步一点!非常感谢!
第一种方法——HAAR级联为特征+AdaBoost为分类器。更快但最差 - LBP 而不是 HAAR。
HOG + 线性支持向量机。还有更多:CoHOG、DPM、...
ICF(积分通道特征)+森林。
这是最重要的。
编辑 1: 您还可以使用更多特征(颜色、对称特征)和缩减技术:PCA、PLS 等。例如,线性 SVM 速度非常快,但对噪声不稳健。一些研究人员使用减少特征向量大小并给出了更好的结果。好论文"Vehicle Detection using Partial Least Squares":https://anikem.github.io/papers/Kembhavi_VehicleDetection_PAMI2011.pdf 但是 DNN 显示出更好的结果。