Cuda CascadeClassifier detectMultiScale 输出不可读

Question

我正在尝试使用 CUDA 和 openCV4.4 进行级联分类，但是当我运行 detectMultiScale 函数时，它给我一个分段错误。我做错了什么？

python 中 openCV 的 CUDA 文档有限，因此很难找到使用 CUDA 进行级联分类的正确过程。

我的系统：

Quadro P620
Debian 6.3.0-18
Python 3.5.3
OpenCV 4.5.0 构建，CUDA=ON，CUDNN=ON

我想出的代码：

vidcap = cv2.VideoCapture('video_file.mp4')
classifier_cuda = cv2.cuda_CascadeClassifier('cascades_file.xml')
while True:
    success, frame = vidcap.read()
    cuda_frame = cv2.cuda_GpuMat(frame)
    result = classifier_cuda.detectMultiScale(cuda_frame)
    print (result)

classifier_cuda和cuda_frame分别被识别为<cuda_GpuMat 0x7fffa9446d10> <cuda_CascadeClassifier 0x7fffa9446cf0>

已通过将代码更改为：

解决了这个问题

classifier_cuda = cv2.cuda.CascadeClassifier_create('model.xml')
while True:
    success, frame = vidcap.read()
    cuFrame = cv2.cuda_GpuMat(frame)
    output2 = cv2.cuda_GpuMat()
    output = classifier_cuda.detectMultiScale(cuFrame, output2)
    
    # And then its unclear what to use to get the detections
    # I Tried:
    final = classifier_cuda.convert(output)
    # And:
    final = classifier_cuda.convert(output2)
    # And:
    final = output.download()
    # And:
    final = output2.download()

现在的问题是结果全是空的。那么，我应该如何从我的 detectmultiscale 中提取数据呢？我需要一个边界框列表 [x,y,w,h]。

Answer 1

output.download() 实际上对我有效，但如果未检测到任何内容，则会 None。

我认为您的问题是您需要将帧转换为 COLOR_BGR2GRAY。

这应该有效：

source = cv2.VideoCapture('video_file.mp4')
classifier = cv2.cuda.CascadeClassifier_create('model.xml')

while True:
    success, frame = source.read()

    gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    gpu_frame = cv2.cuda_GpuMat(gray_frame)
    gpu_result = classifier.detectMultiScale(gpu_frame) # cuda_GpuMat
    result = gpu_result.download() # UMat

    if result is not None:
        for item in result[0]:
            (x, y, w, h) = item
            print(x, y, w, h)

(OpenCV 4.4)

Cuda CascadeClassifier detectMultiScale 输出不可读

Cuda CascadeClassifier detectMultiScale output is unreadable

python

opencv

opencv4