Cuda CascadeClassifier detectMultiScale 输出不可读

Cuda CascadeClassifier detectMultiScale output is unreadable

我正在尝试使用 CUDA 和 openCV4.4 进行级联分类,但是当我 运行 detectMultiScale 函数时,它给我一个分段错误。我做错了什么?

python 中 openCV 的 CUDA 文档有限,因此很难找到使用 CUDA 进行级联分类的正确过程。

我的系统:

我想出的代码:

vidcap = cv2.VideoCapture('video_file.mp4')
classifier_cuda = cv2.cuda_CascadeClassifier('cascades_file.xml')
while True:
    success, frame = vidcap.read()
    cuda_frame = cv2.cuda_GpuMat(frame)
    result = classifier_cuda.detectMultiScale(cuda_frame)
    print (result) 

classifier_cuda和cuda_frame分别被识别为<cuda_GpuMat 0x7fffa9446d10> <cuda_CascadeClassifier 0x7fffa9446cf0>

已通过将代码更改为:

解决了这个问题
classifier_cuda = cv2.cuda.CascadeClassifier_create('model.xml')
while True:
    success, frame = vidcap.read()
    cuFrame = cv2.cuda_GpuMat(frame)
    output2 = cv2.cuda_GpuMat()
    output = classifier_cuda.detectMultiScale(cuFrame, output2)
    
    # And then its unclear what to use to get the detections
    # I Tried:
    final = classifier_cuda.convert(output)
    # And:
    final = classifier_cuda.convert(output2)
    # And:
    final = output.download()
    # And:
    final = output2.download()

现在的问题是结果全是空的。那么,我应该如何从我的 detectmultiscale 中提取数据呢?我需要一个边界框列表 [x,y,w,h]。

output.download() 实际上对我有效,但如果未检测到任何内容,则会 None

我认为您的问题是您需要将帧转换为 COLOR_BGR2GRAY

这应该有效:

source = cv2.VideoCapture('video_file.mp4')
classifier = cv2.cuda.CascadeClassifier_create('model.xml')

while True:
    success, frame = source.read()

    gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    gpu_frame = cv2.cuda_GpuMat(gray_frame)
    gpu_result = classifier.detectMultiScale(gpu_frame) # cuda_GpuMat
    result = gpu_result.download() # UMat

    if result is not None:
        for item in result[0]:
            (x, y, w, h) = item
            print(x, y, w, h)

(OpenCV 4.4)