在 GPU 上使用 onnxruntime 时内存泄漏(CPU 的 RAM)

Memory leak (CPU's RAM) when using onnxruntime on GPU

我正在使用 Pypi 的 Insightface 库 (https://pypi.org/project/insightface/), the source code is here: https://github.com/deepinsight/insightface/blob/master/python-package/insightface/model_zoo/scrfd.py

当我 运行 它在我的 GPU 上时,CPU 的 RAM 出现严重的内存泄漏,超过 40 GB,直到我停止它(不是 GPU 内存)。

这是我的脚本:

import insightface
import cv2
import time

model = insightface.app.FaceAnalysis()

# It happens only when using GPU !!!
ctx_id = 0

image_path = "my-face-image.jpg"
image = cv2.imread(image_path)

model.prepare(ctx_id = ctx_id, det_thresh=0.3, det_size=[416, 416])

detector =  model.models["detection"]

for i in range(100000):
    start_t = time.time()
    bboxes, landmarks = detector.detect(image)
    end_t = time.time()
    print('Detection time: {}'.format(end_t - start_t))

print('DONE')

我的设置是(在 docker 内):

我设法通过以下设置解决了这个问题:

  • Ubuntu-20.04
  • Python-3.8
  • Nvidia-470
  • Cuda-11.3
  • Cudnn-8
  • mxnet==1.8.0.post0
  • onnx==1.9.0
  • onnxruntime-gpu==1.8.1
  • insightface==0.4