从 rtsp H.264 视频流中捕获单个图像

Question

我正在尝试从 RTSP H.264 视频帧中按需捕获单个图像。我在 Raspberry Pi 上将 OpenCV 与 Python 运行一起使用。

我的理解是，您不能简单地捕获图像，而是必须不断地从视频中读取图像流，并丢弃除偶尔需要的图像之外的所有图像。这在计算上非常昂贵，并且在 Pi 上消耗了大约 25% 的 CPU 除了读取和丢弃 1280x720 15 fps H.264 rtsp 视频帧之外什么都不做。

还有别的办法吗？我很灵活，也可以使用 GStreamer、FFMPEG 或任何其他计算效率更高的东西。

Answer 1

你必须读取流的原因是因为 H.264 有多种帧（参见 https://en.wikipedia.org/wiki/Video_compression_picture_types）并且 P 和 B 帧需要解码上下文。只有 I 帧（也称为关键帧）可以独立解码。

如果您想读取真正的任意帧，您可以解析（而不是解码）流，并保留自最后一个 I 帧以来的所有内容。当您的触发器到来时，您将解码从最后一个 I 帧到当前点的流。

如果不需要很精确，可以只存最后一个I帧，按需解码。这将非常快，但这意味着您可能会在错误的时间获得照片。

最后，这些关键帧多久出现一次？这取决于来源。例如，C920 网络摄像头默认情况下大约每 5 秒生成一次，但这个间隔可以从 1 秒更改为 30 秒（我想，这是前一段时间）

Answer 2

我也在做类似的事情。这是我的代码：

def CaptureFrontCamera():
    _bytes = bytes()
    stream = urllib.request.urlopen('http://192.168.0.51/video.cgi?resolution=1920x1080')
    while True:
        _bytes += stream.read(1024)
        a = _bytes.find(b'\xff\xd8')
        b = _bytes.find(b'\xff\xd9')
        if a != -1 and b != -1:
            jpg = _bytes[a:b+2]
            _bytes = _bytes[b+2:]
            filename = '/home/pi/capture.jpeg'
            i = cv2.imdecode(np.fromstring(jpg, dtype=np.uint8), cv2.IMREAD_COLOR)
            cv2.imwrite(filename, i)
            return filename

Answer 3

回答我自己的问题。而不是使用 read():

cap = cv2.VideoCapture('rtsp_url')

def captureimages():
    while True:
        image = cap.read()

s = threading.Thread(target=captureimages)
s.start()

if takepic == True:
    picture = image.copy()

将其分解为 grab() 和 retrieve() 效率更高。不是一个完美的解决方案，但更好：

cap = cv2.VideoCapture('rtsp_url')

def captureimages():
    while True:
        cap.grab()

s = threading.Thread(target=captureimages)
s.start()

if takepic == True:
    picture = cap.retrieve()

从 rtsp H.264 视频流中捕获单个图像

Capturing a SINGLE image from an rtsp H.264 video stream

python

opencv

rtsp

h.264

raspberry-pi3