VP9 编码限制为 4 个线程?

VP9 encoding limited to 4 threads?

我正在考虑将来使用 VP9 对我的 BluRays 进行编码,因为它是一个开源编解码器。但是我无法让 Handbrake 或 ffmpeg 使用超过我的 (8) 个内核的 50% (4)。因此,编码时间比使用所有内核的 x264/5 差得多。

在 Handbrake 中,我只是将编码器设置为 VP9 和 CQ19。如果我在参数字段中添加 threads 8threads 16threads 64 没有区别。

在命令行中测试 ffmpeg (-c:v libvpx-vp9 -crf 19 -threads 16 -tile-columns 6 -frame-parallel 1 -speed 0) 也不再使用 cpu 个线程。

是当前编码器不能在超过 4 个线程上编码还是我做错了什么?

Libvpx 使用平铺线程,这意味着您最多可以拥有与平铺数量一样多的线程。 -tile-columns 选项采用 log2 格式(因此 -tile-columns 6 表示 64 个图块),但也受到帧大小的限制。确切的细节是 here,它基本上意味着 max_tiles = max(1, exp2(floor(log2(sb_cols)) - 2)),其中 sb_cols = ceil(width / 64.0)。您可以编写一个小脚本来计算给定水平分辨率的图块数:

Width: 320 (sb_cols: 5), min tiles: 1, max tiles: 1
Width: 640 (sb_cols: 10), min tiles: 1, max tiles: 2
Width: 1280 (sb_cols: 20), min tiles: 1, max tiles: 4
Width: 1920 (sb_cols: 30), min tiles: 1, max tiles: 4
Width: 3840 (sb_cols: 60), min tiles: 1, max tiles: 8

因此,即使是 1080p(1920 个水平像素),您最多只能获得 4 个图块,因此最多有 4 个线程,即比特流限制。要获得 8 个图块,您至少需要 1985 像素的宽度(2048-64+1,这给出 sb_cols=32)。获得比最大值更多的线程。给定分辨率下的图块数量,您需要帧级多线程,而 libvpx 没有实现。其他编码器,如 x265/x264,确实实现了这一点。

编辑

正如评论和下方的一些人已经评论的那样,较新版本的 libvpx 支持 -row-mt 1 以启用平铺行多线程。这可以将 VP9 中的图块数量增加多达 4 倍(因为图块行的最大数量为 4,与视频高度无关)。要启用此功能,请使用 -tile-rows N,其中 N 是以 log2 为单位的图块行数(因此 -tile-rows 1 表示 2 个图块行,-tile-rows 2 表示 4 个图块行)。活动线程总数将等于 $tile_rows * $tile_columns.

根据 webmproject.org libvpx VP9 编码器自 1.7.0 标签起支持单列图块内的多线程。

你所要做的就是设置-row-mt 1

ffmpeg -i input.mp4 -c:v libvpx-vp9 -b:v 1000K -threads 8 -speed 4 -row-mt 1 -f webm /tmp/test