FFMPEG Webvtt m3u8 下载成单个vtt文件,忽略"X-TIMESTAMP-MAP=MPEGTS="(时间戳同步问题)
FFMPEG Webvtt m3u8 download into single vtt file, ignore the "X-TIMESTAMP-MAP=MPEGTS=" (timestamp sync problem)
我想下载一个视频的字幕,它有单独的m3u8文件作为字幕:
m3u8 格式的 webvtt 源代码: https://sdn-global-streaming-cache.3qsdn.com/9378/files/19/05/1199332/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes.ism/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000.m3u8
看起来像:
#EXTM3U
#EXT-X-VERSION:4
## Created with Unified Streaming Platform(version=1.9.5)
#EXT-X-PLAYLIST-TYPE:VOD
#EXT-X-MEDIA-SEQUENCE:1
#EXT-X-INDEPENDENT-SEGMENTS
#EXT-X-TARGETDURATION:989
#USP-X-TIMESTAMP-MAP:MPEGTS=900000,LOCAL=1970-01-01T00:00:00Z
#EXTINF:24.72, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-1.webvtt
#EXTINF:2.56, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-13.webvtt
#EXTINF:50.88, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-14.webvtt
#EXTINF:3.079, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-40.webvtt
#EXTINF:60.401, no desc
....
然后使用命令将多个webvtts下载成一个vtt文件 "EN.vtt":
ffmpeg -i "https://sdn-global-streaming-cache.3qsdn.com/9378/files/19/05/1199332/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes.ism/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000.m3u8" "DE.vtt"
在输出“DE.vtt”中,来自每个 webvtt 文件(m3u8 中的 webvtt)的 X-TIMESTAMP-MAP=MPEGTS:xxxxxx,LOCAL:00:00:00.000 被忽略.
所以时间同步被打破,每个Segment的开始时间总是从00:00:00开始,看起来像:
WEBVTT
00:00.000 --> 00:02.560
So viel Macht.
00:00.000 --> 00:03.079
Was er sagte.
00:00.000 --> 00:04.680
oder
die Schönheit
00:00.000 --> 00:01.440
Er sagte immer:
00:00.000 --> 00:03.840
Auf seinen Klang
00:00.000 --> 00:07.519
Seine Paranoia.
ffmpeg是否支持将相对时间戳转为绝对时间戳?
或者用其他方法下载完美的webvvt文件?
我只能找到这个从未合并到 FFmpeg 中的非常古老的补丁:https://patchwork.ffmpeg.org/project/ffmpeg/patch/20170205194344.333-1-franklinphillips@gmx.com/
我对其进行了一些编辑并将其应用于当前的 ffmpeg 源代码,重新编译并成功转换了一些通过带有 X-TIMESTAMP-MAP
标签的 HLS 提供的 webVTT 字幕。
这是我最终使用的补丁:https://gist.github.com/SebiderSushi/bdf8d46d5501f7085d0b27d8a19eb12c
编辑:
FFmpeg 问题跟踪器上有一张关于此的公开票:https://trac.ffmpeg.org/ticket/8825
我想下载一个视频的字幕,它有单独的m3u8文件作为字幕:
m3u8 格式的 webvtt 源代码: https://sdn-global-streaming-cache.3qsdn.com/9378/files/19/05/1199332/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes.ism/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000.m3u8
看起来像:
#EXTM3U
#EXT-X-VERSION:4
## Created with Unified Streaming Platform(version=1.9.5)
#EXT-X-PLAYLIST-TYPE:VOD
#EXT-X-MEDIA-SEQUENCE:1
#EXT-X-INDEPENDENT-SEGMENTS
#EXT-X-TARGETDURATION:989
#USP-X-TIMESTAMP-MAP:MPEGTS=900000,LOCAL=1970-01-01T00:00:00Z
#EXTINF:24.72, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-1.webvtt
#EXTINF:2.56, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-13.webvtt
#EXTINF:50.88, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-14.webvtt
#EXTINF:3.079, no desc
Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000-40.webvtt
#EXTINF:60.401, no desc
....
然后使用命令将多个webvtts下载成一个vtt文件 "EN.vtt":
ffmpeg -i "https://sdn-global-streaming-cache.3qsdn.com/9378/files/19/05/1199332/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes.ism/Dqt6jZBkvX2nLyY4CGhxmpK89PbQRFV7-drm-aes-textstream_deu=1000.m3u8" "DE.vtt"
在输出“DE.vtt”中,来自每个 webvtt 文件(m3u8 中的 webvtt)的 X-TIMESTAMP-MAP=MPEGTS:xxxxxx,LOCAL:00:00:00.000 被忽略.
所以时间同步被打破,每个Segment的开始时间总是从00:00:00开始,看起来像:
WEBVTT
00:00.000 --> 00:02.560
So viel Macht.
00:00.000 --> 00:03.079
Was er sagte.
00:00.000 --> 00:04.680
oder
die Schönheit
00:00.000 --> 00:01.440
Er sagte immer:
00:00.000 --> 00:03.840
Auf seinen Klang
00:00.000 --> 00:07.519
Seine Paranoia.
ffmpeg是否支持将相对时间戳转为绝对时间戳? 或者用其他方法下载完美的webvvt文件?
我只能找到这个从未合并到 FFmpeg 中的非常古老的补丁:https://patchwork.ffmpeg.org/project/ffmpeg/patch/20170205194344.333-1-franklinphillips@gmx.com/
我对其进行了一些编辑并将其应用于当前的 ffmpeg 源代码,重新编译并成功转换了一些通过带有 X-TIMESTAMP-MAP
标签的 HLS 提供的 webVTT 字幕。
这是我最终使用的补丁:https://gist.github.com/SebiderSushi/bdf8d46d5501f7085d0b27d8a19eb12c
编辑:
FFmpeg 问题跟踪器上有一张关于此的公开票:https://trac.ffmpeg.org/ticket/8825