从图像和音频生成视频

Generate Video From Images and Audio

我有一个图像列表:1.png, 2.png... 和一个音频文件列表 1.mp3, 2.mp3...

我想生成一个视频文件,其中连接了音频剪辑,并且每个图像都显示在相应的音频剪辑上:

将图像视为幻灯片放映中的幻灯片,将音频视为幻灯片的旁白。

是否有任何框架可以让我这样做?如果可能的话,我想使用 FFmpeg CLI 或其他高级工具。

惰性方法是让每个段然后与 concat demuxer:

连接
ffmpeg -loop 1 -i 1.png -i 1.mp3 -c:v libx264 -preset stillimage -vf format=yuv420p -c:a aac -shortest 1.mp4
ffmpeg -loop 1 -i 2.png -i 2.mp3 -c:v libx264 -preset stillimage -vf format=yuv420p -c:a aac -shortest 2.mp4
ffmpeg -loop 1 -i 2.png -i 2.mp3 -c:v libx264 -preset stillimage -vf format=yuv420p -c:a aac -shortest 2.mp4
ffmpeg -f concat -i input.txt -c copy -movflags +faststart output.mp4

这假设图像文件具有相同的宽度和高度,并且音频文件具有相同的通道布局和采样率。

更复杂的方法是使用 concat filter,它允许您在一个命令中完成所有操作,但您必须输入每个图像片段的持续时间以匹配相应的音频持续时间。