如何继续尝试查找播放同一首歌曲但压缩格式不同的音频文件?

How do I proceed in an attempt to find audio files which play the same song but are in different compressed formats?

我想要的只是假设我有同一首名为 song.mp3 的歌曲,并且 song.aac 现在我希望我的程序能够识别它们是相同的,我知道这是一项非常重要的任务。

到目前为止,我已经尝试使用 dejavu python 库对音频进行指纹识别,它为我们的案例 song.mp3 和 song.aac 生成了 2 个不同的指纹,因此它不适合我的程序的需要。

我也尝试过使用 FFMPEG 的 MD5,但正如预期的那样,即使是从不同网站下载的相同歌曲,它也会给出不同的哈希值

你们知道我该怎么做吗? 如果能为我提供逐步的程序和库来实现我的目标,那就太好了。 谢谢

音频指纹非常复杂,而且很难正确处理。你真的不想像那样想出自己的算法,因为它可能比已建立的方法差得多(比已建立的方法更好需要做一些研究;-))。

我发现的音频指纹识别开源解决方案之一是 http://echoprint.me/codegen

您可以在您的应用程序中使用它,方法是直接调用 libcodegen API,或者生成用于音频分析的子进程。