音乐分类的最佳功能

Best features for music classifications

我正在尝试开发一个应用程序，通过从用户自己标记为最喜欢的音乐训练神经网络，将音乐分类为可能最喜欢或不太可能最喜欢。我以前从未做过音频分析，所以我对此几乎一无所知。 为了使它成为一个准确的分类模型，我需要在我的音乐数据集中包含哪些特征。例如：- 分贝值、频率值、音频长度

谢谢

首先使用 Essentia 的音乐特征提取器。例如，您可以使用他们的 commandline tool。这为您提供了大量低级音频功能（30 多种类型），以及节奏（6 种以上功能类型）和音调（6 种以上功能）。您也可以对 Python 绑定执行相同的操作。

频谱图是一种有用的技术，可用于可视化声音的频谱以及它们在很短的时间内如何变化。您可以使用称为梅尔频率倒谱系数 (MFCC) 的类似技术作为数据集的特征。

您可以使用 Librosa's mfcc() 从时间序列音频数据生成 MFCC 的函数来简化任务