对MFCC处理感到困惑
Confused about MFCC processing
所以我在 python 中使用 Librosa 库使用 MFCC 提取了一个音频文件特征。这是代码的样子:
signal, sample_rate = librosa.load('../audio_train/down/00176480_nohash_0.wav', sr=22050)
mfcc = librosa.feature.mfcc(signal, sr=sample_rate, n_mfcc=13)
np.mean(mfcc.T, axis=0)
我的问题是,为什么我们必须转置并获得MFCC的平均值?
所以我在 python 中使用 Librosa 库使用 MFCC 提取了一个音频文件特征。这是代码的样子:
signal, sample_rate = librosa.load('../audio_train/down/00176480_nohash_0.wav', sr=22050)
mfcc = librosa.feature.mfcc(signal, sr=sample_rate, n_mfcc=13)
np.mean(mfcc.T, axis=0)
我的问题是,为什么我们必须转置并获得MFCC的平均值?