Librosa : MFCC 特征计算
Librosa : MFCC feature calculation
给定 22 mins (1320 secs)
的音频文件,Librosa 通过以下方式提取 MFCC 特征
data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
data.shape
(20,56829)
It returns numpy array of 20 MFCC features of 56829 frames .
我的问题是56829是怎么算出来的,有没有什么计算可以达到这个帧数的?每帧的 window 大小是多少?
您可以指定跳跃长度
mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)
librosa 使用居中帧,因此第 k 帧以样本 k * hop_length
为中心
我认为默认跳值是512,你的数据是(1320*22050)/56829 = 512,16
给定 22 mins (1320 secs)
的音频文件,Librosa 通过以下方式提取 MFCC 特征
data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
data.shape (20,56829) It returns numpy array of 20 MFCC features of 56829 frames .
我的问题是56829是怎么算出来的,有没有什么计算可以达到这个帧数的?每帧的 window 大小是多少?
您可以指定跳跃长度
mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)
librosa 使用居中帧,因此第 k 帧以样本 k * hop_length
为中心我认为默认跳值是512,你的数据是(1320*22050)/56829 = 512,16