Librosa - 音频 Spectrogram/Frequency Bins 到频谱
Librosa - Audio Spectrogram/Frequency Bins to Spectrum
我已经阅读了几天,但一直没有找到解决方案...我能够构建 Librosa 频谱图并使用以下方法提取 amplitude/frequency 数据:
audio, sr = librosa.load('short_piano melody_keyCmin_110bpm.wav', sr = 22500)
spectrum = librosa.stft(audio, n_fft=2048, window=scipy.signal.windows.hamming)
D = librosa.amplitude_to_db(np.abs(spectrum), ref=np.max)
n = D.shape[0]
Nfft = 1+2*(n-1)
freq_bins = librosa.fft_frequencies(sr=sr, n_fft=Nfft)
但是,我无法将D和freq_bins中的数据转回频谱。一旦我能够做到这一点,我就可以将新频谱转换为 .wav 文件并收听我重建的音频......任何建议将不胜感激!谢谢。
当我答对你的问题时,你想根据你的幅度值重建 real/imaginary 频谱。为此,您将需要相位分量,然后是所有简单的复数运算。你应该知道STFT的输出是一个复数数组,振幅是每个数的绝对值,而相位是每个数的角度
这是一个时域信号转换为 magnitude/phase 并在不修改的情况下返回的示例:
% get the complex valued spectrum from a sample
spectrum = librosa.stft(audio, n_fft=2048,window=scipy.signal.windows.hamming)
# get magnitude and phase from the complex numbers
magnitude = np.abs(spectrum)
phase = np.angle(spectrum)
# reconstruct real/imaginary parts from magnitude and phase
spectrum = magnitude * np.exp(1j*phase)
# transform back to time-domain
在您的情况下,您当然应该首先将分贝值转换回振幅值。即使没有使用 librosa 的经验,我确信也有一个功能。
我已经阅读了几天,但一直没有找到解决方案...我能够构建 Librosa 频谱图并使用以下方法提取 amplitude/frequency 数据:
audio, sr = librosa.load('short_piano melody_keyCmin_110bpm.wav', sr = 22500)
spectrum = librosa.stft(audio, n_fft=2048, window=scipy.signal.windows.hamming)
D = librosa.amplitude_to_db(np.abs(spectrum), ref=np.max)
n = D.shape[0]
Nfft = 1+2*(n-1)
freq_bins = librosa.fft_frequencies(sr=sr, n_fft=Nfft)
但是,我无法将D和freq_bins中的数据转回频谱。一旦我能够做到这一点,我就可以将新频谱转换为 .wav 文件并收听我重建的音频......任何建议将不胜感激!谢谢。
当我答对你的问题时,你想根据你的幅度值重建 real/imaginary 频谱。为此,您将需要相位分量,然后是所有简单的复数运算。你应该知道STFT的输出是一个复数数组,振幅是每个数的绝对值,而相位是每个数的角度
这是一个时域信号转换为 magnitude/phase 并在不修改的情况下返回的示例:
% get the complex valued spectrum from a sample
spectrum = librosa.stft(audio, n_fft=2048,window=scipy.signal.windows.hamming)
# get magnitude and phase from the complex numbers
magnitude = np.abs(spectrum)
phase = np.angle(spectrum)
# reconstruct real/imaginary parts from magnitude and phase
spectrum = magnitude * np.exp(1j*phase)
# transform back to time-domain
在您的情况下,您当然应该首先将分贝值转换回振幅值。即使没有使用 librosa 的经验,我确信也有一个功能。