从 python 读取 wav 文件并将帧转换为 RAW s16le 字符串
Read wav file from python and convert frames into RAW s16le string
我正在使用 librosa、wave 或 soundfile 库读取 Python 中的文件,我需要将块(任意大小)推送到 HTTP 流。根据规范,流字符串输入需要我将帧转换为 RAW s16le 格式。
我尝试了多种选择,包括:
soundarray,rate = librosa.load(pathToWavFile, dtype="<i2")
str = b''.join(soundarray)
但这只会创建一个空的音频流。我做错了什么?
您可以尝试pydub将音频转换为音频片段,将音频片段拆分为可播放的块(即您可以播放每个块),然后根据需要将它们转换为原始文件。
这是一个快速代码。
from pydub import AudioSegment
from pydub.utils import make_chunks
myaudio = AudioSegment.from_file("myaudio.wav" , "wav")
chunk_length_ms = 1000 # pydub calculates in millisec
chunks = make_chunks(myaudio, chunk_length_ms) #Make chunks of one sec
#Convert chunks to raw audio data which you can then feed to HTTP stream
for i, chunk in enumerate(chunks):
raw_audio_data = chunk.raw_data
默认原始音频为 16 位
>>>
bytes_per_sample= 2 # 2 byte (16 bit) samples
由于raw_audio_data
是原始格式,如果上述格式不起作用,您可以根据需要转换为任何其他格式。查看 pydub utils api 了解详情。
如果想一次性从wav文件中获取原始数据,那么pydub也可以这样使用:
from pydub import AudioSegment
sound = AudioSegment.from_wav('your_audio.wav') # can do same for mp3 and other formats
raw = sound._data # returns byte string
print(raw) # prints "b'k\xffe\xffw\xff\x83\xffu\xff\x85\xff\x81\xff\x85\xff\xa5....."
我正在使用 librosa、wave 或 soundfile 库读取 Python 中的文件,我需要将块(任意大小)推送到 HTTP 流。根据规范,流字符串输入需要我将帧转换为 RAW s16le 格式。
我尝试了多种选择,包括:
soundarray,rate = librosa.load(pathToWavFile, dtype="<i2")
str = b''.join(soundarray)
但这只会创建一个空的音频流。我做错了什么?
您可以尝试pydub将音频转换为音频片段,将音频片段拆分为可播放的块(即您可以播放每个块),然后根据需要将它们转换为原始文件。
这是一个快速代码。
from pydub import AudioSegment
from pydub.utils import make_chunks
myaudio = AudioSegment.from_file("myaudio.wav" , "wav")
chunk_length_ms = 1000 # pydub calculates in millisec
chunks = make_chunks(myaudio, chunk_length_ms) #Make chunks of one sec
#Convert chunks to raw audio data which you can then feed to HTTP stream
for i, chunk in enumerate(chunks):
raw_audio_data = chunk.raw_data
默认原始音频为 16 位
>>>
bytes_per_sample= 2 # 2 byte (16 bit) samples
由于raw_audio_data
是原始格式,如果上述格式不起作用,您可以根据需要转换为任何其他格式。查看 pydub utils api 了解详情。
如果想一次性从wav文件中获取原始数据,那么pydub也可以这样使用:
from pydub import AudioSegment
sound = AudioSegment.from_wav('your_audio.wav') # can do same for mp3 and other formats
raw = sound._data # returns byte string
print(raw) # prints "b'k\xffe\xffw\xff\x83\xffu\xff\x85\xff\x81\xff\x85\xff\xa5....."