样本如何在音频文件中对齐?

How samples are aligned in the audio file?

我正在尝试更好地了解样本在音频文件中的排列方式。

假设我们有一个 2s 音频文件 sampling rate = 3。 我认为有三种可能的方法来对齐这些样本。看看下面的图片,你能告诉我哪个是正确的吗?

此外,这是所有音频文件的标准还是不同的格式有不同的规则?

干杯!

音频中的采样率通常告诉您一秒内有多少样本,单位称为赫兹。严格来说,正确答案是 (1),因为您在一秒钟内有 3 个样本。假设没有延迟,PCM 和其他格式规定音频从 0 开始。下一个“周期”(下一秒)也从零开始,与时钟相同的原理。

要获得音频的总长度(评论中的问题),您应该简单地取 number of samples / rate。使用 soxi 的 30s WAV 示例,这是社区中用于声音处理的规范工具之一:

Input File     : 'book_00396_chp_0024_reader_11416_5_door_Freesound_validated_380721_0-door_Freesound_validated_381380_0-9IfN8dUgGaQ_snr10_fileid_1138.wav'
Channels       : 1
Sample Rate    : 16000
Precision      : 16-bit
Duration       : 00:00:30.00 = 480000 samples ~ 2250 CDDA sectors
File Size      : 960k
Bit Rate       : 256k
Sample Encoding: 16-bit Signed Integer PCM

480000 samples / (16000 samples / seconds) = 30 seconds 完全正确。引用手册,持续时间是“等于样本数除以采样率”。