样本如何在音频文件中对齐？

Question

我正在尝试更好地了解样本在音频文件中的排列方式。

假设我们有一个 2s 音频文件 sampling rate = 3。我认为有三种可能的方法来对齐这些样本。看看下面的图片，你能告诉我哪个是正确的吗？

此外，这是所有音频文件的标准还是不同的格式有不同的规则？

干杯！

Answer 1

音频中的采样率通常告诉您一秒内有多少样本，单位称为赫兹。严格来说，正确答案是 (1)，因为您在一秒钟内有 3 个样本。假设没有延迟，PCM 和其他格式规定音频从 0 开始。下一个“周期”（下一秒）也从零开始，与时钟相同的原理。

要获得音频的总长度（评论中的问题），您应该简单地取 number of samples / rate。使用 soxi 的 30s WAV 示例，这是社区中用于声音处理的规范工具之一：

Input File     : 'book_00396_chp_0024_reader_11416_5_door_Freesound_validated_380721_0-door_Freesound_validated_381380_0-9IfN8dUgGaQ_snr10_fileid_1138.wav'
Channels       : 1
Sample Rate    : 16000
Precision      : 16-bit
Duration       : 00:00:30.00 = 480000 samples ~ 2250 CDDA sectors
File Size      : 960k
Bit Rate       : 256k
Sample Encoding: 16-bit Signed Integer PCM

480000 samples / (16000 samples / seconds) = 30 seconds 完全正确。引用手册，持续时间是“等于样本数除以采样率”。

样本如何在音频文件中对齐？

How samples are aligned in the audio file?

audio

core-audio