样本如何在音频文件中对齐?
How samples are aligned in the audio file?
我正在尝试更好地了解样本在音频文件中的排列方式。
假设我们有一个 2s
音频文件 sampling rate = 3
。
我认为有三种可能的方法来对齐这些样本。看看下面的图片,你能告诉我哪个是正确的吗?
此外,这是所有音频文件的标准还是不同的格式有不同的规则?
干杯!
音频中的采样率通常告诉您一秒内有多少样本,单位称为赫兹。严格来说,正确答案是 (1),因为您在一秒钟内有 3 个样本。假设没有延迟,PCM 和其他格式规定音频从 0
开始。下一个“周期”(下一秒)也从零开始,与时钟相同的原理。
要获得音频的总长度(评论中的问题),您应该简单地取 number of samples / rate
。使用 soxi 的 30s WAV 示例,这是社区中用于声音处理的规范工具之一:
Input File : 'book_00396_chp_0024_reader_11416_5_door_Freesound_validated_380721_0-door_Freesound_validated_381380_0-9IfN8dUgGaQ_snr10_fileid_1138.wav'
Channels : 1
Sample Rate : 16000
Precision : 16-bit
Duration : 00:00:30.00 = 480000 samples ~ 2250 CDDA sectors
File Size : 960k
Bit Rate : 256k
Sample Encoding: 16-bit Signed Integer PCM
480000 samples / (16000 samples / seconds) = 30 seconds
完全正确。引用手册,持续时间是“等于样本数除以采样率”。
我正在尝试更好地了解样本在音频文件中的排列方式。
假设我们有一个 2s
音频文件 sampling rate = 3
。
我认为有三种可能的方法来对齐这些样本。看看下面的图片,你能告诉我哪个是正确的吗?
此外,这是所有音频文件的标准还是不同的格式有不同的规则?
干杯!
音频中的采样率通常告诉您一秒内有多少样本,单位称为赫兹。严格来说,正确答案是 (1),因为您在一秒钟内有 3 个样本。假设没有延迟,PCM 和其他格式规定音频从 0
开始。下一个“周期”(下一秒)也从零开始,与时钟相同的原理。
要获得音频的总长度(评论中的问题),您应该简单地取 number of samples / rate
。使用 soxi 的 30s WAV 示例,这是社区中用于声音处理的规范工具之一:
Input File : 'book_00396_chp_0024_reader_11416_5_door_Freesound_validated_380721_0-door_Freesound_validated_381380_0-9IfN8dUgGaQ_snr10_fileid_1138.wav'
Channels : 1
Sample Rate : 16000
Precision : 16-bit
Duration : 00:00:30.00 = 480000 samples ~ 2250 CDDA sectors
File Size : 960k
Bit Rate : 256k
Sample Encoding: 16-bit Signed Integer PCM
480000 samples / (16000 samples / seconds) = 30 seconds
完全正确。引用手册,持续时间是“等于样本数除以采样率”。