为什么音频文件加密在频域完成?

Why is audio file encryption done in frequency domain?

当我们要加密一个音频文件(wav/mp3)时,为什么加密是在频域进行的?我查看了一些音频加密方法,它们使用傅里叶变换,然后在频域中进行一些加密。为什么我们不直接从 wav/mp3 文件中取出数据 (int/float),对其进行加密,然后将其作为 wav/mp3 文件写回?频域加密有什么优势吗?

我发现的一些音频加密算法: http://ijcsit.com/docs/Volume%205/vol5issue03/ijcsit20140503393.pdf

毫无疑问,由于大多数音频编解码器也使用其频域表示,因此信息效率更高。当每个频域 bin 只需要在复平面上存储三个参数(频率、幅度和相位)或更简洁的(aj + bi)时,时域中的任意音频曲线可以通过少量的那些频率箱使得对更多信息密集表示执行加密变得很有吸引力。一旦进入频域,它也更容易丢弃非人类感知的频率,从而减少负载。当在压缩和加密的频域中时,一个关键的好处是减少了计算需求。

所以典型的数据流会给你

raw audio in PCM format ( time domain ) -> fft -> freq domain -> encryption -> decryption -> freq domain back again -> inverse fft -> resurrected raw audio

如果您不受这些限制,直接在时域中进行音频加密是完全可行的。请记住,一旦你处理了时域信号,它的频域表示将需要每单位时间更多的信息(space + 计算),因此更难压缩