不确定将每个加载为 2 个字节的双精度值规范化

Question

我用来将 .wav 文件数据读入二维数组的代码：

        int signal_frame_width = wavHeader.SamplesPerSec / 100; //10ms frame
        int total_number_of_frames = numSamples / signal_frame_width;
        double** loadedSignal = new double *[total_number_of_frames]; //array that contains the whole signal

        int iteration = 0;
        int16_t* buffer = new int16_t[signal_frame_width];
        while ((bytesRead = fread(buffer, sizeof(buffer[0]), signal_frame_width, wavFile)) > 0)
        {
            loadedSignal[iteration] = new double[signal_frame_width];
            for(int i = 0; i < signal_frame_width; i++){
                //value normalisation:
                int16_t c = (buffer[i + 1] << 8) | buffer[i];
                double normalisedValue = c/32768.0;

                loadedSignal[iteration][i] = normalisedValue;
            }
            iteration++;
        }

问题出在这部分，我不太明白它是如何工作的：

int16_t c = (buffer[i + 1] << 8) | buffer[i];

这是取自 here 的示例。我只处理 16 位 .wav 文件。如您所见，我的缓冲区正在加载（例如采样频率 = 44.1kHz）441 个元素（每个元素都是 2 字节带符号的样本）。我应该如何更改上面的代码？

Answer 1

您构建代码的原始示例使用了一个数组，其中每个单独的元素代表一个字节。因此它需要将两个连续的字节组合成一个 16 位的值，这就是这一行所做的：

int16_t c = (buffer[i + 1] << 8) | buffer[i];

它将索引 i+1 处的字节（此处假定为最高有效字节）左移 8 个位置，然后将索引 i 处的字节与其进行或运算。例如，如果 buffer[i+1]==0x12 和 buffer[i]==0x34，那么您会得到

buffer[i+1] << 8 == 0x12 << 8 == 0x1200
0x1200 | buffer[i] == 0x1200 | 0x34 == 0x1234

（| 运算符是按位或。）

请注意，您需要注意您的 WAV 文件是 little-endian 还是 big-endian（但是 original post 解释得很好）。

现在，如果将结果值存储在 有符号 16 位整数中，您将得到介于 −32768 和 +32767 之间的值。实际归一化步骤（除以 32768）的要点只是将值范围降低到 [−1.0, 1.0]。

在你上面的例子中，你似乎已经读入了一个 16 位值的缓冲区。请注意，只有当您的平台的字节序与您正在使用的 WAV 文件的字节序相匹配时，您的代码才会起作用。但是如果这个假设是正确的，那么你不需要你不理解的代码行。您可以直接将每个数组元素转换为双精度数：

double normalisedValue = buffer[i]/32768.0;

Answer 2

如果 buffer 是一个字节数组，那么这段代码会将两个连续的字节解释为一个 16 位整数（假设 little-endian 编码）。 | 运算符将对两个字节的位执行 bit-wise OR。由于我们希望将这两个字节解释为单个 2 字节整数，因此我们必须将其中一个字节的位向左移动 8 位（1 字节）。哪一个取决于它们是按 little-endian 还是 big-endian 顺序排列。 Little-endian表示最低有效字节在前，所以我们将第二个字节向左移动8位。

示例：

First byte: 0101 1100
Second byte: 1111 0100

现在移动第二个字节：

Second "byte": 1111 0100 0000 0000
First "byte":  0000 0000 0101 1100

按位OR-operation（如果其中一个为1，则为1。如果均为0，则为0）： 16 位整数：1111 0100 0101 1100

然而，在您的情况下，您的文件中的字节已经被解释为 16 位整数，使用平台具有的任何字节顺序。所以你不需要这一步。但是，为了正确解释文件中的字节，必须假定与写入时相同的 byte-order。因此，通常添加此步骤以确保代码独立于平台的字节顺序工作，而不是依赖文件的预期 byte-order（因为大多数文件格式将指定 byte-order 应该是什么）。

不确定将每个加载为 2 个字节的双精度值规范化

Unsure of normalising double values loaded as 2 bytes each

c++

double

wav