Opus encode & decode 没有错误但不是相同的值
Opus encode & decode no error but not the same value
我必须使用 Opus Codec 在 C++ 中编码和解码音频数据,并且我必须封装函数。
所以我尝试发送一个浮点数数组来尝试对其进行编码,然后对 Opus 编码函数的结果进行解码。不幸的是,结果不一样,我得到的 table 不包含初始 table.
的任何值
这是我的代码。
封装:
std::vector<float> codec::OpusPlugin::decode(packet_t &packet) {
std::vector<float> out(BUFFER_SIZE * NB_CHANNELS);
int ret = 0;
if (!this->decoder)
throw Exception("Can't decode since there is no decoder.");
ret = opus_decode_float(this->decoder, packet.data.data(), packet.size, reinterpret_cast<float*>(out.data()), FRAME_SIZE, 0);
if (ret < 0)
throw Exception("Error while decoding compressed data.");
return out;
}
// ENCODER
packet_t codec::OpusPlugin::encode(std::vector<float> to_encode) {
std::vector<unsigned char> data(BUFFER_SIZE * NB_CHANNELS * 2);
packet_t packet;
int ret = 0;
if (!this->encoder)
throw Exception("Can't encode since there is no decoder.");
ret = opus_encode_float(this->encoder, reinterpret_cast<float const*>(to_encode.data()), FRAME_SIZE, data.data(), data.size());
if (ret < 0)
throw Exception("Error while encoding data.");
packet.size = ret;
packet.data = data;
return packet;
}
还有函数的调用:
packet_t packet;
std::vector<float> floats = {0.23, 0, -0.312, 0.401230, 0.1234, -0.1543};
packet = CodecPlugin->encode(floats);
std::cout << "packet size: " << packet.size << std::endl;
std::vector<float> output = CodecPlugin->decode(packet);
for (int i = 0; i < 10; i++) {
std::cout << output.data()[i] << " ";
}
这里是packet_t结构体,我在其中存储了encode的return值和unsigned char数组(编码值)
typedef struct packet_s {
int size;
std::vector<unsigned char> data;
} packet_t;
程序的输出是
*-1.44487e-15 9.3872e-16 -1.42993e-14 7.31834e-15 -5.09662e-14 1.53629e-14 -8.36825e-14 3.9531e-14 -8.72754e-14 1.0791e-13 这不是数组我在开头初始化。
我看了很多次文档和代码示例,但我不知道我在哪里做错了。
我希望你能帮助我。
谢谢:)
我们没有看到您如何初始化编码器和解码器,因此我们不知道它们的采样率、复杂度或通道数是多少。无论您如何初始化它们,您仍然会遇到以下问题:
First Opus 编码不支持任意帧大小,而是支持 2.5ms、5ms、10ms、20、40ms 或 60ms RFC 6716 - Definition of the Opus Audio Codec 相关部分 2.1.4。此外,opus 仅支持 8kHz、12kHz、16kHz、24kHz 或 48kHz 采样率。无论您选择了哪一个,您的 10 元素数组都不符合任何受支持的帧大小。
其次,Opus 编解码器是一种有损音频编解码器。这意味着在对任何信号进行编码后,您将永远(可能除了某些边缘情况)无法在解码编码的 opus 帧后重建原始信号。测试编码器和解码器是否工作的最佳方法是使用真实的音频样本。 Opus 编码保留了音频文件的感知质量。因此,如果您尝试使用任意数据对其进行测试,即使您正确实现了编码和解码功能,也可能无法获得预期的结果。
你可以很容易地做一个2000Hz的正弦函数(网上有很多例子)20ms。如果您想使用 8kHz,这意味着 160 个阵列元素以 8000Hz 的采样率。 2kHz 的正弦波在人类听觉范围内,因此编码器将保留它。然后解码回来,看看输入和输出数组的元素是否相似,因为我们已经确定它们不太可能相同。
我不擅长C++,所以我无法帮助您提供代码示例,但无论使用什么语言,上述问题都是正确的。
我必须使用 Opus Codec 在 C++ 中编码和解码音频数据,并且我必须封装函数。 所以我尝试发送一个浮点数数组来尝试对其进行编码,然后对 Opus 编码函数的结果进行解码。不幸的是,结果不一样,我得到的 table 不包含初始 table.
的任何值这是我的代码。
封装:
std::vector<float> codec::OpusPlugin::decode(packet_t &packet) {
std::vector<float> out(BUFFER_SIZE * NB_CHANNELS);
int ret = 0;
if (!this->decoder)
throw Exception("Can't decode since there is no decoder.");
ret = opus_decode_float(this->decoder, packet.data.data(), packet.size, reinterpret_cast<float*>(out.data()), FRAME_SIZE, 0);
if (ret < 0)
throw Exception("Error while decoding compressed data.");
return out;
}
// ENCODER
packet_t codec::OpusPlugin::encode(std::vector<float> to_encode) {
std::vector<unsigned char> data(BUFFER_SIZE * NB_CHANNELS * 2);
packet_t packet;
int ret = 0;
if (!this->encoder)
throw Exception("Can't encode since there is no decoder.");
ret = opus_encode_float(this->encoder, reinterpret_cast<float const*>(to_encode.data()), FRAME_SIZE, data.data(), data.size());
if (ret < 0)
throw Exception("Error while encoding data.");
packet.size = ret;
packet.data = data;
return packet;
}
还有函数的调用:
packet_t packet;
std::vector<float> floats = {0.23, 0, -0.312, 0.401230, 0.1234, -0.1543};
packet = CodecPlugin->encode(floats);
std::cout << "packet size: " << packet.size << std::endl;
std::vector<float> output = CodecPlugin->decode(packet);
for (int i = 0; i < 10; i++) {
std::cout << output.data()[i] << " ";
}
这里是packet_t结构体,我在其中存储了encode的return值和unsigned char数组(编码值)
typedef struct packet_s {
int size;
std::vector<unsigned char> data;
} packet_t;
程序的输出是 *-1.44487e-15 9.3872e-16 -1.42993e-14 7.31834e-15 -5.09662e-14 1.53629e-14 -8.36825e-14 3.9531e-14 -8.72754e-14 1.0791e-13 这不是数组我在开头初始化。
我看了很多次文档和代码示例,但我不知道我在哪里做错了。 我希望你能帮助我。
谢谢:)
我们没有看到您如何初始化编码器和解码器,因此我们不知道它们的采样率、复杂度或通道数是多少。无论您如何初始化它们,您仍然会遇到以下问题:
First Opus 编码不支持任意帧大小,而是支持 2.5ms、5ms、10ms、20、40ms 或 60ms RFC 6716 - Definition of the Opus Audio Codec 相关部分 2.1.4。此外,opus 仅支持 8kHz、12kHz、16kHz、24kHz 或 48kHz 采样率。无论您选择了哪一个,您的 10 元素数组都不符合任何受支持的帧大小。
其次,Opus 编解码器是一种有损音频编解码器。这意味着在对任何信号进行编码后,您将永远(可能除了某些边缘情况)无法在解码编码的 opus 帧后重建原始信号。测试编码器和解码器是否工作的最佳方法是使用真实的音频样本。 Opus 编码保留了音频文件的感知质量。因此,如果您尝试使用任意数据对其进行测试,即使您正确实现了编码和解码功能,也可能无法获得预期的结果。
你可以很容易地做一个2000Hz的正弦函数(网上有很多例子)20ms。如果您想使用 8kHz,这意味着 160 个阵列元素以 8000Hz 的采样率。 2kHz 的正弦波在人类听觉范围内,因此编码器将保留它。然后解码回来,看看输入和输出数组的元素是否相似,因为我们已经确定它们不太可能相同。
我不擅长C++,所以我无法帮助您提供代码示例,但无论使用什么语言,上述问题都是正确的。