使用 sphinx4 解码 ALAW 格式的 phone 个调用

Decoding phone calls in ALAW format with sphinx4

我们计划开发一个系统,使用 sphinx4 将 phone 呼叫中获得的语​​音转换为文本。 这种 phone 调用的格式是
类型:音频
编解码器:PCM ALAW
频道:单声道
采样率:8kHz 比特率:每秒 8 位

tutorial 中写着

如果您使用的是采样率为 8KHz 的声音文件(telephone 音频),您需要更改 etc/sphinx_train.cfg[=30= 中的一些值]

除此之外,还有其他需要做的改变吗?
是否可以开发比特率为 8 bits/sec 的系统,因为在教程中它说

“拥有特定格式的音频文件至关重要。 Sphinxtrain 确实支持多种采样率,但默认情况下它被配置为从 MS WAV 格式的 16khz 16 位单声道文件进行训练。”

In the tutorial it says

本教程与您无关。您需要遵循的正确教程是 http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Are there any other changes to be done apart from this?

你根本不需要这样的改变

Is it possible to develop a system for bit rate of 8 bits/sec because in the tutorial it says

您需要将 ALAW 格式转换为 8khz 16bit PCM 格式。此转换必须使用外部工具(如 sox 或其他库)完成。然后你解码 8khz 16bit PCM 音频。

在 sphinx4 中正确解码 8khz 音频使用

  configuration.setSampleRate(8000)