语音识别和 Sphinx 入门

Getting started with Speech Recognition and Sphinx

Sphinx 似乎是 Java 语音识别的唯一真正选择。文档很少,需要高水平的领域知识。我使用了他们的启动程序示例,它适用于一个文件而不适用于另一个极其相似的文件。 有什么不同?让它更准确地工作的秘诀是什么。

这个文件,https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/52-welcome-wav/download works, but this one, https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/49-longwelcome-wav/download没有。
我注意到非工作文件有不同的采样率,所以我用一个程序将它转换为 16000,但仍然没有成功

确保仔细检查文件。根据 the docs your file must be either 8khz or 16khz and mono only. There are many tools available to do this -- I use audacity,但对于像这样的基本转换可能有点矫枉过正。