Sphinx4 找出正确的模型

Sphinx4 figuring out correct models

我正在尝试使用 Sphinx4 库进行语音识别，但我似乎无法找出声学模型-词典-语言模型的正确组合。我尝试了各种组合，但每次都会出现不同的错误。

我正在尝试按照 http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 上的教程进行操作。如果我使用 ConfigurationManager 而不是 Configuration，我没有 config.xml，因为没有可感知的方式将配置文件的位置传递给 Configuration 本身（ConfigMgr 将其作为构造函数的参数);那可能是我的问题。我只是不知道如何指向一个，并且由于教程说 "It is possible to configure low-level components of the application through XML file although you should do that ONLY IF you understand what is going on."，我假设 config.xml 文件不是强制性的。

将最新词典（7b - 从 Sourceforge 获得）与最新声学模型（cmusphinx-en-us-5。2.tar.gz - 再次来自 SF）和语言模型（cmusphinx-5.0-en）相结合-us.lm.gz - 再次来自 SF）在 startRecognition 中产生 NullPointerException。该问题类似于此处的问题：sphinx-4 NullPointerException at startRecognition，但答案中给出的link 不再有效。我从 SF 获得了 0.7a（因为那是 link 似乎指向的字典），但是当我使用那个时，我在执行 Error loading word: ;;; 时变得更早。我尝试从 Github 存储库下载最新模型和字典，结果是 java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128.

非常感谢任何帮助！

您需要使用来自 github

的最新代码

http://github.com/cmusphinx/sphinx4

如教程所述

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

正确的模型（en-us）已经包含在内，您不应该替换任何东西。您不应配置任何 XML 文件，使用源中提供的示例。