Sphinx4 找出正确的模型

Sphinx4 figuring out correct models

我正在尝试使用 Sphinx4 库进行语音识别,但我似乎无法找出声学模型-词典-语言模型的正确组合。我尝试了各种组合,但每次都会出现不同的错误。

我正在尝试按照 http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 上的教程进行操作。如果我使用 ConfigurationManager 而不是 Configuration,我没有 config.xml,因为没有可感知的方式将配置文件的位置传递给 Configuration 本身(ConfigMgr 将其作为构造函数的参数);那可能是我的问题。我只是不知道如何指向一个,并且由于教程说 "It is possible to configure low-level components of the application through XML file although you should do that ONLY IF you understand what is going on.",我假设 config.xml 文件不是强制性的。

将最新词典(7b - 从 Sourceforge 获得)与最新声学模型(cmusphinx-en-us-5。2.tar.gz - 再次来自 SF)和语言模型(cmusphinx-5.0-en)相结合-us.lm.gz - 再次来自 SF)在 startRecognition 中产生 NullPointerException。该问题类似于此处的问题:sphinx-4 NullPointerException at startRecognition,但答案中给出的link 不再有效。我从 SF 获得了 0.7a(因为那是 link 似乎指向的字典),但是当我使用那个时,我在执行 Error loading word: ;;; 时变得更早。我尝试从 Github 存储库下载最新模型和字典,结果是 java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128.

非常感谢任何帮助!

您需要使用来自 github

的最新代码

http://github.com/cmusphinx/sphinx4

如教程所述

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

正确的模型(en-us)已经包含在内,您不应该替换任何东西。您不应配置任何 XML 文件,使用源中提供的示例。