如何使用 PocketSphinx Android 提高启动时的语音识别?

How do I improve speech recognition on startup with PocketSphinx Android?

我在 Android 上使用 PocketSphinx。识别器初始化后,我启动一个关键字侦听器。起初,识别器不会匹配任何东西。但是,几秒钟后,识别器开始匹配具有出色性能的关键字(在初始测试中大约有 3% 的 WER)。开始匹配所需的时间取决于 word/phrase。这似乎也取决于你说这个词的次数。例如,"plus" 的匹配速度非常快,通常是在第一或第二个话语中,平均需要 2 秒才能匹配。 "A little help please",另一方面需要大约 10 秒,或大约 8-10 句话。一旦任何关键字匹配,Sphinx 就会进入所有关键字的高性能模式。因此,一种解决方法(虽然不是很好)是在初始化完成后立即说 "plus" 。在没有匹配发生的时候,onBeginningOfSpeech()和onEndOfSpeech()被Sphinx调用,对应关键短语或关键字的发音。

关键字文件:

cancel last
a little help please
add new cut/1e-35/
set material
set quantity
plus/5e-2/
minus/5e-2/

我正在使用 pocketsphinx-android-5prealpha-nolib.jar,并且(如果它有所不同)已经在三星 Galaxy-S3 和摩托罗拉 Moto E(第二代)上进行了测试.戴不戴耳机都是一样的问题

使用 PocketSphinx 演示附带的标准模型,en-us-ptm。它是一个轻量级*模型,并在 feat.params 文件中设置了默认 CMN 值。由于设置了 CMN 值,Sphinx 不必在启动时花时间设置它们,这意味着在启动时获得质量识别结果没有延迟。与我测试过的其他模型相比,默认模型的整体识别结果与我的命令和控制语法非常相似。

* 小于 7MB,而像 Voxforge 这样的其他一些软件是它的两倍多