如何使用 PocketSphinx Android 提高启动时的语音识别？

Question

我在 Android 上使用 PocketSphinx。识别器初始化后，我启动一个关键字侦听器。起初，识别器不会匹配任何东西。但是，几秒钟后，识别器开始匹配具有出色性能的关键字（在初始测试中大约有 3% 的 WER）。开始匹配所需的时间取决于 word/phrase。这似乎也取决于你说这个词的次数。例如，"plus" 的匹配速度非常快，通常是在第一或第二个话语中，平均需要 2 秒才能匹配。 "A little help please"，另一方面需要大约 10 秒，或大约 8-10 句话。一旦任何关键字匹配，Sphinx 就会进入所有关键字的高性能模式。因此，一种解决方法（虽然不是很好）是在初始化完成后立即说 "plus" 。在没有匹配发生的时候，onBeginningOfSpeech()和onEndOfSpeech()被Sphinx调用，对应关键短语或关键字的发音。

关键字文件：

cancel last
a little help please
add new cut/1e-35/
set material
set quantity
plus/5e-2/
minus/5e-2/

我正在使用 pocketsphinx-android-5prealpha-nolib.jar，并且（如果它有所不同）已经在三星 Galaxy-S3 和摩托罗拉 Moto E（第二代）上进行了测试.戴不戴耳机都是一样的问题

Answer 1

使用 PocketSphinx 演示附带的标准模型，en-us-ptm。它是一个轻量级*模型，并在 feat.params 文件中设置了默认 CMN 值。由于设置了 CMN 值，Sphinx 不必在启动时花时间设置它们，这意味着在启动时获得质量识别结果没有延迟。与我测试过的其他模型相比，默认模型的整体识别结果与我的命令和控制语法非常相似。

* 小于 7MB，而像 Voxforge 这样的其他一些软件是它的两倍多

如何使用 PocketSphinx Android 提高启动时的语音识别？

How do I improve speech recognition on startup with PocketSphinx Android?

speech-recognition

pocketsphinx-android