已经训练好的用于单词识别的 HMM 模型

Already trained HMM model for word recognition

我已经使用自动编码器实现了一个音素分类器（给定一个音频文件数组，它 returns 所有可识别的音素）。我想扩展这个项目，以便可以进行单词识别。是否存在可以识别给定音素列表的单词的已经训练好的 HMM 模型（英文）？

谢谢大家

我不知道有什么解码器可以帮助您。语音识别软件不是这样工作的。

通常这样的事情需要动态波束搜索的自定义实现。这不是一项艰巨的任务，可能只有 100 行代码。它还取决于您的语音解码器生成的内容。它是语音格（理想情况下）还是带分数的 1-best 结果或没有分数的 1-best 结果。

如果你有合适的 lattice，你可能想尝试 openfst 工具包，你将 LM 和字典转换为 FST，然后与 lattice FST 组合，然后使用 fstbestpath 找到最佳路径。不过，您可以简单地编写一个动态搜索，而不是所有这些语音转换。

百度在他们的项目中也是将语音转换为字母，然后使用语言模型固定字母顺序。但是他们说没有语言模型它也同样有效。