非英语语言的语音到文本转换

Speech to text conversion for non-english language

我正在尝试为非英语语言实现简单的语音到文本的转换。用户说其他语言和文本的地方也是同一种语言。这可能吗?如果是的话,任何人都可以帮助提出如何实施它的想法吗?任何帮助都会提前 appreciated.Thanks。

任何商业语音识别解决方案都不太可能支持梵语,因此您唯一的选择是将对梵语的支持添加到 CMUSphinx 等开源引擎中。

这很简单,实际上您只需要按照文档进行操作即可。您还需要了解脚本语言,这将帮助您减少某些步骤的手动工作。

  1. 阅读介绍-CMUSphinx教程介绍成为 熟悉语音识别的概念——特征、声学 模型、语言模型等

  2. 尝试使用美国英语模型的 CMUSphinx 来了解事情的进展 工作。尝试使用示例美国英语 AN4 数据库进行训练。

  3. 在维基百科中了解您的语言

  4. 为您的语言收集一组转录录音 - 访谈、有声读物或自己录制。

  5. 根据您收集的数据,创建一个单词列表和一个 语音词典。大多数语音词典都可以创建 在您最喜欢的脚本中使用一个简单的规则和一个小脚本 像 Python 这样的语言。见 Generating a dictionary for details.

  6. 手动或使用 sphinx4 将音频分割成短句 对齐器,创建一个包含所需文件的数据库,如中所述 培训教程 Training Acoustic Model For CMUSphinx

  7. 将新模型集成到您的应用程序中并设计数据 collection 改进您的模型。

如有疑问,欢迎随时提问。 This paper也可能对您有所帮助。

相关问题是:

Burmese speech to text conversion in android?

Writing speech-recognition engine

Is it possible to write a speech-recognition engine from scratch?