Webkit 语音识别 API:单音节
Webkit Speech Recognition API: Single Syllables
我正在尝试使用 Webkit 语音识别 API 来识别单个音节,而不是完整的单词或句子。
由于这个 API 需要“语法”定义,我想知道是否有办法实现单音节识别。像“啊”或“bi”之类的东西。
谢谢
不幸的是,Web Speech API 无法做到这一点。虽然您可以创建自定义语法( 集合 个词),但您不能定义自定义词典或词汇表(它们是词本身)。在您的情况下,您需要定义一个自定义词汇表,其中包括单个音素作为单词,然后将语法限制为仅从自定义词汇表中选择单词。有一些付费 cloud-based 服务可让您执行此操作。
例如,使用 IBM Watson,您可以 create a custom language model and then add words to the model (in your case, each phoneme would be a "word"). Normally, a custom language model is blended with a general language model, but you wouldn't want that, so you would set the customization weight 到 1.0(这意味着它将 仅 使用您的自定义语言模型)。
您也可以通过其他方式解决此问题,但我怀疑您是否会找到不涉及付费服务的纯粹 web-based 解决方案。如果您能够迁移到本机平台(或在服务器上创建您自己的 web-based 服务),那么您还有更多选择。例如,CMUSphinx 将允许您 create a custom dictionary 与服务器上的 Sphinx4 或移动设备上的 PocketSphinx 一起使用。尽管 CMUSphinx 不是 large-vocabulary 应用程序最准确的系统,但您的自定义词汇表会很小,因此 CMUSphinx 会表现得很好。
我正在尝试使用 Webkit 语音识别 API 来识别单个音节,而不是完整的单词或句子。 由于这个 API 需要“语法”定义,我想知道是否有办法实现单音节识别。像“啊”或“bi”之类的东西。
谢谢
不幸的是,Web Speech API 无法做到这一点。虽然您可以创建自定义语法( 集合 个词),但您不能定义自定义词典或词汇表(它们是词本身)。在您的情况下,您需要定义一个自定义词汇表,其中包括单个音素作为单词,然后将语法限制为仅从自定义词汇表中选择单词。有一些付费 cloud-based 服务可让您执行此操作。
例如,使用 IBM Watson,您可以 create a custom language model and then add words to the model (in your case, each phoneme would be a "word"). Normally, a custom language model is blended with a general language model, but you wouldn't want that, so you would set the customization weight 到 1.0(这意味着它将 仅 使用您的自定义语言模型)。
您也可以通过其他方式解决此问题,但我怀疑您是否会找到不涉及付费服务的纯粹 web-based 解决方案。如果您能够迁移到本机平台(或在服务器上创建您自己的 web-based 服务),那么您还有更多选择。例如,CMUSphinx 将允许您 create a custom dictionary 与服务器上的 Sphinx4 或移动设备上的 PocketSphinx 一起使用。尽管 CMUSphinx 不是 large-vocabulary 应用程序最准确的系统,但您的自定义词汇表会很小,因此 CMUSphinx 会表现得很好。