如何获取 Google Cloud Speech(语音到文本)以识别字母和声音
How to get Google Cloud Speech (voice-to-text) to recognize letters and sounds
有没有办法让 Google Cloud Speech API 识别字母和字母发音?
作为一个示例用例,如果我想构建一个拼写游戏,其中一个声音会说 "Spell restaurant" 并且识别器会监听每个字母并在它们出现时识别它们。
同样,有没有办法识别特定字母的发音,例如:"oo"、"ew"、"k"(如 cat)或 "s"(如 circle ).
至少在某些情况下,它似乎已经做了合理的工作。例如,当我拼出 "cee ay tee" 时,它会识别 "c a t"。也可以按照 post:
中的描述提供 "word hints"
Google Cloud Speech API word Hints
提供单字母列表 "words" 作为提示,即
phrases = ['a', 'b', 'c', 'd' ... ]
这方面的结果似乎有所改善。
有没有办法让 Google Cloud Speech API 识别字母和字母发音?
作为一个示例用例,如果我想构建一个拼写游戏,其中一个声音会说 "Spell restaurant" 并且识别器会监听每个字母并在它们出现时识别它们。
同样,有没有办法识别特定字母的发音,例如:"oo"、"ew"、"k"(如 cat)或 "s"(如 circle ).
至少在某些情况下,它似乎已经做了合理的工作。例如,当我拼出 "cee ay tee" 时,它会识别 "c a t"。也可以按照 post:
中的描述提供 "word hints"Google Cloud Speech API word Hints
提供单字母列表 "words" 作为提示,即
phrases = ['a', 'b', 'c', 'd' ... ]
这方面的结果似乎有所改善。