如何在 Google Cloud Speech-to-Text API 中禁用 sentence-level 自动更正

How to disable sentence-level auto correction in Google Cloud Speech-to-Text API

我正在处理一项语音识别任务，其中涉及检测children的说话能力，随着时间的推移...

我想将 Google Cloud Speech to Text API 用于检测的 ASR 部分。然后我会用不同测量的成绩单来估计进步。

但是！ Google 语音 API 的句子级自动更正始终重写口语句子的前肢...

有没有办法禁用此 ASR 的自动更正？

我无法使用 "speechContext"、"single_utterance" 或 "maxAlternatives" 选项绕过这个问题。

"single_utterance" 可以处理单词，但它可以纠正拼写错误..

有这方面的建议吗？

如果您使用流式处理而不是批量识别，您应该会在转录该部分音频后立即收到答复，而不是等待句子的其余部分。然后您应该只存储流提供的第一个答案，而不是进一步的更正。

这意味着您不必等到isFinal=True。

要快速了解我的意思，请转到 speech API page，然后运行在打开开发者工具的情况下进行流式测试。在那里你会看到在说出这些话时收到的流数据：