如何在 Google Cloud Speech-to-Text API 中禁用 sentence-level 自动更正

How to disable sentence-level auto correction in Google Cloud Speech-to-Text API

我正在处理一项语音识别任务,其中涉及检测children的说话能力,随着时间的推移...

我想将 Google Cloud Speech to Text API 用于检测的 ASR 部分。然后我会用不同测量的成绩单来估计进步。

但是! Google 语音 API 的句子级自动更正始终重写口语句子的前肢...

有没有办法禁用此 ASR 的自动更正?

我无法使用 "speechContext"、"single_utterance" 或 "maxAlternatives" 选项绕过这个问题。

"single_utterance" 可以处理单词,但它可以纠正拼写错误..

有这方面的建议吗?

如果您使用流式处理而不是批量识别,您应该会在转录该部分音频后立即收到答复,而不是等待句子的其余部分。然后您应该只存储流提供的第一个答案,而不是进一步的更正。

这意味着您不必等到isFinal=True

要快速了解我的意思,请转到 speech API page,然后 运行 在打开开发者工具的情况下进行流式测试。在那里你会看到在说出这些话时收到的流数据: