如何在 Google Cloud Speech-to-Text API 中禁用 sentence-level 自动更正
How to disable sentence-level auto correction in Google Cloud Speech-to-Text API
我正在处理一项语音识别任务,其中涉及检测children的说话能力,随着时间的推移...
我想将 Google Cloud Speech to Text API 用于检测的 ASR 部分。然后我会用不同测量的成绩单来估计进步。
但是! Google 语音 API 的句子级自动更正始终重写口语句子的前肢...
有没有办法禁用此 ASR 的自动更正?
我无法使用 "speechContext"、"single_utterance" 或 "maxAlternatives" 选项绕过这个问题。
"single_utterance" 可以处理单词,但它可以纠正拼写错误..
有这方面的建议吗?
如果您使用流式处理而不是批量识别,您应该会在转录该部分音频后立即收到答复,而不是等待句子的其余部分。然后您应该只存储流提供的第一个答案,而不是进一步的更正。
这意味着您不必等到isFinal=True
。
要快速了解我的意思,请转到 speech API page,然后 运行 在打开开发者工具的情况下进行流式测试。在那里你会看到在说出这些话时收到的流数据:
我正在处理一项语音识别任务,其中涉及检测children的说话能力,随着时间的推移...
我想将 Google Cloud Speech to Text API 用于检测的 ASR 部分。然后我会用不同测量的成绩单来估计进步。
但是! Google 语音 API 的句子级自动更正始终重写口语句子的前肢...
有没有办法禁用此 ASR 的自动更正?
我无法使用 "speechContext"、"single_utterance" 或 "maxAlternatives" 选项绕过这个问题。
"single_utterance" 可以处理单词,但它可以纠正拼写错误..
有这方面的建议吗?
如果您使用流式处理而不是批量识别,您应该会在转录该部分音频后立即收到答复,而不是等待句子的其余部分。然后您应该只存储流提供的第一个答案,而不是进一步的更正。
这意味着您不必等到isFinal=True
。
要快速了解我的意思,请转到 speech API page,然后 运行 在打开开发者工具的情况下进行流式测试。在那里你会看到在说出这些话时收到的流数据: