Google 语音 api 输出每次都会改变

Google Speech api output changes every time for the same

google-speech-api

Google 同一音频文件的语音 API 输出每次都会发生变化。有没有办法获得相同的输出或修复转录器使用的模型？

您可能正在使用 "default" 模型。建议用于音频。但我发现（而且我并不孤单）它并不是那么好。您最好使用 "video" 模型（它是增强模型之一，需要数据记录）。我建议您尝试使用视频模型，即使您只是转录音频。

此外，如果您在要转录的文件中有共同的主题，请尝试向 API 提供一些共同的短语。当你这样做时，结果会改善很多并且有点稳定。（参考：SpeechContext）