Google 语音 api 输出每次都会改变

Google Speech api output changes every time for the same

Google 同一音频文件的语音 API 输出每次都会发生变化。有没有办法获得相同的输出或修复转录器使用的模型?

您可能正在使用 "default" 模型。建议用于音频。但我发现(而且我并不孤单)它并不是那么好。您最好使用 "video" 模型(它是增强模型之一,需要数据记录)。我建议您尝试使用视频模型,即使您只是转录音频。

此外,如果您在要转录的文件中有共同的主题,请尝试向 API 提供一些共同的短语。当你这样做时,结果会改善很多并且有点稳定。 (参考:SpeechContext