语音转文本大型音频文件 [Microsoft Speech API]

Speech-to-text large audio files [Microsoft Speech API]

使用 Microsoft Speech API 转录 medium/large 音频文件的最佳方法是什么,每个文件约 6-10 分钟?像批量音频文件转录之类的东西?

我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码来连续转录语音,但它在某个时候停止了转录。转录有什么限制吗?我只使用免费试用帐户 atm。

顺便说一句,我认为 Bing 语音 API 和新的语音服务 API 没有区别,对吗?

谢谢大家!

语音服务每月允许 5,000 次交易,免费试用期间每分钟 20 次,因此由于实时连续识别,有时您可能会超过每分钟 20 次的限制。

感谢您的反馈。

我同意示例(以及您正在查看的文档)不是很清楚,我们会尽快更新。

示例使用 RecognizeAsync,应该调用 RecognizeOnceAsync。它目前正试图 return 来自服务的第一个 FinalResult。您应该使用 Start/StopRecognizeAsync,并注册以接收结果事件。

再次抱歉,这里的文档不好,我们会尽快更新,并且可能会在刷新时重命名 API。

如果您有音频文件,您还可以使用批量转录功能。也许这有帮助? https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

干杯沃尔夫冈