语音转文本大型音频文件 [Microsoft Speech API]
Speech-to-text large audio files [Microsoft Speech API]
使用 Microsoft Speech API 转录 medium/large 音频文件的最佳方法是什么,每个文件约 6-10 分钟?像批量音频文件转录之类的东西?
我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码来连续转录语音,但它在某个时候停止了转录。转录有什么限制吗?我只使用免费试用帐户 atm。
顺便说一句,我认为 Bing 语音 API 和新的语音服务 API 没有区别,对吗?
谢谢大家!
语音服务每月允许 5,000 次交易,免费试用期间每分钟 20 次,因此由于实时连续识别,有时您可能会超过每分钟 20 次的限制。
感谢您的反馈。
我同意示例(以及您正在查看的文档)不是很清楚,我们会尽快更新。
示例使用 RecognizeAsync,应该调用 RecognizeOnceAsync。它目前正试图 return 来自服务的第一个 FinalResult。您应该使用 Start/StopRecognizeAsync,并注册以接收结果事件。
再次抱歉,这里的文档不好,我们会尽快更新,并且可能会在刷新时重命名 API。
如果您有音频文件,您还可以使用批量转录功能。也许这有帮助? https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription
干杯沃尔夫冈
使用 Microsoft Speech API 转录 medium/large 音频文件的最佳方法是什么,每个文件约 6-10 分钟?像批量音频文件转录之类的东西?
我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码来连续转录语音,但它在某个时候停止了转录。转录有什么限制吗?我只使用免费试用帐户 atm。
顺便说一句,我认为 Bing 语音 API 和新的语音服务 API 没有区别,对吗?
谢谢大家!
语音服务每月允许 5,000 次交易,免费试用期间每分钟 20 次,因此由于实时连续识别,有时您可能会超过每分钟 20 次的限制。
感谢您的反馈。
我同意示例(以及您正在查看的文档)不是很清楚,我们会尽快更新。
示例使用 RecognizeAsync,应该调用 RecognizeOnceAsync。它目前正试图 return 来自服务的第一个 FinalResult。您应该使用 Start/StopRecognizeAsync,并注册以接收结果事件。
再次抱歉,这里的文档不好,我们会尽快更新,并且可能会在刷新时重命名 API。
如果您有音频文件,您还可以使用批量转录功能。也许这有帮助? https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription
干杯沃尔夫冈