Azure 认知服务语音转文本 large/long 音频文件示例

Azure Cognitive Services Speech to Text large/long audio files sample

想转录几个长的(荷兰语)音频文件。它们是每个文件长度约为 60-120 分钟的访谈。只有 8 个我需要手动执行的文件,因此不一定是某些自动化软件的一部分。获得了一些 Azure 积分,因此考虑使用 Azure 认知服务语音转文本。在某处有样本吗?

试过这个样本:https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample。工作正常。但在音频短暂停顿后立即停止。

在这里看到了一个类似的问题:。但是发帖者并没有分享他是如何解决的。

有人可以帮忙吗?

对于较长的音频文件,我们建议使用批量转录 API。 这里有一个很好的解释:https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription and there are samples for C# and Python here: https://github.com/Azure-Samples/cognitive-services-speech-sdk/tree/master/samples/batch.