使用 Azure 对 3 个以上的说话人进行说话人分类

Speaker diarization for 3+ speakers using Azure

Azure 的批量转录是否支持超过 2 个说话人的说话人分类?

我检查了他们的 Rest API 文档,但没有找到任何相关内容。

是否有其他方法可以使用 Azure 认知服务来做到这一点?

Does Azure's batch transcription support speaker diarization for more than 2 speakers?

不,Azure Azure 的批量转录目前不支持超过 2 个说话者的说话者区分。

为了二值化,说话者被标识为 12。 要请求二值化,请将 diarizationEnabled 属性 设置为 true

您可以参考此 github 问题,了解有关 azure 的批量转录超过 2 位发言者的类似对话。