使用 Azure 对 3 个以上的说话人进行说话人分类

Speaker diarization for 3+ speakers using Azure

Azure 的批量转录是否支持超过 2 个说话人的说话人分类？

我检查了他们的 Rest API 文档，但没有找到任何相关内容。

是否有其他方法可以使用 Azure 认知服务来做到这一点？

Does Azure's batch transcription support speaker diarization for more than 2 speakers?

不，Azure Azure 的批量转录目前不支持超过 2 个说话者的说话者区分。

为了二值化，说话者被标识为 1 或 2。要请求二值化，请将 diarizationEnabled 属性设置为 true。

您可以参考此 github 问题，了解有关 azure 的批量转录超过 2 位发言者的类似对话。