语音分析 自动语音识别、多说话人分离、情绪、说话人重叠

Speech Analytics Automated speech recognition, multiple speaker separation, emotions,speaker overlapping

是否有任何公司提供 Apis 此服务?

语音、音频分析, 自动语音识别, 多扬声器分离, 情绪, 说话人重叠(检测同时说话的说话人)。

我的项目需要检测音频中的扬声器并将它们分开,还要检测扬声器之间是否有任何碰撞(重叠)(一起说话)。

现在我使用 DeepAffect,但他们的支持很差,所以我正在寻找另一家处理该问题的公司

注意:我在下面写的服务我已经检查过了,它对我的​​目标没有用。

-symbl.ai

-Cloud Speech-to-Text - 语音识别 | Google云

-azure 认知服务

-Amazon Connect 的 AI 支持的语音分析

不太清楚您 expect/have 的设置类型。

云服务? On-Prem?什么尺码?

您可以查看以下提供此类解决方案的公司Phonexia。 https://www.phonexia.com/en/ 这里列出了他们的解决方案可能提供的 API 和功能:https://download.phonexia.com/docs/spe/