从 voip 或 sip 系统获取实时音频流

getting realtime audio stream from voip or sip systems

我正在构建一个应用程序,它从我们组织的 VoIP 系统获取实时音频、记录通话并转录实时语音。转录然后传递给我们的分析引擎并获得见解。

我们能够转录录制的音频并从转录中获得见解。我们也有实时转录的解决方案。它会转录来自麦克风的声音,甚至还会转录 RTSP 流。我们无法找到从 SIP/VoIP 系统获取实时音频的解决方案。我读到 SIP 中继和选项以及 WebRTC 也是另一种选择。但我不知道如何以及从哪里开始。

我在 Java 和 Python 方面有经验,我请求专家给我建议或示例,以了解如何从 SIP/VoIP 对话中获取实时音频流。

我不熟悉 SIP/VoIP 也从未编写过 VoIP 应用程序。

可能适合您需要的解决方案是 Oreka,它是 Orecx 的开源版本,这是一种用于 VoIP 的通话录音软件。

我过去使用过它,它与使用 g711 (alaw,ulaw) 或 speex 等开放音频编解码器的 SIP 呼叫配合得很好,但它可能无法解码使用专有 g729 编解码器的呼叫音频 (那时我必须制定自己的编解码器)。

付费版本可能支持更多编解码器和协议,例如 Avaya 的 H323。

请记住,此应用通过嗅探网络运行,因此设置并不简单。不管怎样,我建议你试一试。

Link: https://www.orecx.com/open-source/

对于那里的任何人。如果您想从 VoIP 通话中访问 live/realtime 音频数据,我建议您使用 Twilio Streams。 如果您只是想在不访问实际音频数据的情况下获得实时转录,Twilio and Plivo 也可以提供。