收到 'UnmixedMeetingAudio' 缓冲区后立即创建转录 - 具有应用程序托管媒体的机器人

Create transcription from 'UnmixedMeetingAudio' buffer as soon as those are received - bot with application hosted media

我使用机器人框架 (.net) 创建了一个机器人,使用提供的示例 here 和应用程序托管媒体。 Bot 参加 Microsoft Teams 中的任何传入的点对点或群组呼叫。在会议中,当参与者在示例中提供的 CallHandler.cs class 内的 AudioMediaReceived 事件处理程序中发言时,我能够接收音频缓冲区。现在我想从中生成成绩单。我需要一些指导:

这可以在会议结束时完成吗,我很困惑,因为它在许多地方 (1)(2)

"You may not use this SDK to record or otherwise persist media content from calls or meetings that your bot accesses"

.

这适用于哪种情况?是否可以从收到的字节数组(UnmixedAudioBuffer 数据)中生成 wave(.wav) 文件并在会议结束时将其用于转录?

由于我们以非常快的速度(每秒 50 帧)接收音频帧,如果我要异步实时生成抄本,我应该怎么做。它是关于将缓冲区数据转换为 .wav 或内存流并使用一些云语音 service/API 吗? Microsoft 提供语音服务,Google 云提供语音转文本资源。 非常感谢您的指导。

出于您已经看到的原因,尝试让机器人为您转录会议是个坏主意。但是,您很幸运,因为 Microsoft 已经自动转录会议内容。

您可以按照此处的说明在 Teams 中录制会议:https://support.microsoft.com/en-us/office/record-a-meeting-in-teams-34dfbe7f-b07d-4a27-b4c6-de62f1348c24

如果将录制的会议保存到 Microsoft Stream,那么您甚至可以编辑文字记录。如果您将会议保存到 OneDrive 和 SharePoint,则此页面暗示该功能将来应该可用:https://support.microsoft.com/en-us/office/edit-the-transcript-of-a-meeting-recording-in-teams-2f461386-e39a-4444-b9e2-5787da1da11b