收到 'UnmixedMeetingAudio' 缓冲区后立即创建转录 - 具有应用程序托管媒体的机器人

Create transcription from 'UnmixedMeetingAudio' buffer as soon as those are received - bot with application hosted media

我使用机器人框架 (.net) 创建了一个机器人，使用提供的示例 here 和应用程序托管媒体。 Bot 参加 Microsoft Teams 中的任何传入的点对点或群组呼叫。在会议中，当参与者在示例中提供的 CallHandler.cs class 内的 AudioMediaReceived 事件处理程序中发言时，我能够接收音频缓冲区。现在我想从中生成成绩单。我需要一些指导：

这可以在会议结束时完成吗，我很困惑，因为它在许多地方 (1)(2)

"You may not use this SDK to record or otherwise persist media content from calls or meetings that your bot accesses"

这适用于哪种情况？是否可以从收到的字节数组（UnmixedAudioBuffer 数据）中生成 wave(.wav) 文件并在会议结束时将其用于转录？

由于我们以非常快的速度（每秒 50 帧）接收音频帧，如果我要异步实时生成抄本，我应该怎么做。它是关于将缓冲区数据转换为 .wav 或内存流并使用一些云语音 service/API 吗？ Microsoft 提供语音服务，Google 云提供语音转文本资源。非常感谢您的指导。

出于您已经看到的原因，尝试让机器人为您转录会议是个坏主意。但是，您很幸运，因为 Microsoft 已经自动转录会议内容。

您可以按照此处的说明在 Teams 中录制会议：https://support.microsoft.com/en-us/office/record-a-meeting-in-teams-34dfbe7f-b07d-4a27-b4c6-de62f1348c24

如果将录制的会议保存到 Microsoft Stream，那么您甚至可以编辑文字记录。如果您将会议保存到 OneDrive 和 SharePoint，则此页面暗示该功能将来应该可用：https://support.microsoft.com/en-us/office/edit-the-transcript-of-a-meeting-recording-in-teams-2f461386-e39a-4444-b9e2-5787da1da11b

收到 'UnmixedMeetingAudio' 缓冲区后立即创建转录 - 具有应用程序托管媒体的机器人

Create transcription from 'UnmixedMeetingAudio' buffer as soon as those are received - bot with application hosted media

speech-to-text

botframework

azure-speech

google-speech-to-text-api