使用音频文件作为输入的 UWP 应用程序上的语音转文本

Speech to Text on UWP apps using Audio File as Input

我在网上找不到这个问题的答案。

我正在开发的项目要求我可以保存录制的音频文件,然后将音频转录为文本以查找有趣的预定义关键字。

我使用的是Windows.Media.SpeechRecognition框架,在录音过程中转录语音时,它工作正常。在同一框架中,我找不到可以将音频文件用作输入的函数。

有人知道解决这个问题的好方法吗?或者 Windows 应用程序的另一个 [免费] 框架?

对于在线识别,特别是在 JS 项目中,您可以直接使用 Microsoft Cognitive Services,它们在 Windows 中的 SpeechRecognition 在线识别后面。它在某些限制下是免费的。

特别是在 GitHub:Oxford.Speech.JS 上为 JavaScript 开源包装。它可以处理 wav 文件和麦克风。示例代码的设计类似于网站,但我很确定您可以轻松地将其转换为 HTML/JS-based UWP 应用程序。