我们可以使用 Google Chrome 中的网络语音 API 来识别来自用户麦克风以外的其他来源的语音吗?

Can we use the Web Speech API in Google Chrome to recognize speech coming from other sources than the user's microphone?

我想使用 Google Chrome 中的网络语音 API 来识别来自网页上 HTML5 <video> 的语音。有没有一种方法可以将网络语音 API 与来自用户麦克风以外的其他地方的音频输入一起使用?

在 MDN (https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API) 上它说:

Speech recognition is accessed via the SpeechRecognition interface, which provides the ability to recognize voice context from an audio input (normally via the device's default speech recognition service)

但它没有明确说明此音频输入是否可以来自用户麦克风以外的其他地方,或者是否必须完全来自用户麦克风。

我要自己回答。或许能帮到有同样疑问的人。

经过更多研究后,我发现 2014 年 Chronium 项目中出现了一个问题,使之成为可能:Issue 408940. It was even added to Chrome Platform Status as a proposed feature.

不幸的是,实施从未完成,功能已被删除。 (已于 2017 年 3 月移除,请参阅 Chronium 项目中的 Issue 701229)。