有没有办法使用 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据？

Is there a way to use the raw audio data using technologies as Alexa or DialogFlow.ai?

speech-recognition
speech-to-text
voice-recognition
alexa
web-audio-api

我正在开发一个使用语音识别的应用程序来帮助盲人学习音乐。为此，我正在考虑使用 DialogFlow.ai，甚至 Amazon Alexa，以免重复造轮子。因此，有时我想使用原始音频数据来检查乐器是否已调音。使用这些技术，默认情况下，所有音频输入都会被解释，并因此转换为文本。那么，有没有办法使用原始音频数据而不是解释用户语音？

出于多种原因（主要是安全性），Amazon Alexa 和其他类似技术不允许您获取用户的原始输入。使用 Amazon Alexa 作为捕获乐器音频输入的方式并不是实现调谐器的合理方式。您应该实现自己的方式来捕获音频，并可能将其与 Alexa/DialogFlow 结合使用以进行命令解释。

有没有办法使用 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据？

Is there a way to use the raw audio data using technologies as Alexa or DialogFlow.ai?

speech-recognition

speech-to-text

voice-recognition

alexa

web-audio-api