如何使用 Python 从出站 Twilio 呼叫中检索信息并将其放入 google 语音到文本?

How to retrieve information from outbound Twilio call with Python and put it into google speech to text?

我是 twilio 的新手,所以我什至不知道语音呼叫流是如何工作的。我只有一项任务:我需要使用 twilio 拨打一个号码,并在对方停止说话时将语音放入 google 语音以发送文本。但我什至不明白如何实现它和 link 所有这些东西。我尝试使用 django 将调用重新定位到 google,但我不明白如何设置 webhook。我试图将语音直接发送到 google 语音,但我不知道如何操作。基本上,我处于死胡同,不明白我应该做什么。如何在直播中接到这个语音电话,如何发送到google。

@app.route("/call", methods=['GET', 'POST'])
def gather_call():
    resp = VoiceResponse()

    gather = Gather(input='speech', speechTimeout=5, action='/com')
    gather.say('Say something')
    resp.append(gather)
    return str(resp)

此处为 Twilio 开发人员布道师。

听起来您需要先放慢触摸速度并了解 Twilio 语音通话的工作原理。我建议您阅读 Programmable Voice Quickstart for Python,它教您如何使用 Flask 在 Python 中拨打和接听电话、处理 webhook 和控制语音呼叫。

完成后,您将更好地了解 Twilio、TwiML 和 webhook 的工作原理。

然后,如果您要将语音转换为文本,我将首先指导您 <Gather>. <Gather> helps you take user input on a phone call, you can take that input from the dial pad or with speech by setting the input attribute 到“语音”。这实际上在幕后使用 Google 云语音来发短信。

如果您确实需要将语音音频直接流式传输到 Google 语音到文本,那么您可以使用 <Stream>. This requires a websocket connection to stream the audio. There is an example Python application that shows you how to do real time transcription using <Stream> and the Google speech to text API

但在深入研究更复杂的部分之前,请先了解 Twilio 的工作原理。