Python 中的实时语音到文本转录

Live Speech to Text Transcription in Python

这是我第一次 post，希望一切顺利。我正在研究 Raspberry Pi 零 W，我正在尝试制作实时语音到文本的翻译器。我已经研究过，我认为我需要使用 SpeechRecognition 模块，我一直在这样做，并且最终编写了一个程序来完成我使用 Google speech to text 模块所需的功能，它确实这份工作就是活不下去。我认为要让它实时转录，我需要使用 IBM Watson Speech to Text 和一种叫做 Websockets 的东西。

我似乎无法找到关于这两者的大量信息，但只有任何代码，如果你们中的任何人有任何使用这种或任何其他方式在 Python 中实时转录文本的经验，我会如果您能为我指出正确的方向，我将不胜感激，任何代码都会很棒。

Google 有现场语音转文字功能 API。他们还提供源代码以帮助您开始使用它。检查此 github page。它所做的只是聆听您的麦克风并实时向您发送您所说的任何内容的文本版本。

这是一个开箱即用的示例软件。您需要做的就是运行和您的 GOOGLE_APPLICATION_CREDENTIALS 保存在您的 environment variables.

如果您已经使用过一次，您应该已经设置了一个结算帐户。如果没有，请这样做 here.

Python 中的实时语音到文本转录

Live Speech to Text Transcription in Python

python

speech-recognition

raspberry-pi

ibm-watson