INVALID_ARGUMENT：请求负载大小超过限制：10485760 字节

Question

我第一次使用 GCS Speech API 将一系列音频文件转换为文本的项目。每个文件大约有 60 分钟，并且是一个人在整个过程中不断地说话。我已经安装了 GC SDK 并使用它来执行如下所示的请求：

gcloud ml speech recognize-long-running \
"/path/to/file/audio.flac" \
--language-code="pt-PT" --async

每次我运行在我的其中一个录音中，它都会给出以下错误消息：

ERROR: (gcloud.ml.speech.recognize-long-running) INVALID_ARGUMENT: 
Request payload size exceeds the limit: 10485760 bytes.

这似乎是一个非常严格的限制，因为如果 API 能够处理长达 180 分钟的文件，它就不可能输出最多 10,000 个字符的语音.
我试图将音频文件分成更小的部分，并达到四个 15 分钟的样本，即使如此我也遇到了同样的错误。此外，即使它有效，将我从现在开始制作的每一个新录音都拆分出来也是一项非常乏味且不切实际的任务。

我一直在寻找，到目前为止我还没有得出关于如何增加或规避此限制的任何结论。我使用的是免费试用帐户，但很高兴升级到付费订阅以提高此限制。据我了解，即使我使用付费订阅，此限制也会持续存在。

有没有人找到解决这个问题的方法？

Answer 1

在与 Google 云支持人员交谈后，我得出的结论是，这是由于我的免费试用订阅和文件大小（约 60 分钟）的限制所致。

升级到付费订阅并将我的文件上传到 Google 云存储后，我能够从转录中接收有效载荷。

$ gcloud ml speech recognize-long-running "gs://test-bucket/my_audio_file.flac" --language-code="pt-PT" --async
Check operation [7456984365978465938] for status.
{
  "name": "7456984365978465938"
}

$ gcloud ml speech operations describe 7456984365978465938
{
  ... payload ...
}

INVALID_ARGUMENT：请求负载大小超过限制：10485760 字节

INVALID_ARGUMENT: Request payload size exceeds the limit: 10485760 bytes

speech-recognition

speech-to-text

google-speech-api