如何使用 ibm cloud 转录 swift 中的长音频文件?
how to transcribe a long audio file in swift using ibm cloud?
我有一个 10mb 并将其分成 4mb(帧大小限制)3 个部分,然后发送 3 个调用:
speechToText.recognizeUsingWebSocket(audio: chunkData, settings: settings, callback: callback)
但时间戳不一致,每次调用都会重置为 0.0。
正确的方法是什么?
您正在对 STT 服务进行三个单独的调用,这就是时间戳重置的原因。您需要在同一呼叫中发送 10MB。
我有一个 10mb 并将其分成 4mb(帧大小限制)3 个部分,然后发送 3 个调用:
speechToText.recognizeUsingWebSocket(audio: chunkData, settings: settings, callback: callback)
但时间戳不一致,每次调用都会重置为 0.0。 正确的方法是什么?
您正在对 STT 服务进行三个单独的调用,这就是时间戳重置的原因。您需要在同一呼叫中发送 10MB。