Azure 认知服务的语音服务 (SST) 支持哪些音频格式?
What audio formats are supported by Azure Cognitive Services' Speech Service (SST)?
请记住,Microsoft/Azure 认知服务的 "Speech Service" 目前正在进行合理化工作,据我所知
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text
https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home
只有 .wav
个二进制文件是可接受的,任何其他给出响应的:
{"Message":"Unsupported audio format"}
有没有其他方法可以发现可接受的音频formats/encodings/etc,或者就是这样?
[关于在 python pydub
中预处理任意/.m4a
音频格式的提示的奖励积分,以便它们符合标准 - 目前适用于 .mp3
但不适用于.m4a
].
谢谢!
目前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。将来会添加更多格式和编解码器支持。
请记住,Microsoft/Azure 认知服务的 "Speech Service" 目前正在进行合理化工作,据我所知
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text
https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home
只有 .wav
个二进制文件是可接受的,任何其他给出响应的:
{"Message":"Unsupported audio format"}
有没有其他方法可以发现可接受的音频formats/encodings/etc,或者就是这样?
[关于在 python pydub
中预处理任意/.m4a
音频格式的提示的奖励积分,以便它们符合标准 - 目前适用于 .mp3
但不适用于.m4a
].
谢谢!
目前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。将来会添加更多格式和编解码器支持。