使用 Microsoft Azure 进行批量转录 (REST API)
Batch transcription with Microsoft Azure (REST API)
我想使用 Microsoft 的 REST APIs 转录更长的音频文件(至少 5 分钟)。有很多不同的产品和名称,例如语音服务 API 或 Bing 语音 API。 None 目前为止我尝试过的 REST API 支持转录更长的音频文件。
文档指出有一个 REST API 正好适用于这种情况:
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription
此服务的端点是什么?
这里 GitHub 上有一个示例:https://github.com/PanosPeriorellis/Speech_Service-BatchTranscriptionAPI
端点是 CRIS 的端点,如下代码所示:
private const string HostName = "cris.ai";
// ...
var client = CrisClient.CreateApiV2Client(SubscriptionKey, HostName, Port);
然后我在文档上发现 API 暴露在 Swagger 上(link 可见 here),因此更容易探索可用的方法(从 2.0beta 切换到2.0 在上):
所以要创建一个新的转录,路径是:/api/speechtotext/v2.0/transcriptions
,用POST方法调用,所以完整的端点是:
- 西欧:https://westeurope.cris.ai/api/speechtotext/v2.0/transcriptions
- 美国西部:https://westus.cris.ai/api/speechtotext/v2.0/transcriptions
请注意,使用转录所需的订阅密钥级别必须是 Standard
级别定价 S0
,而不是 Free
级别。
我想使用 Microsoft 的 REST APIs 转录更长的音频文件(至少 5 分钟)。有很多不同的产品和名称,例如语音服务 API 或 Bing 语音 API。 None 目前为止我尝试过的 REST API 支持转录更长的音频文件。
文档指出有一个 REST API 正好适用于这种情况: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription
此服务的端点是什么?
这里 GitHub 上有一个示例:https://github.com/PanosPeriorellis/Speech_Service-BatchTranscriptionAPI
端点是 CRIS 的端点,如下代码所示:
private const string HostName = "cris.ai";
// ...
var client = CrisClient.CreateApiV2Client(SubscriptionKey, HostName, Port);
然后我在文档上发现 API 暴露在 Swagger 上(link 可见 here),因此更容易探索可用的方法(从 2.0beta 切换到2.0 在上):
所以要创建一个新的转录,路径是:/api/speechtotext/v2.0/transcriptions
,用POST方法调用,所以完整的端点是:
- 西欧:https://westeurope.cris.ai/api/speechtotext/v2.0/transcriptions
- 美国西部:https://westus.cris.ai/api/speechtotext/v2.0/transcriptions
请注意,使用转录所需的订阅密钥级别必须是 Standard
级别定价 S0
,而不是 Free
级别。