说话人识别,注册的最大总输入长度

Speaker recognition, max total input length for enrollment

Azure Speaker Recognition V2 API 指定文本独立注册的最大输入长度为 300 秒,如果超过此长度,则应引发 403 错误。

我目前有配置文件中的 enrollmentsSpeachLength 和 enrollmentsLength 大于 300s 的配置文件。 这是过时的文档吗?最大长度增加了吗?超过 300 秒限制时会发生什么情况,是继续注册音频还是忽略它?

回复样本... 使用文件 Andy_textindependantmisssi.wav(12 秒,单声道 16kHz) 我们得到....

{“remainingEnrollmentsSpeechLength”:0.0,“profileId”:“xxxxxx-xxxxxx-xxxxx-xxxxx-xxxxxx”,“enrollmentStatus”:“已注册”,“enrollmentsCount”:22,“enrollmentsLength”:417.51,“enrollmentsSpeechLength ":363.4,"audioLength":12.33,"audioSpeechLength":8.67}

使用同一文件重试...

{“remainingEnrollmentsSpeechLength”:0.0,“profileId”:“xxxxxx-xxxxxx-xxxxx-xxxxx-xxxxxx”,“enrollmentStatus”:“已注册”,“enrollmentsCount”:23,“enrollmentsLength”:429.84,“enrollmentsSpeechLength ":372.07,"audioLength":12.33,"audioSpeechLength":8.67}

使用较短的文件 (myvoiceismypassport) 文件重试...(2.4 秒)

{“remainingEnrollmentsSpeechLength”:0.0,“profileId”:“xxxxxx-xxxxxx-xxxxx-xxxxx-xxxxxx”,“enrollmentStatus”:“已注册”,“enrollmentsCount”:24,“enrollmentsLength”:432.8,“enrollmentsSpeechLength ":374.81,"audioLength":2.96,"audioSpeechLength":2.74}

感谢报告!

这是一个已知问题,已被标记。观察到的行为的修复计划在 12 月的第一周(暂定)。

话虽如此,根据文档,300 秒 是最大注册长度的正确数字(提到的修复程序应该可以防止将来出现这种情况)。

对于给您带来的不便,我们深表歉意。