IBM Watson 是否支持 "Speaker diarization"/"Speaker Recognition"?
Does IBM Watson support "Speaker diarization"/"Speaker Recognition"?
我在 https://speech-to-text-demo.mybluemix.net/ 玩 IBM Watson 的语音转文本演示。我上传了一个带有 2 个扬声器的音频文件。 Watson 返回没有说话人标识符的转录文本。没有迹象表明哪个说话者说了哪个词。 IBM Watson 是否支持 "Speaker diarization"/"Speaker Recognition"?
不,不幸的是它没有。
我们正在努力 Speaker Diarization。还没有预计到达时间,但希望很快就会到来。
就像今天一样,该服务将音频视为同一个扬声器
我在 https://speech-to-text-demo.mybluemix.net/ 玩 IBM Watson 的语音转文本演示。我上传了一个带有 2 个扬声器的音频文件。 Watson 返回没有说话人标识符的转录文本。没有迹象表明哪个说话者说了哪个词。 IBM Watson 是否支持 "Speaker diarization"/"Speaker Recognition"?
不,不幸的是它没有。
我们正在努力 Speaker Diarization。还没有预计到达时间,但希望很快就会到来。 就像今天一样,该服务将音频视为同一个扬声器