如何为 IBM Watson speech2text 服务指定拼音关键字?
How to specify phonetic keywords for IBM Watson speech2text service?
虽然我们在一般情况下使用 Bluemix Java SDK 取得了很好的成功,但我们在尝试识别偶尔出现的非英语单词(例如外国姓氏)时遇到了问题。我们希望可以使用 SPR 音标(这对 text2speech 非常有用)指定关键字列表,但 speech2text 似乎不支持。任何 suggestions/workarounds?
SpeechToText service = new SpeechToText();
service.setUsernameAndPassword("USERNAME", "PASSWORD");
File audio = new File("C:\Users\AudioFiles\euler.wav");
RecognizeOptions options = new RecognizeOptions().Builder()
.contentType(HttpMediaType.AUDIO_WAV)
.continuous(true)
.inactivityTimeout(500)
.keywords({"Agarwal", "Euler", "Qin"})
.keywordsThreshold(0.5)
.build();
SpeechResults transcript = service.recognize(audio, options);
System.out.println(transcript);
objective 可以说 "My name is John Euler." 并且抄本不能 return 类似 "My name is John Oyler." 的东西(这是它目前所做的)。
谢谢。
嗯,你传递的三个词其实在词汇表中,但可能没有找到,因为它们在语言模型中的权重很小。您是否尝试过放宽门槛?如果任务以名称为中心,您还可以尝试使用 Watson STT 定制服务来提高名称的概率
虽然我们在一般情况下使用 Bluemix Java SDK 取得了很好的成功,但我们在尝试识别偶尔出现的非英语单词(例如外国姓氏)时遇到了问题。我们希望可以使用 SPR 音标(这对 text2speech 非常有用)指定关键字列表,但 speech2text 似乎不支持。任何 suggestions/workarounds?
SpeechToText service = new SpeechToText();
service.setUsernameAndPassword("USERNAME", "PASSWORD");
File audio = new File("C:\Users\AudioFiles\euler.wav");
RecognizeOptions options = new RecognizeOptions().Builder()
.contentType(HttpMediaType.AUDIO_WAV)
.continuous(true)
.inactivityTimeout(500)
.keywords({"Agarwal", "Euler", "Qin"})
.keywordsThreshold(0.5)
.build();
SpeechResults transcript = service.recognize(audio, options);
System.out.println(transcript);
objective 可以说 "My name is John Euler." 并且抄本不能 return 类似 "My name is John Oyler." 的东西(这是它目前所做的)。
谢谢。
嗯,你传递的三个词其实在词汇表中,但可能没有找到,因为它们在语言模型中的权重很小。您是否尝试过放宽门槛?如果任务以名称为中心,您还可以尝试使用 Watson STT 定制服务来提高名称的概率