如何为 IBM Watson speech2text 服务指定拼音关键字?

How to specify phonetic keywords for IBM Watson speech2text service?

虽然我们在一般情况下使用 Bluemix Java SDK 取得了很好的成功,但我们在尝试识别偶尔出现的非英语单词(例如外国姓氏)时遇到了问题。我们希望可以使用 SPR 音标(这对 text2speech 非常有用)指定关键字列表,但 speech2text 似乎不支持。任何 suggestions/workarounds?

SpeechToText service = new SpeechToText();
service.setUsernameAndPassword("USERNAME", "PASSWORD");

File audio = new File("C:\Users\AudioFiles\euler.wav");    

RecognizeOptions options = new RecognizeOptions().Builder()
  .contentType(HttpMediaType.AUDIO_WAV)
  .continuous(true)
  .inactivityTimeout(500)
  .keywords({"Agarwal", "Euler", "Qin"})
  .keywordsThreshold(0.5)
  .build();

  SpeechResults transcript = service.recognize(audio, options);
  System.out.println(transcript);

objective 可以说 "My name is John Euler." 并且抄本不能 return 类似 "My name is John Oyler." 的东西(这是它目前所做的)。

谢谢。

嗯,你传递的三个词其实在词汇表中,但可能没有找到,因为它们在语言模型中的权重很小。您是否尝试过放宽门槛?如果任务以名称为中心,您还可以尝试使用 Watson STT 定制服务来提高名称的概率