IBM Watson Speech-to-Text "Recognize audio" 方法?

IBM Watson Speech-to-Text "Recognize audio" method?

如何使用 recognize 方法将音频文件发送到 Speech-to-Text 进行转录?在哪里访问音频文件?有什么地方可以放置本地文件的路径、Google 存储位置或下载 URL?

documentation 说:

好的,这就是我想要做的!文档说这是方法:

recognize(params, [callback()])

我看到的参数是:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

MediaFileUri有参数吗?

您的 link 是 node.js sdk 文档。在这种情况下,音频作为参数 audio 发送,它应该是 NodeJS.ReadableStreambuffer。您可以从 url 创建可读流,在这种情况下您可以添加:


params.audio = fs.createReadStream(url);

这将需要 url 指向音频文件,而不是带有音频播放器的伪装网页。