IBM Watson Speech-to-Text "Recognize audio" 方法?
IBM Watson Speech-to-Text "Recognize audio" method?
如何使用 recognize
方法将音频文件发送到 Speech-to-Text 进行转录?在哪里访问音频文件?有什么地方可以放置本地文件的路径、Google 存储位置或下载 URL?
好的,这就是我想要做的!文档说这是方法:
recognize(params, [callback()])
我看到的参数是:
var params = {
objectMode: true,
contentType: 'audio/flac',
model: 'en-US_BroadbandModel',
keywords: ['colorado', 'tornado', 'tornadoes'],
keywordsThreshold: 0.5,
maxAlternatives: 3
};
MediaFileUri
有参数吗?
您的 link 是 node.js sdk 文档。在这种情况下,音频作为参数 audio
发送,它应该是 NodeJS.ReadableStream
或 buffer
。您可以从 url
创建可读流,在这种情况下您可以添加:
params.audio = fs.createReadStream(url);
这将需要 url 指向音频文件,而不是带有音频播放器的伪装网页。
如何使用 recognize
方法将音频文件发送到 Speech-to-Text 进行转录?在哪里访问音频文件?有什么地方可以放置本地文件的路径、Google 存储位置或下载 URL?
好的,这就是我想要做的!文档说这是方法:
recognize(params, [callback()])
我看到的参数是:
var params = {
objectMode: true,
contentType: 'audio/flac',
model: 'en-US_BroadbandModel',
keywords: ['colorado', 'tornado', 'tornadoes'],
keywordsThreshold: 0.5,
maxAlternatives: 3
};
MediaFileUri
有参数吗?
您的 link 是 node.js sdk 文档。在这种情况下,音频作为参数 audio
发送,它应该是 NodeJS.ReadableStream
或 buffer
。您可以从 url
创建可读流,在这种情况下您可以添加:
params.audio = fs.createReadStream(url);
这将需要 url 指向音频文件,而不是带有音频播放器的伪装网页。