javascript node.js 的语音识别
Speech recognition for javascript node.js
目前,我正在做一个业余项目。我现在使用 javascript 和 node.js。我正在尝试将语音识别添加到我的应用程序中,尽管不是在浏览器中。我知道有很多东西使用浏览器的语音识别 API,但我通常 运行 我的终端脚本使用我的 mac。例如,我要实现的目标如下。
我会说些什么,如果这与 if 语句相对应,那么脚本将按照要求执行任何任务。因此,如果我说 "Hello" 它会执行所说的任何任务。
有这样的事吗?
Google 有他们演讲的文档 API 为 NodeJS here. It will allow you to upload a sound file, or open a channel to the API server. This will allow you to get a lot of data about what they said: duration, what they said in a text file, confidence and more. You can check out their API and pricing here。
有很多 Node 模块只包装浏览器的语音识别(如果可用),如果您不在浏览器中,这将无济于事。还有几个模块是外部服务的接口,如果您向它们发送音频,它们将为您进行语音识别。
如果您正在寻找一个真正进行本地语音识别的模块,而不是将问题转嫁给其他人,我唯一能找到的是 pocketsphinx,虽然它是您必须安装的工具的包装器(即识别器本身不在 JavaScript 中),据称允许您从 NodeJS 进行本地设备上的语音识别,而不必担心 "pricing" 或隐私。
目前,我正在做一个业余项目。我现在使用 javascript 和 node.js。我正在尝试将语音识别添加到我的应用程序中,尽管不是在浏览器中。我知道有很多东西使用浏览器的语音识别 API,但我通常 运行 我的终端脚本使用我的 mac。例如,我要实现的目标如下。 我会说些什么,如果这与 if 语句相对应,那么脚本将按照要求执行任何任务。因此,如果我说 "Hello" 它会执行所说的任何任务。 有这样的事吗?
Google 有他们演讲的文档 API 为 NodeJS here. It will allow you to upload a sound file, or open a channel to the API server. This will allow you to get a lot of data about what they said: duration, what they said in a text file, confidence and more. You can check out their API and pricing here。
有很多 Node 模块只包装浏览器的语音识别(如果可用),如果您不在浏览器中,这将无济于事。还有几个模块是外部服务的接口,如果您向它们发送音频,它们将为您进行语音识别。
如果您正在寻找一个真正进行本地语音识别的模块,而不是将问题转嫁给其他人,我唯一能找到的是 pocketsphinx,虽然它是您必须安装的工具的包装器(即识别器本身不在 JavaScript 中),据称允许您从 NodeJS 进行本地设备上的语音识别,而不必担心 "pricing" 或隐私。