是否有带语音识别的 NAO 模拟?
Is there a NAO simulation with Speech Recognition?
由于 Covid-19,我无法使用物理 NAO,需要使用模拟。目标是模拟不同复杂性的对话,也涉及手势。语音识别是这里最重要的功能,但模拟其他增加更多真实感的功能(如语音)也将受到赞赏。
我在 Mac(与 Catalina)一起工作。
我试过的:
- Choregraphe:附带的模拟效果很好,但功能非常有限。如果我没有遗漏任何东西,对话只会在书面聊天中模拟 - 所以我输入语音输入,得到 'speech bubbles' 作为响应
- NAO 的 Webots:不再支持?
- Webots(使用Python控制器):迄今为止最有前途的方法,但基本上没有关于如何编写NAO控制器的文档。我不知道如何让 Speaker() class 工作。 naoqisim 的机器人和世界模拟(也不再持续)似乎 运行 很好。
- Webots using ROS controller: Mac 没有官方支持,ROS Kinetics 的推荐安装对我来说还没有用。
对于 Webots 是否适合对话(似乎主要集中在运动上)或其他合适模拟的建议,我将不胜感激。
编舞
ALTextToSpeech
和 ALSpeechRecognition
API 目前不适用于虚拟机器人 运行。来自文档 here
ACAPELA, microAITalk and Nuance engines are only available on the real robot. When using a virtual robot, said text can be visualized in Choregraphe Robot View and Dialog panel.
和here
[Speech Recognition] cannot be tested on a simulated robot - This module is only available on a real robot, you cannot test it on a simulated robot.
文本交互可用于测试对话的流程,但不允许您正确测试语音识别的细微差别。
其他模拟器
Webots 不再受支持,而且我从来没有成功设置过它。 Pepper/NAO 当前可用的最佳模拟环境是 ROS Gazebo Stack。但它实际上也不是为音频模拟而设计的。它可以让你模拟机器人做出手势并在世界中移动,但你必须编写自己的自定义代码(ROS 节点,在 python 或 C++ 中)来处理音频、进行语音识别和输出语音(例如连接到麦克风和扬声器)。
如果您打算使用 NAOqi QiChat 聊天机器人,您可以使用 naoqi python api 来 运行 并且只需将外部语音连接到文本和文本到语音服务。尽管您需要更复杂的语音交互,但我建议使用功能完善的聊天机器人(Dialogflow、IBM Watson 等)
由于 Covid-19,我无法使用物理 NAO,需要使用模拟。目标是模拟不同复杂性的对话,也涉及手势。语音识别是这里最重要的功能,但模拟其他增加更多真实感的功能(如语音)也将受到赞赏。
我在 Mac(与 Catalina)一起工作。
我试过的:
- Choregraphe:附带的模拟效果很好,但功能非常有限。如果我没有遗漏任何东西,对话只会在书面聊天中模拟 - 所以我输入语音输入,得到 'speech bubbles' 作为响应
- NAO 的 Webots:不再支持?
- Webots(使用Python控制器):迄今为止最有前途的方法,但基本上没有关于如何编写NAO控制器的文档。我不知道如何让 Speaker() class 工作。 naoqisim 的机器人和世界模拟(也不再持续)似乎 运行 很好。
- Webots using ROS controller: Mac 没有官方支持,ROS Kinetics 的推荐安装对我来说还没有用。
对于 Webots 是否适合对话(似乎主要集中在运动上)或其他合适模拟的建议,我将不胜感激。
编舞
ALTextToSpeech
和 ALSpeechRecognition
API 目前不适用于虚拟机器人 运行。来自文档 here
ACAPELA, microAITalk and Nuance engines are only available on the real robot. When using a virtual robot, said text can be visualized in Choregraphe Robot View and Dialog panel.
和here
[Speech Recognition] cannot be tested on a simulated robot - This module is only available on a real robot, you cannot test it on a simulated robot.
文本交互可用于测试对话的流程,但不允许您正确测试语音识别的细微差别。
其他模拟器
Webots 不再受支持,而且我从来没有成功设置过它。 Pepper/NAO 当前可用的最佳模拟环境是 ROS Gazebo Stack。但它实际上也不是为音频模拟而设计的。它可以让你模拟机器人做出手势并在世界中移动,但你必须编写自己的自定义代码(ROS 节点,在 python 或 C++ 中)来处理音频、进行语音识别和输出语音(例如连接到麦克风和扬声器)。
如果您打算使用 NAOqi QiChat 聊天机器人,您可以使用 naoqi python api 来 运行 并且只需将外部语音连接到文本和文本到语音服务。尽管您需要更复杂的语音交互,但我建议使用功能完善的聊天机器人(Dialogflow、IBM Watson 等)