机器人机器学习模型的正确方法
Correct approach to machine learning model for robotics
我正在寻找使用哪种模型或方法的起点。
案例如下:
一个有 9 个输入的机器人:
-6 个传感器给出距离
-检测碰撞的传感器
- -左电机当前转速
- -右电机当前转速
输出:
2 个数字(或 2 个布尔值)控制 2 个电机(左前和右前)
现在我正在考虑让机器人想办法避免崩溃。
我将 6 个传感器连同一个 "that worked / did not work" 作为数据输入模型
然后对模型进行训练,以确定当传感器值低于某个数值时,电机需要比另一个电机更快以避免碰撞输入。另外,我需要告诉模型需要避免崩溃标志。
现在作为平台,我正在考虑 raspberry pi,可能带有 azure 连接,这样我就可以使用我想要的任何模型
但我要找哪个型号?它需要从连续数据中学习。尝试一些东西,把它写回去,从中学习,然后再尝试别的东西。输出可能需要多回归或多二进制。
输入也是,多输入。已经需要从新的数据点中学习。有什么想法吗?
您正在寻找 reinforcment learning。有很多关于机器人或游戏 AI 的文献。它是如何工作的,就像你说的那样,持续不断。
它(代理)有一个环境(传感器,当前速度),他可以执行动作(控制电机)将导致环境的反应。通过给定的操作,它将获得奖励,例如 distance from object < before
=> +1 else -1。你明白了。通过尝试、失败,它会创建自己的 策略 (它的行为)来最大化奖励。
强化中最常用的算法是 Q-Learning(其深度学习方面称为 DQN)。
这是一篇可能与您的问题相关的论文:link
我正在寻找使用哪种模型或方法的起点。 案例如下:
一个有 9 个输入的机器人:
-6 个传感器给出距离
-检测碰撞的传感器
- -左电机当前转速
- -右电机当前转速
输出: 2 个数字(或 2 个布尔值)控制 2 个电机(左前和右前)
现在我正在考虑让机器人想办法避免崩溃。 我将 6 个传感器连同一个 "that worked / did not work" 作为数据输入模型 然后对模型进行训练,以确定当传感器值低于某个数值时,电机需要比另一个电机更快以避免碰撞输入。另外,我需要告诉模型需要避免崩溃标志。
现在作为平台,我正在考虑 raspberry pi,可能带有 azure 连接,这样我就可以使用我想要的任何模型
但我要找哪个型号?它需要从连续数据中学习。尝试一些东西,把它写回去,从中学习,然后再尝试别的东西。输出可能需要多回归或多二进制。
输入也是,多输入。已经需要从新的数据点中学习。有什么想法吗?
您正在寻找 reinforcment learning。有很多关于机器人或游戏 AI 的文献。它是如何工作的,就像你说的那样,持续不断。
它(代理)有一个环境(传感器,当前速度),他可以执行动作(控制电机)将导致环境的反应。通过给定的操作,它将获得奖励,例如 distance from object < before
=> +1 else -1。你明白了。通过尝试、失败,它会创建自己的 策略 (它的行为)来最大化奖励。
强化中最常用的算法是 Q-Learning(其深度学习方面称为 DQN)。
这是一篇可能与您的问题相关的论文:link