机器人机器学习模型的正确方法

Correct approach to machine learning model for robotics

我正在寻找使用哪种模型或方法的起点。案例如下：

一个有 9 个输入的机器人：

输出： 2 个数字（或 2 个布尔值）控制 2 个电机（左前和右前）

现在我正在考虑让机器人想办法避免崩溃。我将 6 个传感器连同一个 "that worked / did not work" 作为数据输入模型然后对模型进行训练，以确定当传感器值低于某个数值时，电机需要比另一个电机更快以避免碰撞输入。另外，我需要告诉模型需要避免崩溃标志。

现在作为平台，我正在考虑 raspberry pi，可能带有 azure 连接，这样我就可以使用我想要的任何模型

但我要找哪个型号？它需要从连续数据中学习。尝试一些东西，把它写回去，从中学习，然后再尝试别的东西。输出可能需要多回归或多二进制。

输入也是，多输入。已经需要从新的数据点中学习。有什么想法吗？

您正在寻找 reinforcment learning。有很多关于机器人或游戏 AI 的文献。它是如何工作的，就像你说的那样，持续不断。

它（代理）有一个环境（传感器，当前速度），他可以执行动作（控制电机）将导致环境的反应。通过给定的操作，它将获得奖励，例如 distance from object < before=> +1 else -1。你明白了。通过尝试、失败，它会创建自己的策略（它的行为）来最大化奖励。

强化中最常用的算法是 Q-Learning（其深度学习方面称为 DQN）。

这是一篇可能与您的问题相关的论文：link