具有适应度分数的机器学习算法

Machine learning algorithm with fitness score

我不确定这是否适用于 Whosebug or Programmers，但由于它更倾向于实施，所以我在这里问。

我正在寻找一种算法，它可以采用 n 输入（所有浮点数）并产生 m（所有浮点数；m < n）输出。然后可以使用某种适应度分数来训练该系统，以了解输入和输出之间的相关性。

用于此目的的最佳算法是什么？

一点上下文： 我想使用机器学习而不是自己发明的算法，因为我不知道数据之间的（完全）相关性，我知道机器学习算法的结果是否好，并从那里进行训练。

我有几个变量要传递，例如：

输出应该是：

我有非常大的数据集可以处理，所以理想情况下建议的算法也可以持久化。

我见过像 Artificial Neural Networks 这样的算法，但这些算法不允许使用适合度分数，因为它们需要将输入和输出耦合在一起。我无法提供，我只能计算这些数字正确的可能性（健身分数 – 设计永远不会 >= 1）

从描述来看，它看起来像是 reinforcement learning 的经典问题，其中您确实有一些代理执行操作（这里定义为操作+强度，但这仍然是一个操作），它改变了一些内部状态代理并获得（至少在某个时候）奖励。

有很多方法可以从您的环境中学习好的策略（选择特定操作的规则），包括（但不限于）：