具有适应度分数的机器学习算法

Machine learning algorithm with fitness score

我不确定这是否适用于 Whosebug or Programmers,但由于它更倾向于实施,所以我在这里问。

我正在寻找一种算法,它可以采用 n 输入(所有浮点数)并产生 m(所有浮点数;m < n)输出。然后可以使用某种适应度分数来训练该系统,以了解输入和输出之间的相关性。

用于此目的的最佳算法是什么?


一点上下文: 我想使用机器学习而不是自己发明的算法,因为我不知道数据之间的(完全)相关性,我知道机器学习算法的结果是否好,并从那里进行训练。

我有几个变量要传递,例如:

输出应该是:

我有非常大的数据集可以处理,所以理想情况下建议的算法也可以持久化。


我见过像 Artificial Neural Networks 这样的算法,但这些算法不允许使用适合度分数,因为它们需要将输入和输出耦合在一起。我无法提供,我只能计算这些数字正确的可能性(健身分数 – 设计永远不会 >= 1

从描述来看,它看起来像是 reinforcement learning 的经典问题,其中您确实有一些代理执行操作(这里定义为操作+强度,但这仍然是一个操作),它改变了一些内部状态代理并获得(至少在某个时候)奖励。

有很多方法可以从您的环境中学习好的策略(选择特定操作的规则),包括(但不限于):

  • Q-learning
  • MDP(马尔可夫决策过程)
  • Monte carlo 方法