循环神经网络是强化学习还是监督学习模型?

Is recurrent neural network a reinforcement learning or supervised learning model?

我刚学了一段时间机器学习和一些 ANN,仍然需要了解它的全局。 我仍在学习基础知识和术语以加深我的知识。 我了解了强化学习和我的理解(如果我错了请纠正我)有3种分组方法学习。

  1. 无监督(示例为受限玻尔兹曼机)
  2. 监督(CNN)
  3. 强化(EKF、粒子过滤器)

学习recurrent net的时候,有人说它属于监督学习。 但是当我看到它是如何工作的时候,说它属于强化学习更合适。 任何人都可以澄清循环网络属于监督学习还是强化学习?

RNN 通常用于监督学习,因为 RNN 的核心功能需要串行发送标记数据。

现在你一定已经在 RL 中看到过 RNN,但要注意的是当前的深度强化学习使用监督 RNN 的概念,它作为 RL 生态系统内代理的良好特征向量。

简单来说,代理、奖励塑造、环境一切都是强化学习,但代理中的深度网络学习的方式是使用 RNN(或 CNN 或任何类型的 ANN,具体取决于问题陈述)。

简而言之,RNN 总是需要标记数据,因此需要监督学习,但它也可以用于 RL 环境。