循环神经网络是强化学习还是监督学习模型？

Is recurrent neural network a reinforcement learning or supervised learning model?

我刚学了一段时间机器学习和一些 ANN，仍然需要了解它的全局。我仍在学习基础知识和术语以加深我的知识。我了解了强化学习和我的理解（如果我错了请纠正我）有3种分组方法学习。

学习recurrent net的时候，有人说它属于监督学习。但是当我看到它是如何工作的时候，说它属于强化学习更合适。任何人都可以澄清循环网络属于监督学习还是强化学习？

RNN 通常用于监督学习，因为 RNN 的核心功能需要串行发送标记数据。

现在你一定已经在 RL 中看到过 RNN，但要注意的是当前的深度强化学习使用监督 RNN 的概念，它作为 RL 生态系统内代理的良好特征向量。

简单来说，代理、奖励塑造、环境一切都是强化学习，但代理中的深度网络学习的方式是使用 RNN（或 CNN 或任何类型的 ANN，具体取决于问题陈述）。

简而言之，RNN 总是需要标记数据，因此需要监督学习，但它也可以用于 RL 环境。