循环神经网络是强化学习还是监督学习模型?
Is recurrent neural network a reinforcement learning or supervised learning model?
我刚学了一段时间机器学习和一些 ANN,仍然需要了解它的全局。
我仍在学习基础知识和术语以加深我的知识。
我了解了强化学习和我的理解(如果我错了请纠正我)有3种分组方法学习。
- 无监督(示例为受限玻尔兹曼机)
- 监督(CNN)
- 强化(EKF、粒子过滤器)
学习recurrent net的时候,有人说它属于监督学习。
但是当我看到它是如何工作的时候,说它属于强化学习更合适。
任何人都可以澄清循环网络属于监督学习还是强化学习?
RNN 通常用于监督学习,因为 RNN 的核心功能需要串行发送标记数据。
现在你一定已经在 RL 中看到过 RNN,但要注意的是当前的深度强化学习使用监督 RNN 的概念,它作为 RL 生态系统内代理的良好特征向量。
简单来说,代理、奖励塑造、环境一切都是强化学习,但代理中的深度网络学习的方式是使用 RNN(或 CNN 或任何类型的 ANN,具体取决于问题陈述)。
简而言之,RNN 总是需要标记数据,因此需要监督学习,但它也可以用于 RL 环境。
我刚学了一段时间机器学习和一些 ANN,仍然需要了解它的全局。 我仍在学习基础知识和术语以加深我的知识。 我了解了强化学习和我的理解(如果我错了请纠正我)有3种分组方法学习。
- 无监督(示例为受限玻尔兹曼机)
- 监督(CNN)
- 强化(EKF、粒子过滤器)
学习recurrent net的时候,有人说它属于监督学习。 但是当我看到它是如何工作的时候,说它属于强化学习更合适。 任何人都可以澄清循环网络属于监督学习还是强化学习?
RNN 通常用于监督学习,因为 RNN 的核心功能需要串行发送标记数据。
现在你一定已经在 RL 中看到过 RNN,但要注意的是当前的深度强化学习使用监督 RNN 的概念,它作为 RL 生态系统内代理的良好特征向量。
简单来说,代理、奖励塑造、环境一切都是强化学习,但代理中的深度网络学习的方式是使用 RNN(或 CNN 或任何类型的 ANN,具体取决于问题陈述)。
简而言之,RNN 总是需要标记数据,因此需要监督学习,但它也可以用于 RL 环境。