是否有使用强化学习进行多标签文本分类的例子?

Are there examples of using reinforcement learning for multi label text classification?

我有一个带标签的数据集,我打算为多标签分类问题(例如:5 个标签)开发一个分类器。我已经开发了 BERT 和 CNN,但我想知道我是否也可以使用 RL 进行文本分类。

据我所知,使用 RL 我们可以使用较小的训练数据集

我正在寻找 RL 的 python 代码。

强化学习与 BERT 或 CNN 不同。它实际上不是一种技术或模型,它是一种问题类型(隐马尔可夫模型),以及用于解决该问题的一组技术。

更准确地说,强化学习是 class 你遇到的问题

  • 一个代理
  • 谁必须选择要采取的行动
  • 这些行为会改变它的状态并给它一个奖励 您的目标是最大化奖励。

这非常适合游戏 AI 或机器人应用程序。

但在您的情况下,您想从标记的数据集中开发一个 classifier。即不是强化学习问题,是监督学习