如何在 python 中定义强化学习的状态

how to define a state in python for reinforcement learning

我需要为我的 RL 问题创建一个状态 space,它有大约 10 个状态变量,每个状态变量包含大约 2 或 3 个变量值。这将使该州 space 大约有 600,000 个州。我如何在 python 中实现它?

考虑到您问题中的状态数量,也许您应该考虑使用某种 function approximation 而不是表格表示。

如果您最终决定使用具有 60 万行和与操作一样多的列的 table,也许 pandas DataFrame 可以工作。