如何在 python 中定义强化学习的状态

how to define a state in python for reinforcement learning

我需要为我的 RL 问题创建一个状态 space，它有大约 10 个状态变量，每个状态变量包含大约 2 或 3 个变量值。这将使该州 space 大约有 600,000 个州。我如何在 python 中实现它？

考虑到您问题中的状态数量，也许您应该考虑使用某种 function approximation 而不是表格表示。

如果您最终决定使用具有 60 万行和与操作一样多的列的 table，也许 pandas DataFrame 可以工作。