如何在 python 中定义强化学习的状态
how to define a state in python for reinforcement learning
我需要为我的 RL 问题创建一个状态 space,它有大约 10 个状态变量,每个状态变量包含大约 2 或 3 个变量值。这将使该州 space 大约有 600,000 个州。我如何在 python 中实现它?
考虑到您问题中的状态数量,也许您应该考虑使用某种 function approximation 而不是表格表示。
如果您最终决定使用具有 60 万行和与操作一样多的列的 table,也许 pandas DataFrame 可以工作。
我需要为我的 RL 问题创建一个状态 space,它有大约 10 个状态变量,每个状态变量包含大约 2 或 3 个变量值。这将使该州 space 大约有 600,000 个州。我如何在 python 中实现它?
考虑到您问题中的状态数量,也许您应该考虑使用某种 function approximation 而不是表格表示。
如果您最终决定使用具有 60 万行和与操作一样多的列的 table,也许 pandas DataFrame 可以工作。