dqn 状态值应该只需要是 0 到 1

should dqn state values need to be 0 to 1 only

例如,DQN 中的状态值是否只需要为 0 到 1 状态 = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]

或者它可以有一个值大于 1 的状态 eh 状态 = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]

状态本身不需要限制价值。您可以根据需要拥有尽可能大的范围。但是出于训练目的,建议将状态值归一化在[0,1]范围内,这样使用函数逼近的神经网络就不会饱和。