Reinforcement learning with mathematical notation中连续状态space和连续动作space的例子是什么?
What is the example of a continous state space and continous action space in Reinforcement learning with mathematical notation?
how are they represented in mathematical notation ?
离散状态 space -> 其中状态可以具有有限值。
例如,如果只有 3 种类型的天气:晴天、有雾或下雨,那么这类似于具有三个离散值
的状态 space
连续状态 space -> 状态可以具有无限值
例如,对于汽车,我们可能将状态表示为 (x,y,θ, x,˙y,˙
˙θ),包含其位置(x,y);方向 θ; x 和 y 方向的速度
x˙ 和˙y;和 angular 速度 ˙θ.
因此,S = R^6,是一个无限的状态集,
因为有无数种可能的位置和方向
为了汽车
how are they represented in mathematical notation ?
离散状态 space -> 其中状态可以具有有限值。 例如,如果只有 3 种类型的天气:晴天、有雾或下雨,那么这类似于具有三个离散值
的状态 space连续状态 space -> 状态可以具有无限值 例如,对于汽车,我们可能将状态表示为 (x,y,θ, x,˙y,˙ ˙θ),包含其位置(x,y);方向 θ; x 和 y 方向的速度 x˙ 和˙y;和 angular 速度 ˙θ.
因此,S = R^6,是一个无限的状态集, 因为有无数种可能的位置和方向 为了汽车