Reinforcement learning with mathematical notation中连续状态space和连续动作space的例子是什么?

What is the example of a continous state space and continous action space in Reinforcement learning with mathematical notation?

how are they represented in mathematical notation ?

离散状态 space -> 其中状态可以具有有限值。 例如,如果只有 3 种类型的天气:晴天、有雾或下雨,那么这类似于具有三个离散值

的状态 space

连续状态 space -> 状态可以具有无限值 例如,对于汽车,我们可能将状态表示为 (x,y,θ, x,˙y,˙ ˙θ),包含其位置(x,y);方向 θ; x 和 y 方向的速度 x˙ 和˙y;和 angular 速度 ˙θ.

因此,S = R^6,是一个无限的状态集, 因为有无数种可能的位置和方向 为了汽车