Q 函数 vs 动作值函数
Q function vs action-value function
Q函数是动作值函数的同义词吗?我看到它可以互换使用,也可以一起使用(例如 "Q action-value function")。
是的,Q-function 是用于近似 Q-value 的术语,与 action-value 函数相同。
换句话说,当函数逼近用于获得任意 state-action 的 Q-value 时,该函数称为 Q-function。
Q函数是动作值函数的同义词吗?我看到它可以互换使用,也可以一起使用(例如 "Q action-value function")。
是的,Q-function 是用于近似 Q-value 的术语,与 action-value 函数相同。 换句话说,当函数逼近用于获得任意 state-action 的 Q-value 时,该函数称为 Q-function。