如何select Q值最高的动作
How to select the action with highest Q value
我有经验地实现了 DQN replay.Input 是 50x50x1。批量大小为 4 时,输入将变为 (4,50,50,1)。总输出操作为 10。如果批量大小为 4,则输出为 (4,10)。我想知道如何 select 这个 (4,10) 向量中的最大 q 值。提前致谢
这可能就是您要找的 tf.math.reduce_max。
X_max = tf.reduce_max(X)
这 returns 来自给定张量 X 的单个最大值。
在 DQN 的上下文中,批量大小为 4(4 行),您需要 select 4 个最大 Q 值,每行一个.您可以使用以下方法执行此操作:
X_max = tf.reduce_max(X, axis=1)
其中 X 是包含形状为 (4,10) 的 Q 值的数据结构。
这 returns 单个张量中的 4 个最大 Q 值 X_max 具有输出形状 (4,1)。
我有经验地实现了 DQN replay.Input 是 50x50x1。批量大小为 4 时,输入将变为 (4,50,50,1)。总输出操作为 10。如果批量大小为 4,则输出为 (4,10)。我想知道如何 select 这个 (4,10) 向量中的最大 q 值。提前致谢
这可能就是您要找的 tf.math.reduce_max。
X_max = tf.reduce_max(X)
这 returns 来自给定张量 X 的单个最大值。
在 DQN 的上下文中,批量大小为 4(4 行),您需要 select 4 个最大 Q 值,每行一个.您可以使用以下方法执行此操作:
X_max = tf.reduce_max(X, axis=1)
其中 X 是包含形状为 (4,10) 的 Q 值的数据结构。 这 returns 单个张量中的 4 个最大 Q 值 X_max 具有输出形状 (4,1)。