Tensorflow None、-1 和之间有什么区别？指定张量形状时？

Question

我经常看到符号“None”，“-1" 和 "?" 让程序动态定义张量的维度 (比如批量大小），貌似效果一样：

x = tf.placeholder(tf.float32, [None, 48, 48, 3], name='InputData')

input = tf.reshape(input, [-1, input_size])

foo("bar", shape=(?,48), dtype=float32)

使用这些符号中的任何一个与另一个相比有任何功能差异吗？

谢谢

Answer 1

我是这样想的：

None表示未指定维度。因此，例如，如果您定义一个占位符，则使用 None 表示 "this dimension can have any size".
占位符可以有多个 None 维度。这仅仅意味着多个维度可以是不同的大小。甚至整个形状都可以None来指定未知的维数。

-1 是 Tensorflow 自己推断维度大小的指令。在 tf.reshape(input, [-1, input_size]) 中，这意味着 "reshape it such that the second dimension is input_size, and the first dimension is whatever is needed to match the total number of elements".
这确实 而不是 必然意味着维度是未知的，因为它是 None。如果您的输入张量已知大小为 10 个元素，并且您重新整形为 [-1, 2]，Tensorflow 能够推断出完整的形状 [5, 2].
-1 纯粹是为了方便。你总是可以明确地写下形状而不是让 Tensorflow 推断它。 None 另一方面是接受可变大小张量所必需的。
一个形状中只能有一个 -1。多个没有意义，因为不可能推断出形状。例如。如果张量中有 12 个元素，重塑为 [-1, -1, 2] 是未定义的——我们应该做 [3, 2, 2] 吗？ [2, 3, 2]？ [6, 1, 2]?...

最后，问号正是 Tensorflow 在打印张量 and/or 形状时用来标记 "unknown" 维度的东西。您发布的示例实际上会产生语法错误——您不能自己使用问号。未知维度的原因当然可以是具有 None 维度的占位符，并且通常根据占位符定义的张量（即应用于它们的某些操作的结果）也将具有未知维度。此外，某些操作可能未指定（部分）它们的输出形状，这也可能导致未知数。

我在这里可能遗漏了更多技术细节，但根据经验：使用 None 作为占位符，使用 -1 进行整形。这应该涵盖大多数用例。

Tensorflow None、-1 和之间有什么区别？指定张量形状时？

Tensorflow what is the difference between None, -1 and ? when specifying tensor shape?

python

dynamic

reshape

tensorflow

tensor

Tensorflow None、-1 和 之间有什么区别？指定张量形状时？

Tensorflow what is the difference between None, -1 and ? when specifying tensor shape?

python

dynamic

reshape

tensorflow

tensor

Tensorflow None、-1 和之间有什么区别？指定张量形状时？