Tensorflow None、-1 和 之间有什么区别?指定张量形状时?

Tensorflow what is the difference between None, -1 and ? when specifying tensor shape?

我经常看到符号“None”,“-1" 和 "?" 让程序动态定义张量的维度 (比如批量大小),貌似效果一样:

x = tf.placeholder(tf.float32, [None, 48, 48, 3], name='InputData')

input = tf.reshape(input, [-1, input_size])

foo("bar", shape=(?,48), dtype=float32)

使用这些符号中的任何一个与另一个相比有任何功能差异吗?

谢谢

我是这样想的:

None表示未指定维度。因此,例如,如果您定义一个占位符,则使用 None 表示 "this dimension can have any size".
占位符可以有多个 None 维度。这仅仅意味着多个维度可以是不同的大小。甚至整个形状都可以None来指定未知的维数。

-1 是 Tensorflow 自己 推断 维度大小的指令。在 tf.reshape(input, [-1, input_size]) 中,这意味着 "reshape it such that the second dimension is input_size, and the first dimension is whatever is needed to match the total number of elements".
这确实 而不是 必然意味着维度是未知的,因为它是 None。如果您的输入张量已知大小为 10 个元素,并且您重新整形为 [-1, 2],Tensorflow 能够推断出完整的形状 [5, 2].
-1 纯粹是为了方便。你总是可以明确地写下形状而不是让 Tensorflow 推断它。 None 另一方面是接受可变大小张量所必需的。
一个形状中只能有一个 -1。多个没有意义,因为不可能推断出形状。例如。如果张量中有 12 个元素,重塑为 [-1, -1, 2] 是未定义的——我们应该做 [3, 2, 2] 吗? [2, 3, 2][6, 1, 2]?...

最后,问号正是 Tensorflow 在 打印 张量 and/or 形状时用来标记 "unknown" 维度的东西。您发布的示例实际上会产生语法错误——您不能自己使用问号。未知维度的原因当然可以是具有 None 维度的占位符,并且通常根据占位符定义的张量(即应用于它们的某些操作的结果)也将具有未知维度。此外,某些操作可能未指定(部分)它们的输出形状,这也可能导致未知数。

我在这里可能遗漏了更多技术细节,但根据经验:使用 None 作为占位符,使用 -1 进行整形。这应该涵盖大多数用例。