Tensorflow None、-1 和 之间有什么区别?指定张量形状时?
Tensorflow what is the difference between None, -1 and ? when specifying tensor shape?
我经常看到符号“None”,“-1" 和 "?" 让程序动态定义张量的维度 (比如批量大小),貌似效果一样:
x = tf.placeholder(tf.float32, [None, 48, 48, 3], name='InputData')
input = tf.reshape(input, [-1, input_size])
foo("bar", shape=(?,48), dtype=float32)
使用这些符号中的任何一个与另一个相比有任何功能差异吗?
谢谢
我是这样想的:
None
表示未指定维度。因此,例如,如果您定义一个占位符,则使用 None
表示 "this dimension can have any size".
占位符可以有多个 None
维度。这仅仅意味着多个维度可以是不同的大小。甚至整个形状都可以None
来指定未知的维数。
-1
是 Tensorflow 自己 推断 维度大小的指令。在 tf.reshape(input, [-1, input_size])
中,这意味着 "reshape it such that the second dimension is input_size
, and the first dimension is whatever is needed to match the total number of elements".
这确实 而不是 必然意味着维度是未知的,因为它是 None
。如果您的输入张量已知大小为 10 个元素,并且您重新整形为 [-1, 2]
,Tensorflow 能够推断出完整的形状 [5, 2]
.
-1
纯粹是为了方便。你总是可以明确地写下形状而不是让 Tensorflow 推断它。 None
另一方面是接受可变大小张量所必需的。
一个形状中只能有一个 -1
。多个没有意义,因为不可能推断出形状。例如。如果张量中有 12 个元素,重塑为 [-1, -1, 2]
是未定义的——我们应该做 [3, 2, 2]
吗? [2, 3, 2]
? [6, 1, 2]
?...
最后,问号正是 Tensorflow 在 打印 张量 and/or 形状时用来标记 "unknown" 维度的东西。您发布的示例实际上会产生语法错误——您不能自己使用问号。未知维度的原因当然可以是具有 None
维度的占位符,并且通常根据占位符定义的张量(即应用于它们的某些操作的结果)也将具有未知维度。此外,某些操作可能未指定(部分)它们的输出形状,这也可能导致未知数。
我在这里可能遗漏了更多技术细节,但根据经验:使用 None
作为占位符,使用 -1
进行整形。这应该涵盖大多数用例。
我经常看到符号“None”,“-1" 和 "?" 让程序动态定义张量的维度 (比如批量大小),貌似效果一样:
x = tf.placeholder(tf.float32, [None, 48, 48, 3], name='InputData')
input = tf.reshape(input, [-1, input_size])
foo("bar", shape=(?,48), dtype=float32)
使用这些符号中的任何一个与另一个相比有任何功能差异吗?
谢谢
我是这样想的:
None
表示未指定维度。因此,例如,如果您定义一个占位符,则使用 None
表示 "this dimension can have any size".
占位符可以有多个 None
维度。这仅仅意味着多个维度可以是不同的大小。甚至整个形状都可以None
来指定未知的维数。
-1
是 Tensorflow 自己 推断 维度大小的指令。在 tf.reshape(input, [-1, input_size])
中,这意味着 "reshape it such that the second dimension is input_size
, and the first dimension is whatever is needed to match the total number of elements".
这确实 而不是 必然意味着维度是未知的,因为它是 None
。如果您的输入张量已知大小为 10 个元素,并且您重新整形为 [-1, 2]
,Tensorflow 能够推断出完整的形状 [5, 2]
.
-1
纯粹是为了方便。你总是可以明确地写下形状而不是让 Tensorflow 推断它。 None
另一方面是接受可变大小张量所必需的。
一个形状中只能有一个 -1
。多个没有意义,因为不可能推断出形状。例如。如果张量中有 12 个元素,重塑为 [-1, -1, 2]
是未定义的——我们应该做 [3, 2, 2]
吗? [2, 3, 2]
? [6, 1, 2]
?...
最后,问号正是 Tensorflow 在 打印 张量 and/or 形状时用来标记 "unknown" 维度的东西。您发布的示例实际上会产生语法错误——您不能自己使用问号。未知维度的原因当然可以是具有 None
维度的占位符,并且通常根据占位符定义的张量(即应用于它们的某些操作的结果)也将具有未知维度。此外,某些操作可能未指定(部分)它们的输出形状,这也可能导致未知数。
我在这里可能遗漏了更多技术细节,但根据经验:使用 None
作为占位符,使用 -1
进行整形。这应该涵盖大多数用例。