Tensorflow 中 v.assign(v + 1) 和 v = v + 1 的区别

Difference between v.assign(v + 1) and v = v + 1 in Tensorflow

以下 Tensorflow 代码运行良好,v1 变为 [1., 1., 1.]

v1 = tf.get_variable('v1', shape=[3], initializer=tf.zeros_initializer)
v1 = v1 + 1 

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print (v1.eval())

下面的代码段也给了我们与上面完全相同的结果。 v1 变成 [1., 1., 1.] 如果我们 运行 sess.run(inc_v1).

v1 = tf.get_variable('v1', shape=[3], initializer=tf.zeros_initializer)
inc_v1 = v1.assign(v1 + 1)


with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    sess.run(inc_v1)
    print (v1.eval())

但是,下面的代码会导致错误。

v1 = tf.get_variable('v1', shape=[3], initializer=tf.zeros_initializer)
v1 = v1 + 1 
inc_v1 = v1.assign(v1 + 1)


with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    sess.run(inc_v1)
    print (v1.eval())

错误如下:

AttributeError: 'Tensor' object has no attribute 'assign'

你能告诉我为什么会导致错误吗?

张量和变量在 TensorFlow 中是不同的对象

import tensorflow as tf


def inspect(t):
    print('\n %s\n-------' % t.name)
    print(type(t))
    print(t.op.outputs)
    print('has assign method' if 'assign' in dir(t) else 'has no assign method')


v1 = tf.get_variable('v1', shape=[3], initializer=tf.zeros_initializer)
inspect(v1)
v2 = v1 + 1
inspect(v2)

给予

 v1:0
-------
<class 'tensorflow.python.ops.variables.Variable'>
[<tf.Tensor 'v1:0' shape=(3,) dtype=float32_ref>]
has assign method

 add:0
-------
<class 'tensorflow.python.framework.ops.Tensor'>
[<tf.Tensor 'add:0' shape=(3,) dtype=float32>]
has no assign method

因此,v1:0 实际上是变量本身,而 v1 具有方法 assign。这是有道理的,因为它只是对浮点值的引用。 另一方面,v2 = v1 + 1 导致 add 操作的输出。所以 v2 不再是一个变量,你不能给 v2 赋新值。在这种情况下,您希望更新 add 的哪个操作数? 每当您使用 v1 时,请考虑使用 v1 中的 read_value() 操作:

v1 = tf.get_variable('v1', shape=[3], initializer=tf.zeros_initializer)
inspect(v1)
w = v1.read_value()
inspect(w)
v2 = v1.read_value() + 1
inspect(v2)

给予

 v1:0
-------
<class 'tensorflow.python.ops.variables.Variable'>
[<tf.Tensor 'v1:0' shape=(3,) dtype=float32_ref>]
has assign method

 read:0
-------
<class 'tensorflow.python.framework.ops.Tensor'>
[<tf.Tensor 'read:0' shape=(3,) dtype=float32>]
has no assign method

 add:0
-------
<class 'tensorflow.python.framework.ops.Tensor'>
[<tf.Tensor 'add:0' shape=(3,) dtype=float32>]
has no assign method