CPU 和 GPU 与 Theano 的不同结果

Different results of CPU and GPU with Theano

我有如下一段代码:

import theano
import theano.tensor as T
import numpy as np

x = theano.shared(np.asarray([1, 2, 3], dtype=theano.config.floatX), borrow=True)
y = T.cast(x, 'int32')
print 'type of y: ', type(y)
print 'type of y.owner.inputs[0]: ', type(y.owner.inputs[0])
print 'value of y: ', y.owner.inputs[0].get_value(borrow=True)

运行 与 CPU

$ THEANO_FLAGS=mode=FAST_RUN,device=cpu,floatX=float32 python test_share.py
type of y:  <class 'theano.tensor.var.TensorVariable'>
type of y.owner.inputs[0]:  <class 'theano.tensor.sharedvar.TensorSharedVariable'>
value of y:  [ 1.  2.  3.]

运行 使用 GPU

$ THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32 python test_share.py
Using gpu device 0: GeForce 310M
type of y:  <class 'theano.tensor.var.TensorVariable'>
type of y.owner.inputs[0]:  <class 'theano.tensor.var.TensorVariable'>
value of y:
Traceback (most recent call last):
  File "test_share.py", line 10, in <module>
    print 'value of y: ', y.owner.inputs[0].get_value(borrow=True)
AttributeError: 'TensorVariable' object has no attribute 'get_value'

如何获得与 CPU 相同的结果?

您用于访问计算图中子节点的方法 .owner.inputs[0] 通常不适合跨平台代码。

您调用了共享变量 x,因此访问 x 值的正确方法是使用 x.get_value().

此代码在 CPU 和 GPU 上应该 运行 相同:

import theano
import theano.tensor as T
import numpy as np

x = theano.shared(np.asarray([1, 2, 3], dtype=theano.config.floatX), borrow=True)
y = T.cast(x, 'int32')
print 'type of y: ', type(y)
print 'type of x: ', type(x)
print 'value of x: ', x.get_value(borrow=True)

如果您想查看将符号转换操作应用于 x 的结果,即您调用 y 的符号结果,那么您可以这样做:

print 'value of y: ', y.eval()