设置tensorflow conv2d操作的权重和偏置张量
Set weight and bias tensors of tensorflow conv2d operation
我已经在 Torch 中获得了训练有素的神经网络,我需要在 TensorFlow 中完全重建它。我相信我已经在 tensorflow 中正确定义了网络架构,但我在传递权重和偏置张量时遇到了问题。使用第三方包,我将所有权重和偏置张量从 torch 网络转换为 numpy 数组,然后将它们写入磁盘。我可以将它们加载回我的 python 程序,但我无法找到一种方法将它们分配给我的 tensorflow 网络中的相应层。
例如,我在tensorflow中定义了一个卷积层
kernel_1 = tf.Variable(tf.truncated_normal([11,11,3,64], stddev=0.1))
conv_kernel_1 = tf.nn.conv2d(input, kernel_1, [1,4,4,1], padding='SAME')
biases_1 = tf.Variable(tf.zeros[64])
bias_layer_1 = tf.nn_add(conv_kernel_1, biases_1)
根据 tensorflow 文档,tf.nn.conv2d 操作使用 kernel_1 变量中定义的形状来构造权重张量。但是,我无法弄清楚如何访问该权重张量以将其设置为我从文件加载的权重数组。
是否可以显式设置权重张量?如果是,怎么做?
(同样的问题也适用于偏置张量。)
如果您在 NumPy 数组中有权重和偏差,将它们连接到您的 TensorFlow 网络应该很容易:
weights_1_array = ... # ndarray of weights for layer 1
biases_1_array = ... # ndarray of biases for layer 1
conv_kernel_1 = tf.nn.conv2d(input, weights_1_array, [1, 4, 4, 1], padding='SAME')
bias_layer_1 = tf.nn.bias_add(conv_kernel_1, biases_1_array)
请注意,您必须确保 weights_1_array
和 biases_1_array
的数据格式正确。有关所需过滤器形状的说明,请参阅 tf.nn.conv2d()
的文档。
我已经在 Torch 中获得了训练有素的神经网络,我需要在 TensorFlow 中完全重建它。我相信我已经在 tensorflow 中正确定义了网络架构,但我在传递权重和偏置张量时遇到了问题。使用第三方包,我将所有权重和偏置张量从 torch 网络转换为 numpy 数组,然后将它们写入磁盘。我可以将它们加载回我的 python 程序,但我无法找到一种方法将它们分配给我的 tensorflow 网络中的相应层。
例如,我在tensorflow中定义了一个卷积层
kernel_1 = tf.Variable(tf.truncated_normal([11,11,3,64], stddev=0.1))
conv_kernel_1 = tf.nn.conv2d(input, kernel_1, [1,4,4,1], padding='SAME')
biases_1 = tf.Variable(tf.zeros[64])
bias_layer_1 = tf.nn_add(conv_kernel_1, biases_1)
根据 tensorflow 文档,tf.nn.conv2d 操作使用 kernel_1 变量中定义的形状来构造权重张量。但是,我无法弄清楚如何访问该权重张量以将其设置为我从文件加载的权重数组。
是否可以显式设置权重张量?如果是,怎么做?
(同样的问题也适用于偏置张量。)
如果您在 NumPy 数组中有权重和偏差,将它们连接到您的 TensorFlow 网络应该很容易:
weights_1_array = ... # ndarray of weights for layer 1
biases_1_array = ... # ndarray of biases for layer 1
conv_kernel_1 = tf.nn.conv2d(input, weights_1_array, [1, 4, 4, 1], padding='SAME')
bias_layer_1 = tf.nn.bias_add(conv_kernel_1, biases_1_array)
请注意,您必须确保 weights_1_array
和 biases_1_array
的数据格式正确。有关所需过滤器形状的说明,请参阅 tf.nn.conv2d()
的文档。