Tensorflow在训练resnet时是如何处理Tfrecord格式的ImageNet图像的？

Question

emm，imagenet转Tfrecord格式比较复杂，所以从某处下载了处理好的Tfrecord imagenet

我用Pytorch的参数应用到tensorflow中的resnet34上，发现准确率只有55%，太低了。我猜原因可能是 Pytorch.models 和这个 Tfrecord 之间处理 imagenet 的方法不同。还有一个好兄弟告诉我Pytorch如何处理数据的方式，但我仍然需要知道tensorflow如何处理它。

我发现Tfrecord图片的取值范围是-1到1，能不能告诉我这个Tfrecord的处理方法，以便我尝试提高精度？

非常感谢！我也是new_flesh，你们的帮助太重要了

Answer 1

好的，让我自己给出我在 Whosebug 中的第一个答案。

处理图像的不同方式会影响准确性，没错。

Pytorch 将图片缩放到 [0,1]，然后使用均值和标准差对其进行归一化。

而我找到的 Tfrecord 文件将图片缩放到 [0,1]，然后通过以下方式将它们缩放到 [-1, 1]：

image = tf.subtract(image, 0.5)
image = tf.multiply(image, 2.0)

（我认为这是一种奇怪的方式）。

所以我在这两行中添加了注释，得到了 66% 的准确率。通过fine_tune，得到了72%（但我仍然不明白从Pytorch到Tensoflow传递参数时精度下降）。

PS: 这段时间发现在tensorflow中保存模型时operator中设置的参数会被保存，不用担心operator的参数怎么设置一样。

Tensorflow在训练resnet时是如何处理Tfrecord格式的ImageNet图像的？

How did Tensorflow process images of ImageNet in Tfrecord format when training resnet?

tensorflow

resnet

imagenet

pytorch

tfrecord