在mnist数据集上应用torchvision.transforms后,如何使用cv2_imshow查看它?
After applying torchvision.transforms on mnsit dataset, how to view it using cv2_imshow?
我正在尝试在 google collaboratory 中实现一个简单的 GAN,在使用变换对图像进行归一化后,我想在输出端查看它以显示生成器生成的假图像和真实图像端通过在数据集中像视频一样每批次迭代一次。
transform = transforms.Compose(
[
# Convert a PIL Image or numpy.ndarray to tensor. This transform does not support torchscript.
# Converts a PIL Image or numpy.ndarray (H x W x C) in the range
# [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0]
transforms.ToTensor(),
# Normalize a tensor image with mean and standard deviation.
transforms.Normalize((0.5,),(0.5,))
])
dataset = datasets.MNIST(root="dataset/", transform=transform, download=True)
loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)
在对数据集应用转换后,它不再处于 [0,255] 范围内。我们如何对其进行非规范化并使用 cv2_imshow
在同一位置逐帧显示一系列真实和虚假图像?
上图显示了我得到的输出,这里有两个问题。
- 图像归一化,使图像无法区分,只是全黑。
- 图像不会像视频那样在同一个地方逐帧显示,而是换行打印。
我应该采取什么方法来解决这些问题?
问题 1
假设 torch_image
是 torch.FloatTensor 形状 (C x H x W) 在 [0.0, 1.0] 范围内:
numpy_image = torch_image.permute(1, 2, 0).numpy() * 255
然后您可以使用 cv2.
显示 numpy_image
问题2
如果您想刷新打印图像而不是打印新图像,您可以尝试此处提供的解决方案:
发现我没有反规范化
def denormalize(x):
# Denormalizeing
pixels = ((x *.5)+.5)*255
return pixels
上面的函数做到了,将其转换回范围[0,255]。
我还没有找到问题 2 的任何解决方案。
我正在尝试在 google collaboratory 中实现一个简单的 GAN,在使用变换对图像进行归一化后,我想在输出端查看它以显示生成器生成的假图像和真实图像端通过在数据集中像视频一样每批次迭代一次。
transform = transforms.Compose(
[
# Convert a PIL Image or numpy.ndarray to tensor. This transform does not support torchscript.
# Converts a PIL Image or numpy.ndarray (H x W x C) in the range
# [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0]
transforms.ToTensor(),
# Normalize a tensor image with mean and standard deviation.
transforms.Normalize((0.5,),(0.5,))
])
dataset = datasets.MNIST(root="dataset/", transform=transform, download=True)
loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)
在对数据集应用转换后,它不再处于 [0,255] 范围内。我们如何对其进行非规范化并使用 cv2_imshow
在同一位置逐帧显示一系列真实和虚假图像?
上图显示了我得到的输出,这里有两个问题。
- 图像归一化,使图像无法区分,只是全黑。
- 图像不会像视频那样在同一个地方逐帧显示,而是换行打印。
我应该采取什么方法来解决这些问题?
问题 1
假设 torch_image
是 torch.FloatTensor 形状 (C x H x W) 在 [0.0, 1.0] 范围内:
numpy_image = torch_image.permute(1, 2, 0).numpy() * 255
然后您可以使用 cv2.
显示numpy_image
问题2
如果您想刷新打印图像而不是打印新图像,您可以尝试此处提供的解决方案:
发现我没有反规范化
def denormalize(x):
# Denormalizeing
pixels = ((x *.5)+.5)*255
return pixels
上面的函数做到了,将其转换回范围[0,255]。
我还没有找到问题 2 的任何解决方案。