什么是将图像而不是潜在向量作为输入的 GAN？

What are GANs that take images as input instead of latent vectors?

这里我是GAN领域的新人。我知道最初的 GAN 将潜在向量作为输入。但是如果我想完成样式转换和去水印等任务，输入可能是一张图片。

然后它让我想到如果我想基于原始 GAN 架构做这样的工作，我可能需要一个自动编码器来将图像转换为潜在向量。这是一个合法的想法吗？

现在我知道 Pix2pix 可能是我需要的。但是，完成这项 'image converting' 任务的早期 GAN 架构是什么？

非常感谢。

有VAE-GAN, which likely can achieve what you want, you likely don't even need the "variational" part, You might also want to look into CycleGAN.