基于矢量输入生成或预测图像

Generate or predict image based on a vector input

我想根据给定的输入(向量或标量)以 mxn 图像的形式生成状态场(例如 x-y 平面中的温度场)。

为了简单起见,让我举个简单的例子: 如果输入为 0,则输出应该是一只黑猫。对于输入 = 0.53,输出是一只棕色的猫,....,对于输入 = 3,它是一只黑狗,依此类推。

可以认为是逆向分类,但我不太确定。

根据我目前的搜索,我认为这是一个图像生成问题,其中可以在标记的数据集上使用 GAN 或自动编码器(我有不同输入向量的图像)。 我的问题:

  1. 这是解决这个问题的正确方法吗?如果是这样,你能推荐一些好的例子吗?

  2. 如果这不是正确的解决方法,能否请您分享一下您的解决方法?

自动编码器可能是合适的,您需要通过将相同的图像作为输入和输出来进行训练。然后,在训练时,您可以记录编码器和解码器模块之间的潜在向量。之后,您可以将这些向量与自动编码器的解码器部分一起使用来生成图像。

培训: 编码器 --> [潜在向量] --> 解码器

预测

[潜在向量] --> 解码器 --> 输出

这只是一个想法,我以前没有尝试过。希望对你有帮助:D

这是 GAN 的典型问题。特别是条件 GAN 可以用来解决这个问题。查看以下 link 了解更多信息: https://phillipi.github.io/pix2pix/