鉴别器如何在 DCGAN 上工作?

How discriminator works on DCGAN?

我在研究 DCGAN,对此我有些疑惑。

在 Ian Goodfellow 的自然 GAN 中,判别器模型输出一个标量值,表示概率。 但是 DCGAN 的判别器是用 CNN 架构设计的。我知道 CNN 的输出是 class 概率的向量。

那么判别器在 DCGAN 上是如何工作的呢? DCGAN 的鉴别器的输出是什么?

详见 Image Completion with Deep Learning in TensorFlow

简而言之:假设您制作了一个 CNN,它具有 n 个输入大小和有效填充大小的过滤器。然后输出的形状将是 n x 1 x 1。然后您可以将 softmax 应用于该形状,并且通道中有概率。

您可能还想阅读 2.2.1. Convolutional Layers 我的硕士论文。

Discriminator D 获取 3x64x64(例如)输入图像,通过一系列 Conv2d、BatchNorm2d 和 LeakyReLU 层对其进行处理, 并通过一个Sigmoid激活函数输出最终的概率。

让我们看一个示例代码以了解它的输入和输出。

class Discriminator(nn.Module):
def __init__(self, ngpu):
    super(Discriminator, self).__init__()
    self.ngpu = ngpu
    self.main = nn.Sequential(

        nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),
        nn.LeakyReLU(0.2, inplace=True),

        nn.Conv2d(ndf, ndf*2, 4, 2, 1, bias=False),
        nn.BatchNorm2d(ndf*2),
        nn.LeakyReLU(0.2, inplace=True),

        nn.Conv2d(ndf*2, ndf*4, 4, 2, 1, bias=False),
        nn.BatchNorm2d(ndf*4),
        nn.LeakyReLU(0.2, inplace=True),

        nn.Conv2d(ndf*4, ndf*8, 4, 2, 1, bias=False ),
        nn.BatchNorm2d(ndf*8),
        nn.LeakyReLU(0.2, inplace=True),

        nn.Conv2d(ndf*8, 1, 4, 1, 0, bias=False),
        nn.Sigmoid()

    )

def forward(self, input):
    return self.main(input)

更多详情,visit here