看不懂unet架构

Unable to understand unet architecture

我试图复制 UNET 架构,但在理解为什么编码器部分中写有 16 时遇到了问题:

这是架构的一部分还是我们需要随机选择它?我知道这是 conv 层的输出通道数,但为什么 16,而不是任何其他数字?

这是一项设计决定,因此您不会为您的问题找到明确的理由。

除此之外,建筑中的数字通常保持为2的倍数,这里是2**4。这是出于实际原因。它通常是测试可变大小网络的首选方法:他们会尝试改变层数、通道数以及其他网络布局,并通过实验找出最适合任务的方法。


关于你的第一个问题,

should we need to choose it randomly [...]?

如果您想首先复制它,为什么不遵守网络规范?如果您发现用 8 代替 16 或什至 32 有优势,如果您有能力这样做,那就继续吧!