Pytorch张量的哪一部分代表通道?

Which part of Pytorch tensor represents channels?

令人惊讶的是,我在互联网上四处寻找后都没有找到这个问题的答案。我对 3d 张量特别感兴趣。通过我自己的实验,我发现当我创建一个张量时:

h=torch.randn(5,12,5)

然后在上面放一个卷积层,定义如下:

conv=torch.nn.Conv1d(12,48,3,padding=1)

输出是一个 (5,48,5) 张量。所以,我假设对于 pytorch 中的 3d 张量,中间的数字代表通道数,我是否正确?

编辑:似乎当运行一个conv2d时,输入维度是张量中的第一个条目,我需要使它成为一个4d张量(1,48,5,5)例如.现在很迷茫...

非常感谢任何帮助!

对于 conv2D,输入应为 (N, C, H, W) 格式。 N是samples/batch_size的个数。 C是渠道。 H 和 W 分别是高度和宽度。

请参阅 https://pytorch.org/docs/stable/nn.html#torch.nn.Conv2d

处的形状文档

对于 conv1D,输入应为 (N,C,L) 请参阅 https://pytorch.org/docs/stable/nn.html#conv1d

上的文档