Conv1D、Conv2D、Conv3D 之间的区别以及在卷积神经网络 (CNN) 中使用哪一个

Difference between Conv1D, Conv2D, Conv3D and where to use which in Convolutional Neural Network (CNN)

我是深度学习的新手,正在做深度学习的最后一年项目。我知道我们在图像相关任务中使用 Conv2D,但我的教授问我为什么不使用 Conv1D 或 Conv3D?为什么我们这里专门使用Conv2D。我已经搜索了整个互联网以获得这个问题的正确答案,但我似乎没有找到任何可靠的答案。请帮助我解决这个问题,因为我很困惑,似乎没有找到任何合适的答案。

谢谢!

在一维 CNN 中,内核沿 1 个方向移动。一维 CNN 的输入和输出数据是二维的。它主要用于 Time-Series 数据,因为您可以向左或向右移动 (x)。

在二维 CNN 中,内核在 2 个方向上移动。 2 维 CNN 的输入和输出数据是 3 维的。正如您所提到的,它广泛用于图像相关任务,因为除了左右移动之外,您还可以上下移动 (x,y)。

在 3 维 CNN 中,内核在 2 个方向上移动。 3 维 CNN 的输入和输出数据是 4 维的。由于内核在 3 个维度上滑动,您有 (x,y,z) 可能的移动。一个示例用例是医学成像,因为它们是由切片拍摄然后重建的 3 维图像。所有加在一起的切片必须作为一个整体进行分析,因此拍摄单个图像并应用二维卷积是没有意义的,因为关系已经丢失,您需要堆叠所有图像以获得“3d”表示并使用3 维卷积。