频道与 Samples/Dimension 有何不同?

How do Channels differ from Samples/Dimension?

我对"channels"在各种数据类型中的定义感到困惑。

在 CNN 中,为什么彩色图像被归类为具有 3 通道 RGB 的 2D 数据(深度学习,Ian Goodfellow 等人)而不是 3D 数据?

在此处包含时间序列数据的 LSTM 论文中(第 4.1 节),https://arxiv.org/pdf/1702.03402.pdf 为什么作者认为它们是不同的通道而不是不同的样本?

在一些NLP的论文中,我也经常看到通道这个词。

归根结底,"channel" 直观上是什么?

每个像素是一个具有3个通道的特征,但这些特征是2D的。从某种意义上说,你是对的,不仅仅是二维特征,但在空间上它是二维的。这很重要,因为卷积运算采用的是在空间维度上滑动过滤器。

同样,字符可以被认为是具有 300D 嵌入特征的句子的特征。应用卷积时,句子被视为一维,因为滑动 window 仅沿时间维度移动。在这种情况下,嵌入可以被视为通道。

因此,这取决于您希望如何处理和解释一系列特征。通常,当涉及时间或space时,在时间和space中的每个位置上的特征称为可观察通道,在这种情况下通常使用时间-space的维度来组合可观察到有意义的单位。