Mxnet - 了解密集层的权重形状

Mxnet - Understanding weight shape for Dense Layer

我正在了解 Mxnet 框架。在遵循此 Linear Regression article 时,我看到以下代码正在创建一个密集层:

net = gluon.nn.Dense(1, in_units=2) # input dimension= 2, output dimension = 1

但为什么 print(net.weight) 的形状为 Parameter dense4_weight (shape=(1, 2), dtype=None)

形状不应该是(2, 1)吗?

据我了解:

input = Shape(n, 2) where n is number of samples
output = Shape(n, 1)

所以矩阵乘法的权重矩阵应该是Shape(2, 1)对吧?

我在这里错过了什么?

这只是由于内部实施。你可以认为它是权重矩阵在乘法之前被转置。