Mxnet - 了解密集层的权重形状
Mxnet - Understanding weight shape for Dense Layer
我正在了解 Mxnet 框架。在遵循此 Linear Regression article 时,我看到以下代码正在创建一个密集层:
net = gluon.nn.Dense(1, in_units=2) # input dimension= 2, output dimension = 1
但为什么 print(net.weight)
的形状为 Parameter dense4_weight (shape=(1, 2), dtype=None)
形状不应该是(2, 1)
吗?
据我了解:
input = Shape(n, 2) where n is number of samples
output = Shape(n, 1)
所以矩阵乘法的权重矩阵应该是Shape(2, 1)对吧?
我在这里错过了什么?
这只是由于内部实施。你可以认为它是权重矩阵在乘法之前被转置。
我正在了解 Mxnet 框架。在遵循此 Linear Regression article 时,我看到以下代码正在创建一个密集层:
net = gluon.nn.Dense(1, in_units=2) # input dimension= 2, output dimension = 1
但为什么 print(net.weight)
的形状为 Parameter dense4_weight (shape=(1, 2), dtype=None)
形状不应该是(2, 1)
吗?
据我了解:
input = Shape(n, 2) where n is number of samples
output = Shape(n, 1)
所以矩阵乘法的权重矩阵应该是Shape(2, 1)对吧?
我在这里错过了什么?
这只是由于内部实施。你可以认为它是权重矩阵在乘法之前被转置。