如何在 Keras 中针对不同的输出大小训练网络

Question

我有使用 Keras 创建的基本神经网络。我成功地使用数据向量和相应的输出数据（具有两个元素的向量）训练了网络。它表示一个坐标（x，y）。所以输入一个数组，输出一个数组。

问题是我无法使用单个输入向量应对应多个坐标的训练数据。实际上，我想要一个坐标向量作为输出，而无需事先了解坐标的数量。

网络由

创建

model = Sequential()
model.add(Dense(20, input_shape=(196608,)))
model.add(Dense(10))
model.add(Dense(2))

模型摘要显示了每一层的输出维度

_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
dense_1 (Dense)              (None, 20)                3932180
_________________________________________________________________
dense_2 (Dense)              (None, 10)                210
_________________________________________________________________
dense_3 (Dense)              (None, 2)                 22
=================================================================

我意识到网络结构只允许长度为 2 的向量作为输出。密集层也不接受 None 作为它们的大小。如何修改网络，使其可以训练并输出向量的向量（坐标列表）？

Answer 1

循环神经网络（RNN）会更合适，这种模型通常称为seq2seq，即sequence to sequence。循环网络使用 LSTM 和 GRU 等层，可以输入和输出可变长度序列。看看用 RNN 完成的机器翻译之类的事情。

这可以直接用keras完成，网上有很多例子，比如this一个

Answer 2

rnn 不是您想要预测坐标的。相反，我建议使用预测坐标和相关置信度的模型。因此，对于模型的每次前向传递，您都会有 100 个坐标预测。这些预测中的每一个都会有另一个关联的预测来确定它是否正确。只有高于特定置信度阈值的预测才算数。该置信度阈值允许模型选择每次要使用多少点（最大数量由输出数量设置，在本例中为 100）。

r-cnn 就是一个可以做到这一点的模型。这是我在 github https://github.com/yhenon/keras-frcnn 上找到的第一个 keras 实现。

如何在 Keras 中针对不同的输出大小训练网络

How to train a network in Keras for varying output size

python

regression

keras

tensorflow