Encog神经网络隐藏层最佳神经元数

Best number of neurons in hidden layer of Encog neural network

我有一个结构如下的神经网络： 7 个输入神经元，3 个输出神经元。

网上说隐藏层的神经元数是第一层神经元数的1.5-2倍时效果最好。即在我的情况下是 14。我正在使用弹性传播训练方法在 C# 中教授网络。

训练运行大约 100k 个周期。我实际上得到了更好的结果——我拥有的隐藏神经元越多！不仅是数量的 2 倍，而且是输入层数量的 6 倍。换句话说，目前总共定义了 44 个隐藏神经元！它只会越来越好。

我开始觉得这里有些不对劲。隐藏的神经元数量将如何影响网络的有效性？

我可以继续增加计数.. 50..60..70。我从低至 11 btw 开始，这种训练的结果很糟糕。请解释为什么更高的隐藏神经元数量会带来十倍更好的结果，以及它如何影响网络对真实数据的有效性，而不仅仅是训练集。（2k 条记录）

隐藏神经元的数量称为超参数。几乎所有的机器学习模型都有超参数。对于支持向量机，它是 gamma 和 C 等。基本上，这些超参数会影响您的模型在学习数据集方面的成功程度。这几乎总是归结为反复试验。对于神经网络，您应该坚持使用单个隐藏层（参见通用逼近定理）。

一般来说，隐藏神经元越多，训练效果越好。但是，这可能会鼓励过度拟合。确保您正在使用训练集之外的数据测试网络。理想情况下，您只需要足够多的隐藏神经元来让神经网络达到这样的程度，即添加更多神经元不会提高您在验证数据（您未用于训练网络的数据）上的性能。

再澄清一下。您是否将数据分为两部分：训练和检查。例如，如果您有 1000 个示例，您可以使用 800 个进行训练，并检查剩余 200 个示例的结果。通常，如果训练集表现得非常好，那么测试集质量会在一定程度上提高，然后下降。您需要在训练集和检查集的良好结果之间找到平衡。