哪种方法理论上最好?

Which method should theoretically be best?

假设我想使用神经网络识别我的角色。让我们把它缩减为 5 个字母,图像的二进制形式为 16x16,输入 + 2 层网络,两层内的单极函数。学习过程中使用动量反向传播。

以下哪种方法应该给出最好的结果(其中 x 是第一层中的神经元数量)?最好的意思是正确识别的最高百分比。速度不是这个问题的一个因素。

  1. 单个网络,256;x;5 - 价值最高的神经元获胜。
  2. 5 个网络,256;x;1 - 每个网络都有自己的字母,每个输出都经过阈值测试,可能会发生 2 个或更多网络将图像识别为 "their own"
  3. 同上,但是现在每个网络的输出都归一化了(如果a,b,c,d,e是输出,那么a = a / (a+b+c+d+e); b = b / (a+b+c+d+e) 等等)

2 是最糟糕的选择,因为“2 个或更多网络将图像识别为 "their own"”肯定会发生很多次,之后您如何区分它们? 1 会工作得很好。 3 是 softmax 输出函数背后的基本思想,softmax 通常最适合分类任务,尤其是与交叉熵误差函数结合使用时。