关于神经网络中输入和目标的分配

Regarding Assignment of Input and Target in Neural Network

我正在使用神经网络设计 OCR 算法。我有每个字符的 100 个图像([40x20] 矩阵)所以我的输入应该是 2600x800。我对输入和目标有一些疑问。

1) 我的输入正确吗? 2600张图片可以全部乱序使用吗?

2) 目标应该是什么?我必须为所有 2600 个输入定义目标吗?

3) 由于同一个字符的目标是单一的,那么最终的目标向量是多少? (26x800) 或 (2600x800)?

  1. 您的输入应该是正确的。您有(我猜)26 个字符和 100 个大小为 800 的图像,因此矩阵看起来不错。作为旁注,输入尺寸看起来相当大,您可能需要考虑进行 PCA 并使用特征值进行训练,或者只是减小图像的尺寸。我已经能够用 10x10 图像训练 NN,但更大 == 更难。尝试,如果它不起作用,请尝试进行 PCA。
  2. (and 3) 当然,如果你想训练一个神经网络,你需要给它输入和输出,否则你打算怎么训练它?对于每张图像,您的输入大小应为 26x1,因此训练输出应为 2600x26。在每个输出中,它所属的字符索引应为 1,其余为零。