关于神经网络中输入和目标的分配

Regarding Assignment of Input and Target in Neural Network

我正在使用神经网络设计 OCR 算法。我有每个字符的 100 个图像（[40x20] 矩阵）所以我的输入应该是 2600x800。我对输入和目标有一些疑问。

1) 我的输入正确吗？ 2600张图片可以全部乱序使用吗？

2) 目标应该是什么？我必须为所有 2600 个输入定义目标吗？

3) 由于同一个字符的目标是单一的，那么最终的目标向量是多少？ (26x800) 或 (2600x800)？

您的输入应该是正确的。您有（我猜）26 个字符和 100 个大小为 800 的图像，因此矩阵看起来不错。作为旁注，输入尺寸看起来相当大，您可能需要考虑进行 PCA 并使用特征值进行训练，或者只是减小图像的尺寸。我已经能够用 10x10 图像训练 NN，但更大 == 更难。尝试，如果它不起作用，请尝试进行 PCA。
(and 3) 当然，如果你想训练一个神经网络，你需要给它输入和输出，否则你打算怎么训练它？对于每张图像，您的输入大小应为 26x1，因此训练输出应为 2600x26。在每个输出中，它所属的字符索引应为 1，其余为零。