识别非数字

Recognize Non-Digits

我编写了一个神经网络来识别推送到我的服务器的单个数字。我工作得很好,直到客户开始推动 "empty digits"。 首先,我开始只是手动迭代它们并检查 NOT WHITE。现在它变得更加复杂,因为上传了 "dirty" 空白,其中有一些噪音。 另外一些人开始推动对角线和水平线或 X 而不是写 0(零)。

我想知道我应该如何训练一个 "pre" 神经网络来对这些进行分类 "not digits" 特别是我很难找到一种方法来训练由嘈杂的空白所描绘的零点。

您可以创建一个包含 错误 输入的训练集,并使用一个额外的 class 训练网络来处理那些错误的示例。

您使用的是神经网络,我的建议是使输入的 neural network output the probability 成为给定的 class,例如它可能会输出数字 5,确定性 75%。

一旦你有了这些概率,你就可以找到一个 "cutoff" 值,低于该值你会认为输入只是 noise/empty。

我在上面链接了一个关于从 NN 中获取 class化概率的问题。