验证码安全和深度学习

Captcha Security and Deep Learning

我看到这篇研究论文-http://www.cs.sjsu.edu/~pollett/papers/neural_net_plain.pdf.

这些研究人员想出了一种破解基于字符的验证码的方法,他们似乎已经成功了,因为他们使用了 1300 万个验证码来训练他们制作的 CNN,并获得了高于 95% 的准确率。

我们如何确保验证码安全,使其不被深度学习模型绕过?

首先,验证码旨在停止自动 users/bots。是的,如果你有实际的验证码生成器,并且你在该分布上训练了一个深度学习模型,它很可能会表现良好。

验证码越来越难,还可以更难。但是,它需要资源来生成验证码,实际的计算资源(除非它们是随机图像而不是合成图像)。如果需要做一个真正防bot的网站,可以做。

对于机器人来说,它通常 意味着网络 抓取 tools/automated 用户,他们试图像人类用户一样做事,但是非常快。现在,如果您还将深度学习模型集成到其中,则可以绕过验证码(在大多数情况下),但这可能有点矫枉过正(取决于您的需要)。 从机器人中保存网站不如面部识别、自动驾驶汽车重要(相对声明)。