验证码安全和深度学习

Captcha Security and Deep Learning

我看到这篇研究论文-http://www.cs.sjsu.edu/~pollett/papers/neural_net_plain.pdf.

这些研究人员想出了一种破解基于字符的验证码的方法，他们似乎已经成功了，因为他们使用了 1300 万个验证码来训练他们制作的 CNN，并获得了高于 95% 的准确率。

我们如何确保验证码安全，使其不被深度学习模型绕过？

首先，验证码旨在停止自动 users/bots。是的，如果你有实际的验证码生成器，并且你在该分布上训练了一个深度学习模型，它很可能会表现良好。

验证码越来越难，还可以更难。但是，它需要资源来生成验证码，实际的计算资源（除非它们是随机图像而不是合成图像）。如果需要做一个真正防bot的网站，可以做。

对于机器人来说，它通常意味着网络抓取 tools/automated 用户，他们试图像人类用户一样做事，但是非常快。现在，如果您还将深度学习模型集成到其中，则可以绕过验证码（在大多数情况下），但这可能有点矫枉过正（取决于您的需要）。从机器人中保存网站不如面部识别、自动驾驶汽车重要（相对声明）。