如何处理 Amazon EC2 上的机器人攻击

How to handle bots attack on Amazon EC2

我遇到以下问题:我们在带有 RDS 数据库实例的 Amazon EC2 中型实例上托管电子商务,这通常 运行 很好,但因为我们使用的是产品定时 "releases"一些用户正在使用机器人自动将商品添加到购物车并结账,导致网站 运行 非常缓慢然后崩溃,基本上就像 ddos​​ 攻击。最初很少有用户这样做,所以我在访问日志中找到了他们的 ip 并阻止了他们。现在消息正在传播,我无法手动将 ips 添加到黑名单,但我需要一种 "professional" 方法来执行此操作。一些朋友建议我使用 Cloudflare,但我想问是否有办法在 AWS 内部或直接使用 Apache 执行此操作。 提前致谢

大师,

这听起来像是黑名单、限速等常用的反抓取手段无法解决的问题。

为什么不呢:

黑名单 :根据它们的 IP 类型(托管、开放代理),您可以使用您可以在互联网上轻松找到的黑名单之一(这些非常漂亮好 https://www.iblocklist.com/).
但是,一旦他们获得阻止,就会切换到其他解决方案,直到他们找到一个未列入黑名单的 IP 地址(或数千个)。

速率限制: 您还可以尝试阻止每小时或每分钟执行超过 x 个请求的 IP 地址。但由于它们分布在大量的 IP 地址上以避免被发现,因此限制它们并不是很有帮助。

你可以做的是实施一个好的验证码系统,看看会发生什么。 这可以阻止这些爬虫,但请考虑那里有很多验证码求解器。(http://www.scrapesentry.com/scraping-wiki/common-methods-tools-break-captcha/)

此外, 另一种方法是阻止共享相同 session_id 的 IP 地址。 这是非常危险的,因为有 ISP 通过多个网关来平衡流量。