他们在所有 AWS 区域的容量是否足以用于灾难恢复

Is their enough capacity in all AWS regions for disaster recovery

万一发生灾难,当整个 AWS 区域发生故障并且其所有客户都希望在灾难恢复场景中将他们的工作负载移动到下一个最近的区域时,AWS 是否为此做好了准备? 我想象每个地区有数百万台服务器 运行。 AWS 是否准备好在第二天在另一个区域提供它们?他们有准备好的能力吗?

AWS global infrastructure is using the concept of Availability Zones 在每个区域内,划分资源,隔离风险并最终减少最终故障的爆炸半径。可用区是一个区域内的数据中心组,它们被设计为在风险方面相互独立(即与电网的不同连接、冗余和隔离的网络基础设施、在地震、食物等地理风险方面隔离) 一些服务旨在自动利用这种冗余基础设施(Amazon S3、Amazon DynamoDB、ELB 等),客户无需配置任何东西,区域级别的冗余和故障转移由该服务处理。其他一些服务在 AZ 级别运行(Amazon EC2、EBS、RDS 等)对于这些服务,最佳实践是针对多个 AZ 架构和数据复制进行设计。
在极少数情况下,某个可用区中的服务不可用,well architected architecture 将透明地故障转移到另一个可用区,不会对客户造成任何明显影响。

回到您的问题,该体系结构旨在避免 region-wide 所有服务出现故障。自从我们在 2006 年推出 AWS 以来,这从未发生过。而且,是的,我们有很多容量。我建议您观看 James Hamilton 的主题演讲以了解更多信息 https://www.youtube.com/watch?v=AyOAjFNPAbA