事件:所有 GCP Memorystore 实例已刷新

Incident: All GCP Memorystore instances Flushed

昨天我们注意到所有 GCP Memorystore (Redis) 实例都存在连接问题。

在 Web 控制台中,在 /memorystore/redis/instances 下,指示器显示“正在加载”图标,标题文本为“执行维护”。

几分钟后,与实例的连接恢复了,但是所有数据都是 flushed/deleted! 实例本身似乎进行了某种重启,刷新了所有 RAM。

我们在此事件中丢失了数据,并希望确保在未来避免这种情况。 我们这边有没有什么行为可能触发了这个?我们在多个项目中都看到了这一点,因此我们认为这可能是一个 google 广泛的事件。然而,我们没有在网上看到任何关于此的信息,GCP Memorystore 状态也没有报告任何 incident/downtime.

我相信这里发生的事情是您使用的是基本实例,在此实例中无法保证数据持久性,基本实例更适合用作缓存实例,如本文所述link

在这种情况下,您可以使用标准层,之前共享的文档也说明了这一点:“标准层提供了一个高度可用的 Redis 实例,具有自动故障转移和最小数据丢失。”

基本上,发生的事情是,当这些实例被移动到另一个状态时,如果它是一个基本实例,表就会被刷新。