如何在远程数据中心 (DR) 的两个 Greeplum 集群之间同步数据

How to sync data between two Greeplum Clusters in remote data centers (DR)

我的团队正在规划 DR 解决方案,我们需要在 Greenplum Databases 生产站点和 DR 站点之间同步数据。

我们是 运行 6.4 社区版。因此 gpbackupgprestore 等工具不可用。 pg_dumppg_restore 不是一个选项,因为涉及到大量数据集。哪种方案最适合我们的场景?

gpbackup 和 gprestore 是 Greenplum 用户通常保持两个集群同步的一种方式。

虽然 gpbackup 和 gprestore 不随开源 Greenplum 数据库一起提供,但这些工具本身是开源的,可以从他们自己的存储库中免费获得:https://github.com/greenplum-db/gpbackup

由于 Greenplum 跨段分布数据,因此要求 DR 集群包含相同数量的主要段才能成功恢复(尽管段主机的数量可能不同)。

我们看到 Greenplum 用户实施的一种常见方法是从集群备份到第三方存储系统(NFS、s3 兼容存储等)并从那里恢复到 destination/DR 集群。

这里有一个开源 gpbackup_s3_plugin:https://github.com/greenplum-db/gpbackup-s3-plugin

如果您有任何其他问题,请告诉我们。

橡木