如何在 2 个实例之间迁移 Apache Druid 数据?

How to migrate Apache Druid data between 2 instances?

我们有 2 个德鲁伊实例,一个用于阶段和数据验证,另一个用于生产。在阶段实例上加载并验证数据后,我们需要将其迁移到生产环境。有什么方法可以直接将数据迁移到其他实例而不是重新加载?

嗯,理论上你唯一需要的就是段数据记录和原始数据文件。如果您将元数据存储在(例如)MySQL 中,则可以从 druid_segments table.

中导出记录

druid_segments 记录还将显示段文件的存储位置(请参阅 payload 列。

您现在应该将数据文件复制到生产中使用的位置。确保负载列“指向”这个正确的位置。

现在导入生产环境的记录,应该就可以解决了。

在将其应用到生产环境之前,请在测试环境中对其进行测试。

也许此页面会对您有所帮助。它包含对您的情况有用的信息:https://support.imply.io/hc/en-us/articles/115004960053-Migrate-existing-Druid-Cluster-to-a-new-Imply-cluster