kafka broker长时间不活跃,多天后启动有什么影响?

What are the impacts of kafka broker being incative for long duration and startup after many days?

我们正在处理可能需要几天时间才能解决的生产问题。大多数 Kafka 节点都处于活动状态。一个节点宕机了。我们会在错误修复后提出。我们的Kafka版本是2.1.X。

我很好奇几天后启动一个不活跃的经纪人会产生什么影响。

有什么我们可能会观察到的问题吗? (特别是在副本赶上重新启动的代理后对消费者的影响。)

安全推出的突发事件是什么?

每当代理宕机时,建议尽快恢复。消费者偏移量过期并且日志结束偏移量也在活动集群中定期清理。

我们能够在 4 天后恢复节点,但操作并不容易。我们通过启用不干净的领导者选举来恢复 Kafka 集群。由于错误的领导分配,我们一直在控制停工。非活动节点恢复后,我们禁用了不干净的领导者选举。

需要考虑的事项:

  • 在产品中,客户通常不会有任何停机时间。监控消费者 任何长期重新平衡或超出 SLA 的滞后提交的组。

  • 运行 如果恢复节点上的偏移量,则进行首选副本选举 正在直播。

  • 重置消费者组的偏移量。这确实需要一个简短的 停机时间。

回滚:

您可以使用重新分配工具回滚主题分区,但没有简单的回滚。