EMR 上的 Flink JobManager HA

Flink JobManager HA on EMR

堆栈 EMR:emr-6.1.0(1个master,4个核心节点) EMR 安装应用:FLINK 1.11.0

AWS 文档说 (https://docs.aws.amazon.com/emr/latest/ReleaseGuide/flink-configure.html):

Beginning with Amazon EMR version 5.28.0, JobManager high availability is also enabled automatically. No manual configuration is needed.

但是当我向 Flink jobmanager yarn container -signal container_1601027657994_0003_01_000001 GRACEFUL_SHUTDOWN(与 FORCEFUL_SHUTDOWN 相同)发送终止信号时,纱线容器没有任何反应。 Yarn 不会重启应用程序。

  1. 我还需要启用 EMR Zookeeper 吗? (很可能是,否则,我不明白flink如何理解从哪个保存点重新启动应用程序)。
  2. 我应该使用具有 3 个主节点的 EMR 集群来为 Flink 提供 HA 吗?

是的,要拥有 JobManager HA,您需要拥有一个具有 3 个主节点的 EMR,然后 emr 会自动将故障转移配置添加到 flink-conf.yaml(使用 EMR 6.1.0 测试)