yarn.resourcemanager.am.max-attempts 的真正含义是什么?

What does yarn.resourcemanager.am.max-attempts really mean?

我在yarn-site.xml中有一个配置入口如下:

<property>
  <name>yarn.resourcemanager.am.max-attempts</name>
  <value>4</value>
</property>

请问这到底是什么意思,有以下两种情况:

  1. 说,我有一个 ApplicationMaster,它有一个错误。当我向 YARN 提交应用程序时,它会尝试启动 Application Master 5 次然后应用程序失败(我假设错误导致 AM 无法启动)

  2. 请问,我启动了一个yarn应用,我手动kill了ApplicationMaster进程,applicationMaster会自动重启吗? 这样的话,我再做4次kill the application - application restarted,AM会不会再重启了?

假设 AM 出现故障并死机。或者它有内存泄漏,导致它超过容器大小并被杀死。如果它死了 4 次,那么应用程序的状态是 FAILED.

因此,为了回答您的问题,假设您指的是 4 而不是 5,则 1 为真,而 2 为真。如果您想进一步了解这一点,请查看 TestAMRestart.java.