识别执行者或驱动程序是否在 Foundry 中 OOMing

Identifying whether the executor or the driver is OOMing in Foundry

我的一个构建目前正在 OOMing。为了更好地确定后续优化步骤,我需要确定执行程序或驱动程序是否 OOMing。

确定执行程序或驱动程序是否在 Foundry 中 OOMing 的最佳方法是什么?

执行器/驱动程序是否OOMing通常可以通过检查构建来确定。

当执行程序很可能 OOMing 时,构建应显示以下错误:

当驱动程序很可能 OOMing 时,构建应该显示以下错误:

除此之外,通常可以应用的一些规则如下:

  • 如果缺少shuffle输出位置,很可能是执行器OOMing。
  • 如果执行器丢失,很可能是执行器OOMing
  • 如果模块不可达,很可能是驱动OOMing