我如何确定我的 Foundry 工作的阶段有偏差?
How do I identify that my Foundry job's stage has skew?
我有一份工作运行一个阶段似乎需要很长时间。我听说这可能是由于名为 'skew'.
的原因造成的
我怎么知道我是否受到此影响?
我知道这通常与联接、windows 和其他引起随机播放的操作相关联,但我不知道如何识别它。
- 打开 Spark 详细信息,如
- 确定当前 运行ning 阶段或总体上最慢的阶段
- 单击此阶段的行以显示阶段详细信息按钮
- 单击阶段详细信息按钮
- 查看屏幕顶部的舞台指标。如果您看到较少数量的任务 运行ning 明显比其他任务长,这意味着您有偏差
- 如果您单击最慢的任务,您将在下面的概述中找到突出显示的任务,这将指示输入/输出的大小。
在上面的示例中,此作业 + 阶段中有一个任务需要比 运行 长几个数量级,因为它的输入大小比其他任务大几个数量级。
这是倾斜任务/倾斜阶段的定义。
如果您想知道什么值导致此任务变慢,请查看
上的指南
我有一份工作运行一个阶段似乎需要很长时间。我听说这可能是由于名为 'skew'.
的原因造成的我怎么知道我是否受到此影响?
我知道这通常与联接、windows 和其他引起随机播放的操作相关联,但我不知道如何识别它。
- 打开 Spark 详细信息,如
- 确定当前 运行ning 阶段或总体上最慢的阶段
- 单击此阶段的行以显示阶段详细信息按钮
- 单击阶段详细信息按钮
- 查看屏幕顶部的舞台指标。如果您看到较少数量的任务 运行ning 明显比其他任务长,这意味着您有偏差
- 如果您单击最慢的任务,您将在下面的概述中找到突出显示的任务,这将指示输入/输出的大小。
在上面的示例中,此作业 + 阶段中有一个任务需要比 运行 长几个数量级,因为它的输入大小比其他任务大几个数量级。
这是倾斜任务/倾斜阶段的定义。
如果您想知道什么值导致此任务变慢,请查看