Spark UI 输出操作持续时间与作业持续时间:有何区别?

Spark UI Output Op Duration vs Job Duration: What's the difference?

在 Spark UI 页面上,列的区别是什么:"Output Op Duration" 和 "Job Duration"?

来自火花 mailing list:

"表示运行一个batch的总时间,包括Spark作业时长+ 在 driver 上花费的时间。例如,

foreachRDD { rdd =>
   rdd.count() // say this takes 1 second.
   Thread.sleep(10000) // sleep 10 seconds
}

上例中Spark作业时长为1秒,输出op 持续时间为 11 秒。"