为什么在火花流中属于同一工作的任务的持续时间有很大不同?

Why are the durations of tasks belong to the same job are quite different in spark streaming?

看下图,这24个任务属于同一个job 每个task处理的数据量基本一样,gc的时间也很短,我的问题是为什么同一个job的task的时长相差这么大?

也许您可以尝试检查 事件时间表 以了解您的火花 UI 中的任务。检查为什么慢任务 运行 慢。

他们是否在 serialization/deserialization 中花费了更多时间?

是不是因为调度延迟?

或者执行器计算时间?