为什么 spark streaming executors 在不同的时间启动?
Why spark streaming executors start at different time?
我正在使用 Spark streaming 1.6,它使用 kafka 作为源
我的输入参数如下:
num-executors 5
num-cores 4
batch Interval 10 sec
maxRate 600
blockInterval 350 ms
为什么我的某些执行程序比其他执行程序启动得晚??
那不是执行者的开始时间,而是任务的开始时间。
这很可能是由于位置调度。 Spark 延迟了任务的开始,以找到 运行 该任务的最佳执行者。请检查 Spark's documentation 中的配置 "spark.locality.wait" 以获取更多详细信息。
我正在使用 Spark streaming 1.6,它使用 kafka 作为源
我的输入参数如下:
num-executors 5
num-cores 4
batch Interval 10 sec
maxRate 600
blockInterval 350 ms
为什么我的某些执行程序比其他执行程序启动得晚??
那不是执行者的开始时间,而是任务的开始时间。
这很可能是由于位置调度。 Spark 延迟了任务的开始,以找到 运行 该任务的最佳执行者。请检查 Spark's documentation 中的配置 "spark.locality.wait" 以获取更多详细信息。