如何结束 Spark Submit 和 State Accepted

How to end Spark Submit and State Accepted

我正在 运行 使用 apache griffin 进行数据清理工作:https://griffin.apache.org/docs/quickstart.html

并在提交 spark 作业后

spark-submit --class org.apache.griffin.measure.Application --master yarn --deploy-mode client --queue default \ --driver-memory 1g --executor-memory 1g --num-executors 2 \ /home/bigdata/apache-hive-2.2.0-bin/measure-0.4.0.jar \ /home/bigdata/apache-hive-2.2.0-bin/env.json /home/bigdata/apache-hive-2.2.0-bin/dq.json

我的作业提交如下:

20/04/08 13:18:30 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:31 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 2008 年 4 月 13:18:32 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:33 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:34 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:35 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:36 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:37 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:38 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:39 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受) 20/04/08 13:18:40 信息 yarn.Client:application_1586344612496_0247 的申请报告(状态:已接受)

永不止步:

并且当我检查纱线的状态时:

bigdata@dq2:~$纱线应用-状态application_1586344612496_0231 20/04/08 13:16:31 信息 client.RMProxy:正在 /0.0.0.0:8032 连接到 ResourceManager 申请报告: 应用程序 ID:application_1586344612496_0231 应用程序名称:batch_accu 应用类型:SPARK 用户:大数据 队列:默认 开始时间:1586348775760 完成时间:0 进度:0% 状态:已接受 最终状态:未定义 跟踪-URL : N/A RPC 端口:-1 主持人:N/A 聚合资源分配:0 MB 秒,0 vcore 秒 诊断:

工作没有进展任何人都可以帮忙....

根据我的经验,导致此问题的原因可能有很多,但您应该首先进行以​​下检查:

  • 您的防火墙可能阻止了 Hadoop 集群内节点之间的某些端口,因此计算永远不会启动。尝试暂时禁用私有接口的防火墙,然后再次尝试排除此问题(如果是这个问题,请重新激活防火墙并确定您需要打开的端口!)
  • Spark 可能配置不正确(即资源要求)