使用 spark-submit 从 scala 二进制文件启动的跟踪和 log/debug 纱线应用程序
Track and log/debug yarn apllication which have been started from a scala binary using spark-submit
我正在尝试设计一个集成测试框架。
我将 运行ning 一些罐子,它们是用 Scala 和 运行 Spark 进程用 spark-submit --master yarn
命令编写的。
有没有什么办法可以在 运行 使用这个 jar 时提交一些 id 或一些名称,这将帮助我找到哪个 yarn 进程被哪个 jar 调用,以便更容易调试?
编辑:我无法在 scala 中编辑代码,这是我唯一能做的事 运行 我环境中的 jars。
您可以使用 spark-submit
选项 --name [spark_job_name]
为您的 spark_job 命名,然后轻松识别他。
您可以通过应用名称查看Spark提交的yarn应用
一个。使用应用程序名称参数提交 Spark 应用程序。
SparkSession.builder.appName("spark-app-name")......
b。使用 appname 检查 Yarn 应用程序 ID。
yarn application -list | awk ' == "spark-app-name" {print }'
c。获得应用程序 ID 后,您可以使用 Yarn REST API:
检查 Yarn 应用程序的状态
http://<RM_HOST>:8088/ws/v1/cluster/apps/$job_id/state
我正在尝试设计一个集成测试框架。
我将 运行ning 一些罐子,它们是用 Scala 和 运行 Spark 进程用 spark-submit --master yarn
命令编写的。
有没有什么办法可以在 运行 使用这个 jar 时提交一些 id 或一些名称,这将帮助我找到哪个 yarn 进程被哪个 jar 调用,以便更容易调试?
编辑:我无法在 scala 中编辑代码,这是我唯一能做的事 运行 我环境中的 jars。
您可以使用 spark-submit
选项 --name [spark_job_name]
为您的 spark_job 命名,然后轻松识别他。
您可以通过应用名称查看Spark提交的yarn应用
一个。使用应用程序名称参数提交 Spark 应用程序。
SparkSession.builder.appName("spark-app-name")......
b。使用 appname 检查 Yarn 应用程序 ID。
yarn application -list | awk ' == "spark-app-name" {print }'
c。获得应用程序 ID 后,您可以使用 Yarn REST API:
检查 Yarn 应用程序的状态http://<RM_HOST>:8088/ws/v1/cluster/apps/$job_id/state