下面的 scalding 预处理和 post-process 将在哪个 hadoop 节点上运行?
On which hadoop node would the below scalding pre-process and post-process runs?
我有下面的 example
代码,用于在 sclading 作业 运行s 和一些 post 之前进行一些预处理。由于这些预处理和 post-process 正在调用一些 mysql 数据库,我想知道哪些 hadoop 节点可能会 运行 它们? (我需要打开从这些节点到数据库的端口)它可以 运行 预处理和 post 处理任何 hadoop
data-node
吗?我试着做了一些研究,但找不到任何迹象,如何通过文档/来源找到它在哪个节点上 运行? (PS 作业安排 oozie)
preProcessingBeforeJobRuns() // **in which hadoop node would this be run? could it run on any datanode?**
log.info(s"ABOUT TO RUN JOB with input $jobInput")
val scaldingTool = new Tool
scaldingTool.setJobConstructor(createJob(jobInput))
val parser: GenericOptionsParser = new GenericOptionsParser(new Configuration(), args)
scaldingTool.setConf(parser.getConfiguration)
log.info(s"CALLING SCALDING RUN with args: ${args.toList.mkString(" ")}")
val status = scaldingTool.run(args)
log.info("FINISHED RUNNING JOB!")
somePostJobProcessing() // **in which hadoop node would this be run? could it run on any datanode?**
您发布的代码将 运行 在 Hadoop 主节点上。 scaldingTool.run(args)
将触发您的作业,这将触发在任务节点上执行的作业。
我有下面的 example
代码,用于在 sclading 作业 运行s 和一些 post 之前进行一些预处理。由于这些预处理和 post-process 正在调用一些 mysql 数据库,我想知道哪些 hadoop 节点可能会 运行 它们? (我需要打开从这些节点到数据库的端口)它可以 运行 预处理和 post 处理任何 hadoop
data-node
吗?我试着做了一些研究,但找不到任何迹象,如何通过文档/来源找到它在哪个节点上 运行? (PS 作业安排 oozie)
preProcessingBeforeJobRuns() // **in which hadoop node would this be run? could it run on any datanode?**
log.info(s"ABOUT TO RUN JOB with input $jobInput")
val scaldingTool = new Tool
scaldingTool.setJobConstructor(createJob(jobInput))
val parser: GenericOptionsParser = new GenericOptionsParser(new Configuration(), args)
scaldingTool.setConf(parser.getConfiguration)
log.info(s"CALLING SCALDING RUN with args: ${args.toList.mkString(" ")}")
val status = scaldingTool.run(args)
log.info("FINISHED RUNNING JOB!")
somePostJobProcessing() // **in which hadoop node would this be run? could it run on any datanode?**
您发布的代码将 运行 在 Hadoop 主节点上。 scaldingTool.run(args)
将触发您的作业,这将触发在任务节点上执行的作业。