如何在 jpmml 级联中传递 Hadoop 作业队列名称?

How to pass the Hadoop job queue name in jpmml cascading?

我正在尝试使用本项目提供的 jpmml 级联库中的级联框架执行 pmml 模型 https://github.com/jpmml/jpmml-cascading

我已完成所有步骤,并能够使用 mvn clean install 命令生成 example-1.2-SNAPSHOT-job.jar

然而,当我使用以下命令执行同一个 jar 时:

hadoop jar example-1.2-SNAPSHOT-job.jar /tmp/cascading/model.pmml file:///tmp/cascading/input.csv file:///tmp/cascading/output

由于无权在 上提交作业,我正处于 异常 之下DEFAULT 队列作为我们 hadoop 集群中的默认队列,仅出于管理目的而被阻止,普通用户无法 运行 hadoop 作业而不提供队列名称。

Exception:
16/01/06 04:41:37 ERROR ipc.FailoverRPC: FailoverProxy: Failing this Call: submitJob for error(RemoteException): org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): **User test cannot perform operation SUBMIT_JOB on queue default.**
 Please run "hadoop queue -showacls" command to find the queues you have access to .
    at org.apache.hadoop.mapred.ACLsManager.checkAccess(ACLsManager.java:179)
    at org.apache.hadoop.mapred.ACLsManager.checkAccess(ACLsManager.java:136)
    at org.apache.hadoop.mapred.ACLsManager.checkAccess(ACLsManager.java:113)
    at org.apache.hadoop.mapred.JobTracker.submitJob(JobTracker.java:4524)
    at sun.reflect.GeneratedMethodAccessor17.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.ipc.WritableRpcEngine$Server$WritableRpcInvoker.call(WritableRpcEngine.java:481)
    at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:928)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2000)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1996)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1566)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1994)

我看不到存储库中提供 hadoop 作业队列的位置。

谁能建议我如何传递 hadoop 作业队列名称?

注:

  1. I have tried to pass the property mapred.job.queue.name passing the queue name but still job is showing same error through command line and in the code itself.

  2. I have also tried to run the job using oozie shell action node and passing the queue name there in application workflow but I believe that would be applicable for the oozie job only not the hadoop jobs which gets executed through shell action node.

您使用的设置有误。您应该使用 Hadoop 2.x.

的设置

以下配置属性(存在于 mapred-site.xml 中)控制对作业队列的提交。

Hadoop 1.x

  • mapred.acls.enabled:队列操作时是否开启ACL检查,检查用户权限。默认设置为false

  • mapred.job.queue.name:提交作业的队列。默认值为 default.

Hadoop 2.x

  • mapreduce.cluster.acls.enabled:队列操作时是否开启ACL检查,检查用户权限。默认设置为 false

  • mapreduce.job.queuename:提交作业的队列。默认值为 default.

您可以通过不同的方式设置这些值:

  • 在命令行中使用 -D 选项传递,而 运行 一个作业。例如您可以将其作为 -Dmapreduce.job.queuename=default.
  • 传递
  • Driver 中设置作业 (Hadoop 2.x):

    Configuration conf = new Configuration();
    conf.set("mapreduce.job.queuename", "default");
    Job job = Job.getInstance(conf, "JobName");
    
  • 在集群的mapred-site.xml文件中设置。